首页 / 专利库 / 软件 / 数据处理 / 数据处理方法、装置、介质及电子设备

数据处理方法、装置、介质及电子设备

阅读:805发布:2020-05-11

专利汇可以提供数据处理方法、装置、介质及电子设备专利检索,专利查询,专利分析的服务。并且本公开提供了一种 数据处理 方法、装置、介质及 电子 设备,涉及 大数据 处理技术领域。该方法包括:获取多组样本数据得到第一样本集,其中,每组样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签;基于第一样本集中的营销标签训练M个 机器学习 模型,得到分别用于预测关于M个营销指标的M个 预测模型 ;获取第i营销指标对应的第二样本集,根据第二样本集中的营销参数确定扰动数据集;基于扰动数据集和M个预测模型,确定满足M个营销指标的目标营销参数。本技术方案有利于提升营销参数的确定准确度,进而提升对目标用户的 定位 准确度,有利于营销活动的效果达到营销指标。,下面是数据处理方法、装置、介质及电子设备专利的具体信息内容。

1.一种数据处理方法,其特征在于,所述方法包括:
获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;
基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型
获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;
基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
2.根据权利要求1所述的数据处理方法,其特征在于,获取第i营销指标对应的第二样本集,包括:
获取关于所述第i营销指标的第一预期范围;
在所述第一样本集中筛选出所述第i营销标签处于所述第一预期范围内的样本,得到所述第二样本集。
3.根据权利要求1所述的数据处理方法,其特征在于,根据所述第二样本集中的营销参数确定扰动数据集,包括:
计算所述第二样本集中营销参数的均值;
获取关于所述第i营销指标中营销参数对应的第二预期范围,筛选出所述差值处于所述第二预期范围内的样本数据,得到筛选数据集;
根据预设步长处理所述筛选数据集,得到所述扰动数据集。
4.根据权利要求1至3中任意一项所述的数据处理方法,其特征在于,基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数,包括:
将所述扰动样本集输入用于预测关于所述第i营销指标的第i预测模型,确定所述第i预测模型的输出为第一标签集;
在所述第一标签集中确定满足第一预设要求的第一目标标签,以及获取所述第一目标标签对应的营销参数作为第一营销参数集;
将所述第一营销参数集输入第j预测模型中,确定所述第j预测模型的输出为第二标签集,j为小于或等于M的正整数,且不等于i;
在所述第二标签集中确定满足第二预设要求的第二目标标签,以及根据所述第二目标标签对应的营销参数确定所述目标营销参数。
5.根据权利要求4所述的数据处理方法,其特征在于,根据所述第二目标标签对应的营销参数确定所述目标营销参数,包括:
计算所述第二目标标签对应的营销参数的均值作为所述目标营销参数。
6.根据权利要求1至3中任意一项所述的数据处理方法,其特征在于,基于所述第一样本集中的营销标签训练M个机器学习模型,包括:
在所述第一样本集中获取第k营销标签对应的第k样本集,k为小于或等于M的正整数;
通过所述第k样本集训练极端梯度提升模型,以确定所述极端梯度提升模型的最优超参数,得到用于预测关于所述第k营销标签对应的第k预测模型。
7.根据权利要求1至3中任意一项所述的数据处理方法,其特征在于,所述营销参数包括以下信息中的一种或多种:下单行为持续天数、订单的金额限值和下单所用券的面额;
所述营销指标包括以下信息中的至少两种:利润值、下单量和成本值。
8.一种数据处理装置,其特征在于,所述装置包括:
第一样本集确定模,用于:获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;
模型训练模块,用于:基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型;
扰动数据集确定模块,用于:获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;
目标营销参数确定模块,用于:基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的数据处理方法。

说明书全文

数据处理方法、装置、介质及电子设备

技术领域

[0001] 本公开涉及大数据处理技术领域,具体而言,涉及一种数据处理方法、数据处理装置,以及实现上述数据处理方法的计算机可读介质和电子设备。

背景技术

[0002] 营销是指企业发现或发掘准消费者需求,让消费者了解该产品进而购买该产品的过程。具体实践中,通过制定多种多样的营销活动来激发消费者的购物欲望,进而提升产品的下单量。
[0003] 相关技术中,制定营销活动主要依靠运营的经验和直觉设置营销参数(如,满减金额数值等),以根据营销参数开展营销活动。
[0004] 然而,依据相关技术设置的营销活动的方案中,营销参数的准确度较差,导致不能达到营销活动的营销目标。
[0005] 需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。发明内容
[0006] 本公开实施例的目的在于提供一种数据处理方法、数据处理装置、计算机可读介质及电子设备,进而至少在一定程度上提升营销参数的确定准确度,从而提升对目标用户的定位准确度,有利于营销活动的效果达到营销指标。
[0007] 本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0008] 根据本公开实施例的第一方面,提供了一种数据处理方法,包括:
[0009] 在本公开的一种实施例中,基于前述方案,获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;
[0010] 基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型
[0011] 获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;
[0012] 基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
[0013] 在本公开的一些实施例中,基于前述方案,获取第i营销指标对应的第二样本集,包括:
[0014] 获取关于所述第i营销指标的第一预期范围;
[0015] 在所述第一样本集中筛选出所述第i营销标签处于所述第一预期范围内的样本,得到所述第二样本集。
[0016] 在本公开的一些实施例中,基于前述方案,根据所述第二样本集中的营销参数确定扰动数据集,包括:
[0017] 计算所述第二样本集中营销参数的均值,以及获取关于所述第i营销指标中营销参数对应的第二预期范围;
[0018] 计算所述第二样本集中营销参数与所述均值的差值,以及筛选出所述差值处于所述第二预期范围内的样本数据,得到筛选数据集;
[0019] 根据预设步长处理所述筛选数据集,得到所述扰动数据集。
[0020] 在本公开的一些实施例中,基于前述方案,基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数,包括:
[0021] 将所述扰动样本集输入用于预测关于所述第i营销指标的第i预测模型,确定所述第i预测模型的输出为第一标签集;
[0022] 在所述第一标签集中确定满足第一预设要求的第一目标标签,以及获取所述第一目标标签对应的营销参数作为第一营销参数集;
[0023] 将所述第一营销参数集输入第j预测模型中,确定所述第j预测模型的输出为第二标签集,j为小于或等于M的正整数,且不等于i;
[0024] 在所述第二标签集中确定满足第二预设要求的第二目标标签,以及根据所述第二目标标签对应的营销参数确定所述目标营销参数。
[0025] 在本公开的一些实施例中,基于前述方案,根据所述第二目标标签对应的营销参数确定所述目标营销参数,包括:
[0026] 计算所述第二目标标签对应的营销参数的均值作为所述目标营销参数。
[0027] 在本公开的一些实施例中,基于前述方案,基于所述第一样本集中的营销标签训练M个机器学习模型,包括:
[0028] 在所述第一样本集中获取第k营销标签对应的第k样本集,k为小于或等于M的正整数;
[0029] 通过所述第k样本集训练极端梯度提升模型,以确定所述极端梯度提升模型的最优超参数,得到用于预测关于所述第k营销标签对应的第k预测模型。
[0030] 在本公开的一些实施例中,基于前述方案,所述营销参数包括以下信息中的一种或多种:下单行为持续天数、订单的金额限值和下单所用券的面额;
[0031] 所述营销指标包括以下信息中的至少两种:利润值、下单量和成本值。
[0032] 根据本公开实施例的第二方面,提供了一种数据处理装置,包括:
[0033] 第一样本集确定模,用于:获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;
[0034] 模型训练模块,用于:基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型;
[0035] 扰动数据集确定模块,用于:获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;
[0036] 目标营销参数确定模块,用于:基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
[0037] 根据本公开实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例第一方面中所述的数据处理方法。
[0038] 根据本公开实施例的第四方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例第一方面所述的数据处理方法。
[0039] 本公开实施例提供的技术方案可以包括以下有益效果:
[0040] 在本公开提供的实施例中,首先,获取多组样本数据组成的样本集;然后,基于样本集中不同的营销标签分别训练M个机器学习模型,得到分别用于预测各个营销指标的M个预测模型。进一步地,还获取任意一(如,第i,其中i为小于或等于M的正整数)营销指标对应的第二样本集,根据第二样本集中的营销参数对第二样本集进行筛选处理得到扰动数据集。最终,基于该扰动数据集和上述M个预测模型,确定满足上述M个营销指标的目标营销参数。
[0041] 一方面,本技术方案基于大数据确定目标营销参数,并在确定目标营销参数的过程中,采用某一营销指标的样本数据构建出有效的扰动数据集,从而使得营销参数的确定存在理论基础,有利于提升营销参数的确定准确度,进而提升对目标用户的定位准确度,有利于营销活动的效果达到营销指标。
[0042] 另一方面,本技术方案在针对多营销指标的营销活动的制定过程中,采用某一营销指标的样本数据构建出有效的扰动数据集,再结合迁移学习的思想将扰动数据集运用至预测其他营销指标的预测模型中,从而基于多个营销指标确定目标营销参数。多个营销指标有利于提升营销活动设置的灵活度和精准度,从而,有利于更加准确地定位到目标用户,进而达到提高目标用户的下单频率,提高毛利并减少运营成本的目的。
[0043] 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明
[0044] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0045] 图1示出本公开示例性实施例中用于实现数据处理方法的系统架构示意图;
[0046] 图2示出了根据本公开的一实施例的数据处理方法的流程示意图;
[0047] 图3示出了根据本公开的一实施例的模型训练方法的流程示意图;
[0048] 图4示出了根据本公开的一实施例的第二样本集的确定方法的流程示意图;
[0049] 图5示出了根据本公开的一实施例的扰动数据集的确定方法的流程示意图;
[0050] 图6示出了根据本公开的一实施例的目标营销参数的确定方法的流程示意图;
[0051] 图7示出了根据本公开的实施例的数据处理装置的结构示意图;
[0052] 图8示出本公开示例性实施例中计算机存储介质的结构示意图;以及,
[0053] 图9示出本公开示例性实施例中电子设备的结构示意图。

具体实施方式

[0054] 现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
[0055] 此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
[0056] 附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0057] 附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0058] 本示例实施方式中首先提供了一种用于实现数据处理方法的系统架构,可以应用于各种数据处理场景。参考图1所示,该系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0059] 用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送请求指令等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如图片处理应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0060] 终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0061] 服务器105可以是提供各种服务的服务器,例如获取多组样本数据得到第一样本集,以及基于所述第一样本集中的营销标签训练M个机器学习模型,M为大于1的整数(仅为示例)。服务器105可以获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数(仅为示例)。最终,服务器105基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
[0062] 在示例性的实施例中,本技术方案所涉及的营销活动场景可以是:连单营销活动和累单营销活动。其中:连单营销活动是指在一定时间周期里,连续每天下单行为(金额/单数)满足一定条件,即可享优惠(券/实物);累单营销活动是指在一定时间周期里,累计下单行为(金额/单数)满足一定条件,即可享优惠(券/实物)。
[0063] 具体的,在订单送达时判断用户此次购买行为是否符合连单/累单策略,如果符合策略并且在售后有效期产生的订单的售后行为不影响连单/累单判定的情况下,给用户指定的优惠。从而达到刺激用户本次下单或下次复购,满足刺激提升或稳定用户长周期内的交易频次诉求。
[0064] 对于上述营销活动,示例性的待设置营销参数包括:下单行为持续天数、所涉及商品、返劵的相关信息(如,券的使用限制及券的面额等)、所涉及的用户群信息等。营销参数的设置过程中需考虑目标用户特点、目标商品范围、优惠度、连单/累单条件阈值等因素。若根据相关技术中来依靠营销经验设置上述营销参数,将存在潜在目标用户没有享受活动或者对无效用户的营销推广,目标商品范围的设置不合理会直接影响到毛利,优惠的力度和活动效果也缺乏有效的数据评估等种种弊端。
[0065] 针对相关技术中所存在上述问题,本技术方案提供了一种数据处理方法及装置,计算机存储介质和电子设备。以下先对数据处理方法进行说明:
[0066] 图2示出了根据本公开的一实施例的数据处理方法的流程示意图。本实施例提供的数据处理方法,至少在一定程度上克服现有技术中存在的上述问题。
[0067] 其中,本实施例提供的数据处理方法的执行主体可以是具有计算处理功能的设备,比如服务器等。参考图2,本实施例提供的数据处理方法包括:
[0068] 步骤S210,获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;
[0069] 步骤S220,基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型;
[0070] 步骤S230,获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;以及,
[0071] 步骤S240基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
[0072] 在图2所示实施例提供的技术方案中,一方面,本技术方案基于大数据确定目标营销参数,并在确定目标营销参数的过程中,采用某一营销指标的样本数据构建出有效的扰动数据集,从而使得营销参数的确定存在理论基础,有利于提升营销参数的确定准确度,进而提升对目标用户的定位准确度,有利于营销活动的效果达到营销指标。
[0073] 另一方面,本技术方案在针对多营销指标的营销活动的制定过程中,采用某一营销指标的样本数据构建出有效的扰动数据集,再结合迁移学习的思想将扰动数据集运用至预测其他营销指标的预测模型中,从而基于多个营销指标确定目标营销参数。多个营销指标有利于提升营销活动设置的灵活度和精准度,从而,有利于更加准确地定位到目标用户,进而达到提高目标用户的下单频率,提高毛利并减少运营成本的目的。
[0074] 以下对图2中所示技术方案的各个步骤的实现细节进行详细阐述:
[0075] 在示例性的实施例中,在步骤S210中获取多组样本数据得到样本集(记作“第一样本集”)。其中,该第一样本集中每组样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数。可见,本技术方案适用于多营销指标的营销活动的制定,多个营销指标有利于提升营销活动的灵活性,同时有利于更加准确地定位到目标用户。
[0076] 在示例性的实施例中,在确定上述第一样本集时,可以先确定营销指标,如此次营销活动的利润预期值、此次营销活动的预期下单量或此次营销活动的预期成本值等等。进一步地,将对上述营销指标的影响因素作为上述营销参数。
[0077] 本示例性的实施例中所涉及的营销活动场景为连单营销活动和累单营销活动。营销活动的营销指标包括以下信息中的至少两种:利润值、下单量和成本值;相关营销参数包括以下信息中的一种或多种:下单行为持续天数、订单的金额限值和下单所用券的面额。
[0078] 在示例性的实施例中,对于每组样本数据,以X代表上述营销参数特征,则上述每组样本中营销参数特征为一个三维数组,可以表示为:X=(x1,x2,x3);其中,x1相应特征为:下单行为持续n天、x2相应特征为:订单的金额限值,以及x3相应特征为:下单所用券的面额。
另外,每组样本数据,以Y代表上述营销指标,即与该组样本数据中X相对应的标签(label)。
其中,Y所代表的营销指标(如,利润值、下单量和成本值)的影响因素。
[0079] 在示例性的实施例中,继续参考图2,在确定上述第一样本集后,在步骤S220中,基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型。
[0080] 在示例性的实施例中,图3示出了根据本公开的一实施例的模型训练方法的流程示意图,具体可以作为步骤S220的一种具体实施方式。参考图3,该图所示技术方案包括:
[0081] 步骤S310,在所述第一样本集中获取第k营销标签对应的第k样本集,k为小于或等于M的正整数;以及,步骤S320,通过所述第k样本集训练极端梯度提升模型,以确定所述极端梯度提升模型的最优超参数,得到用于预测关于所述第k营销标签对应的第k预测模型。
[0082] 示例性的,通过上述第一样本集中营销标签为“利润值”为标签的样本,训练一机器学习模型,以得到用于预测关于“利润”的预测模型;示例性的,记作model1:具体为利润关于连续n天、每单金额限制、劵的面额的预测模型。
[0083] 通过上述第一样本集中营销标签为“下单量”为标签的样本,训练另一机器学习模型,以得到用于预测关于“下单量”的预测模型;示例性的,记作model2:具体为单量关于连续n天、每单金额限制、劵的面额的预测模型。还通过上述第一样本集中营销标签为“成本值”为标签的样本,训练再一机器学习模型,以得到用于预测关于“成本值”的预测模型;示例性的,记作model3:具体为运营成本关于连续n天、每单金额限制、劵的面额的预测模型。
[0084] 示例性的,上述机器学习模型可以是极端梯度提升(eXtreme  Gradient Boosting,简称:XGBoost)模型、支持向量机模型、决策树模型等。示例性的,在利用上述样本集训练xgboost模型时,可以采用sklearn库(python的一个机器学习库)中的
GridSearchCV(网格搜索参)方法或RandomizedSearchCV(随机搜索)等调参方法搜索xgboost,模型的最优超参数,比如迭代步数n_estimators、最大树深度max_depth、子采样比例subsample等。
[0085] 在图3所示实施例中获得分别用于预测关于所述M个营销指标的M个预测模型,以在步骤S240的具体实施方式中确定目标营销参数。
[0086] 在示例性的实施例中,为了提升营销活动的灵活性,同时为了更加准确地定位到目标用户,通过本技术方案确定的目标营销参数同时满足多个营销指标。为了达到目标营销参数同时满足多个营销指标的技术效果,本技术方案首先采用其中一种营销指标对应的样本集(记作:第二样本集)确定扰动数据集,然后再在扰动数据集中确定满足其他营销指标的样本,以最终确定上述目标营销参数。
[0087] 继续参考图2,在步骤S230的第一部分中,获取第i营销指标对应的第二样本集,i为小于或等于M的正整数。其中,本实施例中,假如营销指标包括利润值、下单量和成本值,则M取值为3,i取值为1,2,3。
[0088] 在示例性的实施例中,通过对第二样本集进行筛选得到上述第二样本集,以减少数据计算量提升计算效率。示例性的,图4示出了根据本公开的一实施例的第二样本集的确定方法的流程示意图。参考图4,该图所示技术方案包括:
[0089] 步骤S410,获取关于所述第i营销指标的第一预期范围;以及,步骤S420,在所述第一样本集中筛选出所述第i营销标签处于所述第一预期范围内的样本,得到所述第二样本集。
[0090] 在示例性的实施例中,在i取值为1时,即对营销标签为利润值的样本集(第二样本集)为例进行说明。其中,通过Y11、Y12、…Y1u、…Y1X(单位为元)表示利润值标签,X表示第二样本集中的样本数量/标签数量,u的取值范围为[1,X]。
[0091] 预先设定某次营销活动的利润预期最高值为Y1’元,实际利润值不少于最高值的10%(即上述第一预期范围)。则可以通过公式一对第二样本集进行筛选:
[0092] ∣Y1u-Y1’∣<10%*Y1’           公式一
[0093] 从而,通过上述公式一获取到距离上述利润最高值接近的利润标签集yy,然后根据标签数据集yy找到与之相对应的三维数组xx。例如:运营成本要求100000,第一预期范围为上下浮动10000,则将样本数据中筛选运营成本再范围[90000,110000]的样本数据。
[0094] 在示例性的实施例中,继续参考图2,在步骤S230的第二部分中,根据所述第二样本集中的营销参数确定扰动数据集。即在确定目标营销参数的过程中,采用某一营销指标的样本数据构建出有效的扰动数据集,从而使得营销参数的确定存在理论基础。
[0095] 具体的,图5示出了根据本公开的一实施例的扰动数据集的确定方法的流程示意图。参考图5,该图所示技术方案包括步骤S510-步骤S530。
[0096] 在步骤S510中,计算所述第二样本集中营销参数的均值,计算所述第二样本集中营销参数与所述均值的差值。
[0097] 在示例性的实施例中,仍以在i取值为1时,即对营销标签为利润值的样本集(第二样本集)为例进行说明。其中,本步骤中的第二样本集可以是通过图4所示实施例进行筛选过的数据集。同上述实施例,营销参数可以表示为xx,对应的营销标签可以表示为yy。在上述营销参数包含:下单行为持续天数、订单的金额限值和下单所用券的面额的情况下,由多个三维数组组成的营销参数xx,具体记作[xx11,xx12,xx13]、[xx21,xx22,xx23]、…[xxv1,xxv2,xxv3],v代表第二样本集中三维数组的数目。
[0098] 示例性的,分别计算三维数组中每一维营销参数的均值,例如:xxAve1表示第一维营销参数(xx11、xx21、……xxv1)的均值,xxAve2表示第二维营销参数(xx12、xx22、……xxv2)的均值,以及xxAve3表示第三维营销参数(xx13、xx23、……xxv3)的均值。以第二维营销参数(每单订单的金额限值)为例,其均值xxAve2为200元。
[0099] 在步骤S520中,获取关于所述第i营销指标中营销参数对应的第二预期范围,筛选出所述差值处于所述第二预期范围内的样本数据,得到筛选数据集。
[0100] 仍以第二维营销参数(每单订单的金额限值)为例,假如上述第二维营销参数(每单订单的金额限值)对应的第二预期范围为:在所述均值的基础上,上下浮动50元,则可以得到每单金额限制的扰动数据范围为[150,250]。同理,获取第一维营销参数(下单行为持续天数)的扰动数据范围,以及获取第三维营销参数(下单所用券的面额)的扰动数据范围。进一步地,在上述第二样本集中筛选出满足上述每一维营销参数的扰动数据范围内的数据,得到筛选数据集。
[0101] 在步骤S530中,根据预设步长处理所述筛选数据集,得到所述扰动数据集;
[0102] 仍以第二维营销参数(每单订单的金额限值)为例,假如对上述第二维营销参数的扰动范围设置的迭代步长step为1。则基于上述实施例,对于将样本数据中筛选运营成本在范围[90000,110000]的样本数据,可以构建出每单金额限制(即上述第二维营销参数)的扰动数据集为(150,151,…,250)。
[0103] 对于第一维营销参数(下单行为持续天数)的扰动数据集以及对于第三维营销参数(下单所用券的面额)的扰动数据集的确定方式与上述第二维营销参数扰动数据集的确定方式相同,在此不再赘述。
[0104] 其中,需要说明的是,上述步长的数值根据实际情况的需求确定。步长设置值越小,则有利于更加精准地确定上述目标营销参数,同时数据计算量响应增加;反之,步长设置值越大,则不利于更加精准地确定上述目标营销参数,同时数据计算量响应减少。
[0105] 在示例性的实施例中,继续参考图2,在步骤S240中,基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。即结合迁移学习的思想将扰动数据集运用至预测其他营销指标的预测模型中,通过其他预测模型来确定更优的扰动数据。
[0106] 其中,图6示出了根据本公开的一实施例的目标营销参数的确定方法的流程示意图,可以作为步骤S240的一种具体实施方式。参考图6,该图所示技术方案包括步骤S610-步骤S640。
[0107] 在步骤S610中,将所述扰动样本集输入用于预测关于所述第i营销指标的第i预测模型,确定所述第i预测模型的输出为第一标签集;以及,在步骤S620中,在所述第一标签集中确定满足第一预设要求的第一目标标签,以及获取所述第一目标标签对应的营销参数作为第一营销参数集。
[0108] 在示例性的实施例中,仍以在i取值为1时,即对营销标签为利润值为例进行说明。对应的预测模型model1,即利润关于连续n天、每单金额限制、劵的面额的预测模型。将图5所示实施例确定的扰动数据集输入该model1中,通过model1的计算处理得到输出,即第一标签集y_hat。进一步地,在第一标签集y_hat选取N1个与Y1’(即上述利润预期最高值)最接近目标标签(记作,第一目标标签)。从而,获取该第一目标标签对应的营销参数,即第一目标标签对应的多个三维数组,便得到上述第一营销参数集(记作“xmf1”)。其中,第一营销参数集中任意一个三维数组表示为[xmf1_1w,xmf1_2w,xmf1_3w],w取值范围为[1,N1]。
[0109] 通过步骤S610和步骤S620实现对上述扰动数据集的过滤,以有效减少扰动数据量,使得过滤后的数据更加接近上述目标营销参数。进一步地,本技术方案在针对多营销指标的营销活动的制定过程中,采用某一营销指标的样本数据构建出有效的扰动数据集,再结合迁移学习的思想将扰动数据集运用至预测其他营销指标的预测模型中,从而确定出满足各个营销指标的目标营销参数,从而实现更精准的营销活动设置,达到提高目标用户下单频率、目标品的钱包份额,提高毛利并减少运营成本的目的。具体的:
[0110] 在步骤S630中,将所述第一营销参数集输入第j预测模型中,确定所述第j预测模型的输出为第二标签集,j为小于或等于M的正整数,且不等于i;以及,在步骤S640中,在所述第二标签集中确定满足第二预设要求的第二目标标签,以及根据所述第二目标标签对应的营销参数确定所述目标营销参数。
[0111] 在示例性的实施例中,上述第j预测模型可以根据实际需求确定,例如,上述第j预测模型可以是运营成本关于连续n天、每单金额限制、劵的面额的预测模型的model3,可以是单量关于连续n天、每单金额限制、劵的面额的预测模型model2,还可以是上述model2和model3。
[0112] 在示例性的实施例中,将上述第一营销参数集输入至model2、model3中,分别得到关于下单量预测值和运营成本预测值,即上述第二标签集。以“第二标签集”为model2输出的下单量预测值为例,在所述第二标签集中选取N2个最接近下单预期值的标签作为上述第二目标标签。进而从第一营销参数集xmf1找到与这N2个第二目标标签相对应的三维数组(记作“xmf2”)。
[0113] 其中,第二营销参数集中任意一个三维数组表示为[xmf2_1z,xmf2_2z,xmf2_3z],z取值范围为[1,N2]。
[0114] 示例性的,计算三维数组xmf2中每一维营销数据的均值xmf2Ave=[xmf2_1Ave,xmf2_2Ave,xmf2_3Ave]。示例性的,根据以下公式计算第一维营销数据的均值xmf2_1Ave,第一维目标营销参数。
[0115] xmf2_1Ave=(α1*xmf2_11+α2*xmf2_12+……+αN2*xmf2_1N2)/(N2)
[0116] 其中,α1、α2、……αN2,分别表示xmf2_11、xmf2_12……xmf2_1N2的加权值。另外,其他两维目标营销参数的计算方式与上述公式类似,在此不再赘述。
[0117] 本技术方案提供的实施例中,首先对多个营销指标对多维的营销参数特征数据进行多模型的建模训练,然后使用某个营销标签值的预期范围过滤特征样本数据,构建出有效的扰动数据集,再结合迁移学习的思想在其它模型上算出最优的推荐参数并进行聚合推荐,实现更精准的连单、累单营销活动设置,达到提高目标用户下单频率、目标品的钱包份额,提高毛利并减少运营成本的目的。从而,本技术方案能够精准的连单/累单活动目标用户和商品设置,提高用户下单频率和目标品钱包份额;同时,合理连单/累单优惠力度设置,有利于提高商品毛利,减少运营成本。
[0118] 本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由处理器(包含CPU和GPU)执行的计算机程序。在该计算机程序被CPU执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
[0119] 此外,需要注意的是,上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0120] 以下介绍本公开的装置实施例,可以用于执行本公开上述的数据处理方法。
[0121] 图7示出了根据本公开的实施例的数据处理装置的结构示意图,参考图7,本实施例提供的数据处理装置700,包括:第一样本集确定模块701、模型训练模块702、扰动数据集确定模块703,以及目标营销参数确定模块704。其中:
[0122] 上述第一样本集确定模块701,用于:获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;
[0123] 上述模型训练模块702,用于:基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型;
[0124] 上述扰动数据集确定模块703,用于:获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;
[0125] 上述目标营销参数确定模块704,用于:基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
[0126] 在本公开的一些实施例中,基于前述方案,上述扰动数据集确定模块703包括:样本筛选单元。其中:
[0127] 上述样本筛选单元,用于:在上述扰动数据集确定模块703获取第i营销指标对应的第二样本集之后,获取关于所述第i营销指标的第一预期范围;以及,在所述第一样本集中筛选出所述第i营销标签处于所述第一预期范围内的样本,得到所述第二样本集。
[0128] 在本公开的一些实施例中,基于前述方案,上述扰动数据集确定模块703还包括:扰动数据集确定单元。其中:
[0129] 上述扰动数据集确定单元,用于:计算所述第二样本集中营销参数的均值;获取关于所述第i营销指标中营销参数对应的第二预期范围,筛选出所述差值处于所述第二预期范围内的样本数据,得到筛选数据集;根据预设步长处理所述筛选数据集,得到所述扰动数据集。
[0130] 在本公开的一些实施例中,基于前述方案,上述目标营销参数确定模块704,包括:第一标签集确定单元、第一目标标签确定单元、第二标签集确定单元,以及第二目标标签确定单元。其中:
[0131] 上述第一标签集确定单元,用于:将所述扰动样本集输入用于预测关于所述第i营销指标的第i预测模型,确定所述第i预测模型的输出为第一标签集;
[0132] 上述第一目标标签确定单元,用于:在所述第一标签集中确定满足第一预设要求的第一目标标签,以及获取所述第一目标标签对应的营销参数作为第一营销参数集;
[0133] 上述第二标签集确定单元,用于:将所述第一营销参数集输入第j预测模型中,确定所述第j预测模型的输出为第二标签集,j为小于或等于M的正整数,且不等于i;以及,[0134] 上述第二目标标签确定单元,用于:在所述第二标签集中确定满足第二预设要求的第二目标标签,以及根据所述第二目标标签对应的营销参数确定所述目标营销参数。
[0135] 在本公开的一些实施例中,基于前述方案,上述第二目标标签确定单元,具体用于:计算所述第二目标标签对应的营销参数的均值作为所述目标营销参数。
[0136] 在本公开的一些实施例中,基于前述方案,上述模型训练模块702,具体用于:
[0137] 在所述第一样本集中获取第k营销标签对应的第k样本集,k为小于或等于M的正整数;以及,通过所述第k样本集训练极端梯度提升模型,以确定所述极端梯度提升模型的最优超参数,得到用于预测关于所述第k营销标签对应的第k预测模型。
[0138] 在本公开的一些实施例中,基于前述方案,所述营销参数包括以下信息中的一种或多种:下单行为持续天数、订单的金额限值和下单所用券的面额;所述营销指标包括以下信息中的至少两种:利润值、下单量和成本值。
[0139] 由于本公开的示例实施例的数据处理装置的各个功能模块与上述数据处理方法的示例实施例的步骤对应,因此对于本公开装置实施例中未披露的细节,请参照本公开上述的数据处理方法的实施例。
[0140] 应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0141] 此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0142] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
[0143] 在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当上述程序产品在终端设备上运行时,上述程序代码用于使上述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。
[0144] 参考图8所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0145] 上述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0146] 计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0147] 可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
[0148] 可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0149] 此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
[0150] 所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0151] 下面参照图9来描述根据本公开的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0152] 如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930。
[0153] 其中,上述存储单元存储有程序代码,上述程序代码可以被上述处理单元910执行,使得上述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如,上述处理单元910可以执行如图2中所示的:步骤S210,获取多组样本数据得到第一样本集,其中,每组所述样本数据包括:营销参数和M个营销指标中的至少一个营销指标确定的营销标签,M为大于1的整数;步骤S220,基于所述第一样本集中的营销标签训练M个机器学习模型,得到分别用于预测关于所述M个营销指标的M个预测模型;步骤S230,获取第i营销指标对应的第二样本集,根据所述第二样本集中的营销参数确定扰动数据集,i为小于或等于M的正整数;以及,步骤S240,基于所述扰动数据集和所述M个预测模型,确定满足所述M个营销指标的目标营销参数。
[0154] 示例性的,上述处理单元910还可以执行如图3至图6中任意一图所示的数据处理方法。
[0155] 存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(ROM)9203。
[0156] 存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0157] 总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0158] 电子设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备900交互的设备通信,和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口950进行。并且,电子设备900还可以通过网络适配器970与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器960通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0159] 通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
[0160] 此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0161] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈