专利汇可以提供一种基于K-Means&LightGBM模型的共享交通服务reorder预估方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于K‑Means&LightGBM模型的共享交通服务reorder预估方法,该方法从 数据库 进行选择性 抽取 与新增数据抽取分别形成历史数据与增量数据;对两个数据集进行数据探索分析与预处理,包括数据缺失值与异常值的探索分析,数据的属性规约、清洗和变换;利用已完成的数据预处理的建模数据,结合具体业务,创造新地提出了基于客户价值LRFMD模型进行客户分群,并采用LightGBM模型对分类数据进行训练预测;针对模型预测得出的结果,采用不同的营销手段,定制下一阶段的营业目标,提供定制化服务,提高用户满意度,促进企业的发展。,下面是一种基于K-Means&LightGBM模型的共享交通服务reorder预估方法专利的具体信息内容。
1.一种基于K-Means&LightGBM模型的共享交通服务reorder预估方法,包括如下步骤:
(1)从数据库中抽取大量客户的租用驾驶数据,并基于分析观测窗口将这些驾驶数据分为历史数据集和增量数据集,具体实现过程为:首先,选定过去的某一时间点load_time,以时间点load_time为结束时间,截取宽度为一年的时间段作为分析观测窗口,使分析观测窗口内有租用驾驶记录的所有客户租用驾驶数据作为历史数据集;然后,使时间点load_time至当前时间点区间内有租用驾驶记录的所有客户租用驾驶数据作为增量数据集;
(2)对历史数据集进行预处理,包括数据清洗、属性规约以及数据变换,从而得到每个客户的LRFMD向量;所述LRFMD向量由LRFMD五个指标组成:L表示客户注册时间start_time距分析观测窗口结束时间load_time的月数,R表示客户在分析观测窗口内的最后一次租用驾驶结束时间end_time距分析观测窗口结束时间load_time的月数,F表示客户在分析观测窗口内的租用驾驶次数,M表示客户在分析观测窗口内的累计行驶里程,D表示客户在分析观测窗口内每次租用驾驶所享受的平均折扣金额;
数据清洗的具体实现过程为:首先,丢弃存在缺失值的租用驾驶记录,即租用驾驶记录中某列属性存在空值,则删除该条记录;然后,丢弃行驶距离大于0且消费金额以及折扣金额均等于0的租用驾驶记录;
属性规约的具体实现过程为:从客户在分析观测窗口内的租用驾驶数据中提取出以下
8个属性:客户ID、客户的注册时间start_time、客户在分析观测窗口内的最后一次租用驾驶结束时间end_time、分析观测窗口的结束时间load_time、每次租用驾驶的行驶里程current_miles、每次租用驾驶的总消费金额cost、每次租用驾驶的实际支付金额money、每次租用驾驶的折扣金额bonus;
数据变换的具体实现过程为:首先,基于属性规约所得到的8个属性计算出每个客户的LRFMD五个指标;然后,对这五个指标进行z-score标准化处理后即得到LRFMD向量;
(3)利用客户的LRFMD向量通过基于客户价值的LRFMD模型进行客户分群,得到多个客户群,即采用改进型K-Means算法根据LRFMD向量对客户进行聚类分群,将客户分成k类,对应k个客户群,k为设定的类别数且为大于1的自然数;所述改进型K-Means算法的具体过程如下:
3.1将所有客户的LRFMD向量组成样本集,初始情况下通过计算从样本集中选取出k个LRFMD向量作为聚类中心,具体过程如下:
3.1.1随机从样本集中选取k个LRFMD向量,并重复k次,得到k×k个LRFMD向量;
3.1.2对这k×k个LRFMD向量进行聚类,聚成k类,并计算出每类的中心点;
3.1.3构建这k个中心点的中心点O,取样本集中与中心点O距离最近的LRFMD向量作为备选点,并保存该距离;
3.1.4重复执行步骤3.1.1~3.1.3,得到k个备选点及其与中心点O的距离,根据距离与概率正相关的原则随机从这k个备选点中选取出一个备选点,作为初始化的聚类中心;
3.1.5重复执行步骤3.1.1~3.1.4,从而得到k个聚类中心;
3.2逐个将样本集中的LRFMD向量按最小距离原则分配给k个聚类中心,形成k个种群;
3.3重新构建每个种群的中心点,使其作为种群新的聚类中心;若每个种群新聚类中心与旧聚类中心的距离均小于阈值,则计算结束,以当前的k个种群作为分类结果,否则转为执行步骤3.2;
通过分群得到多个客户群后,利用增量数据集通过步骤(2)和(3)同样的过程对分类结果进行验证以及修正;其中,利用增量数据集得到每个客户的LRFMD向量由以下LRFMD五个指标组成:L表示客户注册时间start_time距当前时间点的月数,R表示客户在分析观测窗口结束时间load_time至当前时间点区间内的最后一次租用驾驶结束时间end_time*距当前时间点的月数,F表示客户在分析观测窗口结束时间load_time至当前时间点区间内的租用驾驶次数,M表示客户在分析观测窗口结束时间load_time至当前时间点区间内的累计行驶里程,D表示客户在分析观测窗口结束时间load_time至当前时间点区间内每次租用驾驶所享受的平均折扣金额;
(4)从客户租用驾驶记录中选定某一行为特征作为感兴趣特征项,进而将客户租用驾驶记录中其余行为特征通过特征工程转换生成训练样本,并使记录中感兴趣特征项的具体特征值作为训练样本的真值标签;
(5)对于任一客户群,将属于该客户群客户的训练样本及其真值标签通过微软开源的LightGBM进行训练,得到能够预估该客户群客户关于感兴趣特征项的预估模型;
(6)对于任一客户,将其历史租用驾驶记录输入该客户所在客户群对应的预估模型,从而得到该客户关于感兴趣特征项的具体估计值,用以推荐及营销。
2.根据权利要求1所述的共享交通服务reorder预估方法,其特征在于:所述步骤(5)中对于任一客户群,将属于该客户群客户的所有训练样本分为训练集和测试集,其中70%的训练样本及其真值标签用于通过微软开源的LightGBM进行训练,其余30%的训练样本及其真值标签用于对预估模型进行测试以及微调。
估方法
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种驾驶行为反馈方法、装置、车辆及存储介质 | 2020-05-08 | 717 |
一种导航地图更新方法、装置、可读存储介质及机器人 | 2020-05-11 | 729 |
一种车载以太网的自动泊车系统及自动代客泊车方法 | 2020-05-08 | 519 |
一种轨道交通信号系统自动化辅助设计的实现方法及系统 | 2020-05-11 | 570 |
移动机器人打滑预警方法、存储介质以及移动机器人 | 2020-05-08 | 289 |
列车轮对监测系统及列车轮对监测方法 | 2020-05-08 | 927 |
一种视觉导航无人机的摄像机标定方法及装置 | 2020-05-11 | 638 |
一种应急电动汽车充电保障车调配方法 | 2020-05-11 | 41 |
一种无人机视觉-惯性融合室内定位方法 | 2020-05-11 | 75 |
有轨电车项目监控系统及监控方法 | 2020-05-11 | 644 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。