专利汇可以提供一种基于组合分类器的客户流失预测模型专利检索,专利查询,专利分析的服务。并且本 发明 提出构建结合回声状态网络和 支持向量机 的流失 预测模型 。针对单模型预测效果不理想,探索改进分类器构建方法,分类器的构建可以分为训练集构建策略、分类器选择策略和预测值确定策略三个方面。通过融合 马 氏距离与最大信息系数综合评定特征和类别、特征和特征之间的相关程度,共同衡量特征之间的 冗余度 以及特征与类别之间的关联度。集合回声状态网络和支持向量机的优点,线性约束解决二次优化问题,从而提高电信客户流失系统的性能,提高客户流失预测模型的预测效果。,下面是一种基于组合分类器的客户流失预测模型专利的具体信息内容。
1.一种结合回声状态网络和支持向量机的流失预测模型,其特征在于,通过某种方式使基本分类器以高效的方式协同工作,以便做到最好利用优势和绕过劣势,整合学习优势组合每种算法。一种基于机器学习的集成学习和选择性集成学习。研究包括以下步骤:
步骤一:数据的预处理,对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理。
步骤二:使用最大信息系数来度量特征和类别之间的相关性,融合马氏距离与最大信息系数综合评定特征和类别、特征和特征之间的相关程度,共同衡量特征之间的冗余度以及特征与类别之间的关联度,选出数据特征变量集。
步骤三:回声状态网络是最简单但有效的递归神经网络之一,回声状态网络的状态空间输出将作为支持向量机分类器的输入。
步骤四:得出电信客户数据集流失与否的结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤一具体为:
对样本集进行预处理。数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等。
数据清理通过填写缺失值、光滑噪声数据、识别或删除离群点并解决不一致性来清理数据。实现格式标准化,异常数据清除,错误纠正,重复数据的清除。数据集成将多个数据源中的数据结合起来并统一存储,建立数据仓库或数据集市。数据变换通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。数据归约删除原始特征集合中的无用特征、弱相关特征和冗余特征,得到数据集的归约表示的同时保持原数据的完整性。
3.根据权利要求2所述的方法,其特征在于,所述步骤二具体为:
对样本集进行特征选择。利用马氏距离和最大信息系数对数据集进行处理,得到特征和类别、特征与特征之间的融合系数,最后根据选择标准,找出需要的特征。
样本向量S为X1~Xm,均值为μ,协方差矩为ε,则样本X到μ的马氏距离为:
Xi向量到Xj的马氏距离为:
对于有限集合D,将D集合分割成x乘y的网格。定义x*y的网格为G,D|G是有限集合D中的点在网格G上的概率分布。通过不断调整网格分辨率,分别得到不同的概率分布。MaxI(D|G)表示在x*y分辨率分割方式中得到的最大互信息值。假设有限集合D的大小为n,网络规模需小于B(n),B(n)为可搜寻网格的上界,其目的是为了限制算法的搜索范围,降低算法的复杂度。则最大信息系数表示为:
由于马氏距离在判断特征之间的关系时,其值越大代表特征之间的离散度越大,而最大信息系数值越大,代表特征之间的相关性越大,因此定义融合马氏距离和最大信息系数的融合系数为P。
因此P(Xi,Xj)的值越大,说明特征之间的相关性强。特征和类别之间的融合系数为S为特征集合,clas为类别,P(chari,clas)为特征chari和类标签clas之间的融合系数。
特征和特征之间的融合系数为
xi,xj为不同特征,P(xi,xj)为特征xi和特征xj之间的融合系数。需要保证特征和类别之间的融合最大,具有最大关联,而特征之间的关联度最小,因此最小冗余最大相关特性选择标准为:
max(M-R)
对求出的所有M-R的值进行排序,找出最大值,选出最优的特征子集。
4.根据权利要求3所述的方法,其特征在于,所述步骤三中,具体为:
组合分类器的构建。回声状态网络的储备池内部连接权谱半径SR,其为连接权矩阵W的绝对值最大的特征值,记为λmax,λmax<1是保证网络稳定的必要条件。储备池规模N,其为储备池中神经元的个数,储备池的规模选择与样本个数有关,对网络性能影响很大,储备池规模越大,回声状态网络对给定动态系统的描述越准确。储备池输入单元尺度IS。其为储备池的输入信号连接到储备池内部神经元之前需要相乘的一个尺度因子,即对输入信号进行一定的缩放。一般需要处理的对象非线性越强,IS越大。储备池稀疏程度SD。其表示储备池中神经元之间的连接情况,储备池中并不是所有神经元之间都存在连接。SD表示储备池中相互连接的神经元总数占总的神经元N的百分比,其值越大,非线性逼近能力越强。回声状态网络的训练过程就是根据给定的训练样本确定系数输出连接权矩阵Wout的过程,其训练分为采样和权值计算两个阶段。
使用支持向量机训练回声状态网络,可以最小化损失函数。算法的具体步骤为先确定储备池的大小,初始化W,缩放矩阵使得谱半径λmax<1,在训练集上运行回声状态网络,对数据进行清洗,删除部分数据,完成系统状态和输出x(t)的计算,收集到矩阵X,将回声状态网络的状态空间矩阵X作为支持向量机的输入,使用交叉验证找到支持向量机的最佳参数,将训练集的目标值得到集合y。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于倾向性异质装袋算法的钢材质量预测方法 | 2020-05-08 | 500 |
一种基于医疗服务的集成信息管理方法 | 2020-05-08 | 729 |
一种声乐转换钢琴曲的钢琴学习方法 | 2020-05-08 | 807 |
构建基于PU学习的恶意流量检测模型的方法及装置 | 2020-05-12 | 149 |
一种汽车无线充电的方法及系统 | 2020-05-12 | 743 |
基于长短期记忆网络的梯级水电站发电量预测方法 | 2020-05-13 | 794 |
一种基于深度学习的多时相SAR图像变化检测方法 | 2020-05-08 | 459 |
一种声乐转换钢琴曲的钢琴学习系统 | 2020-05-08 | 467 |
软件众包的任务型对话系统及方法 | 2020-05-11 | 468 |
一种基于心率变异性的睡眠分期方法 | 2020-05-11 | 316 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。