一种基于数据挖掘的立磨运行调控系统及方法

申请号 CN201710262112.8 申请日 2017-04-20 公开(公告)号 CN106990763A 公开(公告)日 2017-07-28
申请人 浙江大学; 发明人 纪杨建; 代风; 万安平; 张真;
摘要 本 发明 公开了一种基于 数据挖掘 的立磨运行调控系统及方法,利用一种综合的特征筛选方法对工况数据进行挖掘分析,得到立磨 健康状态 评估指标;对工况状态进行聚类挖掘分析,得到的各个工况簇的特点,获得历史工况中的各个状态分布情况;定义历史工况中的运行状态类别,得到稳定模式工况库;利用ARIMA 算法 对立磨健康状态特征获取模 块 中确定的特征值训练模型,对参数的变化趋势进行预测,用预测值辅助状态识别;结合ARIMA模型给出的预测值,对立磨的运行状态进行判断,当判定为异常时,从稳定工况模式库中读取工况记录,得到推荐的调控目标值,对该时刻的可控参数进行调控。本发明可以准确地给出立磨的定性和定量调控建议,实现磨机长期稳定运行。
权利要求

1.一种基于数据挖掘的立磨运行调控系统,其特征在于,该系统包括:数据预处理模、立磨健康状态评估指标挖掘模块、立磨健康状态聚类分析模块、立磨稳定工况模式库建立模块、立磨状态评估指标特征获取模块、立磨实时特征参数预测模块、立磨运行智能调控模块;
数据预处理模块,对立磨采集的数据进行异常值处理、空值处理、离散化处理和归一化处理;
立磨健康状态评估指标挖掘模块,利用一种综合的特征筛选方法对工况数据进行挖掘分析,得到影响立磨稳定的关键参数,作为立磨健康状态评估的指标;
立磨健康状态聚类分析模块,基于确定的立磨健康状态评估的指标,对工况状态进行聚类挖掘分析,得到的各个工况簇的特点,获得历史工况中的各个状态分布情况;
立磨稳定工况库建立模块,根据聚类分析的挖掘结果,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,得到稳定模式工况库;
立磨状态评估指标特征获取模块,分析立磨运行状态下的采集的实时数据的特点,确定进行实时状态判断的特征值;
立磨实时特征参数预测模块,利用ARIMA算法对立磨健康状态特征获取模块中确定的特征值训练模型,对参数的变化趋势进行预测,用预测值辅助状态识别;
立磨运行智能调控模块根据该时刻的状态指标的数值,并结合ARIMA模型给出的预测值,对立磨的运行状态进行判断,当判定该时刻的运行状态为异常时,从稳定工况模式库中读取工况记录,得到推荐的调控目标值,然后根据推荐的目标值对该时刻的可控参数进行调控。
2.如权利要求1所述的系统,其特征在于,所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现。数据异常值处理、空值处理,由特征简约和数据变换实现。
3.如权利要求1所述的系统,其特征在于,所述的立磨健康状态评估指标挖掘模块中,一种综合的特征筛选方法由随机lasso、岭回归、随机森林稳定性选择和递归特征消除这五种方法综合组成,对工况数据进行挖掘分析,得到影响立磨稳定的关键参数,确定振动、料层厚度、磨机压差、磨机出口温度4个参数共同作为立磨健康状态评估的指标。
4.如权利要求1所述的系统,其特征在于,所述的综合的特征筛选方法通过求解输入变量和输出变量之间的关系,对每种算法的得分结果均利用最大最小值的规范化方法进行处理,把得分限制在了[0,1]之间,然后求每个参数特征的平均得分,把平均值作为特征重要性排序的依据,按照处理后的得分结果对特征的重要度进行评估,进行特征值选择。
5.如权利要求1所述的系统,其特征在于,所述的立磨健康状态聚类分析模块,基于确定的立磨健康状态评估的指标,对工况状态进行k-means聚类挖掘分析,得到的各个工况簇的特点,获得历史工况中的各个状态分布情况,选取k=3,得到的类别0定义为非稳定状态,类别1和2中的记录定义为稳定状态。
6.如权利要求1所述的系统,其特征在于,所述的立磨稳定工况库建立模块,根据聚类分析的挖掘结果,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,把稳定工况类别标签设置为0,非稳定工况标签设置为1,并从中提取稳定工况,建立稳定模式工况库。
7.如权利要求1所述的系统,其特征在于,所述的立磨状态评估指标特征获取模块,以振动、料层厚度、磨机压差、磨机出口温度这4个状态评估指标的实时数据为基础,计算每个参数在取数窗口时间内的均值、方差和异常值出现次数,把得到的结果作为稳定工况判断的特征变量。
8.如权利要求1所述的系统,其特征在于,所述的立磨实时特征参数预测模块,采用下式的ARIMA算法对立磨健康状态特征获取模块中确定的特征值进行模型训练:
xt=φ0+φ1xt-1+φ2xt-2+...+φpxt-p+εt-θ1εt-1-θ2εt-2-...-θqεt-q其中,xt-p为前p期的x取值,εt-q为前q期的干扰取值,φ0~φp为不同时间x值的系数,θ1~θq为不同时间ε值的系数。
9.一种基于数据挖掘的立磨运行调控方法,其特征在于,包括步骤:
1)利用综合的特征筛选方法对工况数据进行分析,确定影响稳定的关键参数,作为稳定状态的判断指标。分析历史数据中关键参数的取值范围,根据其分布区间,确定触发稳定调控的临界值;
2)以步骤1)中确定的稳定判断指标为特征,对工况状态进行聚类分析,使用基于K-均值的聚类算法对数据进行挖掘,分析聚类挖掘得到的各个工况簇的特点,获得历史工况中的状态分布情况;
3)根据聚类分析的挖掘结果,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,得到稳定模式工况库;
4)对立磨运行状态下的采集的实时数据的特点进行分析,确定进行实时状态判断的特征值;
5)利用ARIMA算法对步骤4)中确定的特征值进行模型训练,对参数的变化趋势进行预测,用预测值辅助状态判断;
6)根据该时刻的状态指标的数值,并结合ARIMA模型给出的预测值,对立磨的运行状态进行判断,当判定该时刻的运行状态为异常时,从稳定工况模式库中读取工况记录,得到推荐的调控目标值,然后根据推荐的目标值对该时刻的可控参数进行调控。
10.根据权利要求1所述的一种基于数据挖掘的立磨运行调控方法,其特征在于,所述综合的特征筛选方法,包括随机lasso、岭回归、随机森林、稳定性选择和递归特征消除这五种方法。通过求解输入变量和输出变量之间的关系,分别使用五种方法对每个特征的重要性予以打分,对五种得分情况进行处理,按照处理后的得分结果对特征的重要度进行评估,确定待选特征集中的关键特征。

说明书全文

一种基于数据挖掘的立磨运行调控系统及方法

技术领域

[0001] 本发明涉及泥流程工业领域的矿渣粉磨领域,特别涉及一种基于数据挖掘的立磨运行调控系统和方法。

背景技术

[0002] 立磨是一种用于将大颗粒的矿渣等物料研磨至细微颗粒的设备,主要对建材、化工、等行业产生的废渣进行粉磨,实现废渣的再利用,经研磨得到的微粉通常作为水泥生产的原料。但是矿渣粉磨系统工艺复杂,工作环境恶劣,长期高负荷运行,同时立磨生料粉磨过程具有强耦合、非线性、大滞后等特点,且存在物理、化学变化,建立准确的立磨生料粉磨过程机理模型很难。因此,何准确地建立立磨生料粉磨过程的模型并对立磨生料粉磨过程关键参数进行优化控制,是亟待要解决的问题。
[0003] 目前,有很多学者对立磨生料粉磨过程建模进行了深入研究。秦伟等人将支持向量机和多元回归方程应用于立磨粉磨过程的模型的建立,通过模糊聚类分析建立了立磨粉磨过程的专家数据库,有效的指导了粉磨过程。颜文俊等人通过应用最小二乘法建立了立磨回路模型,并通过此模型对立磨回路进行优化控制,显示了良好的控制精度。刘志鹏等人通过将最小二乘法与支持向量机相结合的方法,对粉磨系统建立了预测模型,比较准确的预测了立磨运行过程中分离器电流的变化,得到了较高的预测精度。也有学者采用人工神经网络方法在立磨生料粉磨过程建模。李瑞莲等人应用BP神经网络对生料磨机建立了神经网络模型,基于神经网络模型,得出了生料最优配料比。高鹏等人应用对立磨系统进行了模型辨识,建立了模糊神经网络模型,分析了各因素对立磨振动的影响,该方法避免了陷入局部极小的可能,网络模型具有良好的泛化能,很好地解决了非线性立磨系统建模问题。
[0004] 在上述立磨生料粉磨过程的各种模型中,多数研究人员只探究了立磨运行过程中指标之间一对一的相互关系以及它们对于立磨运行的影响,但是立磨是一个多变量相互親合的系统,变量之间相互影响,其中一个指标的变化会影响其他指标,进而会对立磨的整体运行状态产生很大影响。因此,建立一个综合指标的预测模型具有重要意义。

发明内容

[0005] 随着微粉行业的自动化和信息化程度的提高,DCS控制系统在工厂中得到了普遍应用,数据库中积累了大量生产数据。为了解决以上技术问题,本发明提供一种基于数据挖掘的立磨运行调控系统与方法。具体技术方案如下:
[0006] 一种基于数据挖掘的立磨运行调控系统,包括:数据预处理模、立磨健康状态评估指标挖掘模块、立磨健康状态聚类分析模块、立磨状态评估指标特征获取模块、立磨实时特征参数预测模块,其中:
[0007] 数据预处理模块,对立磨采集的数据进行异常值处理、空值处理、离散化处理和归一化处理,为数据的挖掘分析做好了准备;
[0008] 立磨健康状态评估指标挖掘模块,利用一种综合的特征筛选方法对工况数据进行挖掘分析,得到影响立磨稳定的关键参数,作为立磨健康状态评估的指标;
[0009] 立磨健康状态聚类分析模块,基于确定的立磨健康状态评估的指标,对工况状态进行聚类挖掘分析,得到稳定模式工况库;
[0010] 立磨状态评估指标特征获取模块,分析立磨运行状态下的采集的实时数据的特点,确定进行实时状态判断的特征值及其获取方法;
[0011] 立磨实时特征参数预测模块,利用ARIMA算法对立磨健康状态特征获取模块中确定的特征值进行模型训练,预测参数的变化趋势,用预测值辅助状态识别。
[0012] 进一步地,所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现。离散化处理和归一化处理,由特征简约和数据变换实现。
[0013] 进一步地,所述的立磨健康状态评估指标挖掘模块中,一种综合的特征筛选方法由随机lasso、岭回归、随机森林稳定性选择和递归特征消除这五种方法综合组成。筛选算法是通过求解输入变量和输出变量之间的关系,分别使用五种方法对每个特征的重要性予以打分,对五种得分情况进行处理,按照处理后的得分结果对特征的重要度进行评估,确定待选特征集中的关键特征。
[0014] 进一步地,进行立磨运行关键特征筛选的具体步骤如下:
[0015] 1)以振动作为输出y,以其他特征为输入x,分别使用五种方法对待选特征集进行筛选,计算每个特征的得分;
[0016] 2)不同的方法特征筛选的机制不一样,为消除筛选机制的不同造成的分数差异,对每种算法的得分结果都利用最大最小值的规范化方法进行了处理,把得分限制在了[0,1]之间,然后求每个参数特征的平均得分,把平均值作为特征重要性排序的依据,进行特征值选择。
[0017] 3)对参数的综合得分进行分析,结合参数的可控性和实际含义确定对影响振动的关键参数。从得分情况看,喂料量、微粉比表、磨机进口压力、主排机转速、循环风开度磨机进口温度的平均值比较低,排除这些得分偏低的特征参数。得分最高的几个参数,按照从高到低的顺序依次为:料层厚度、磨机压差、磨机出口温度、循环风阀开度。
[0018] 4)根据步骤2)和步骤3)中的分析,评估特征参数的筛选结果。四个得分较高的参数中,磨机压差、料层厚度、立磨出口温度三个参数都属于结果变量,参数的取值是在其他可控变量的综合影响下得到的结果。而循环风阀开度是调控变量不适合作为工况状态的判断指标。
[0019] 进一步地,所述的立磨健康状态聚类分析模块,基于确定的立磨健康状态评估的指标,结合实际生产经验和工况库中的数据分布,确定了四个稳定判断指标会导致运行异常的临界值,在多个临界值的限定范围内对预处理后的数据进行进一步筛选,求满足所有限制条件的数据,得到的筛选结果作为聚类的输入数据。聚类分析采用的是K-均值(k-means)来发现数据集中的K个工况簇。这里的K是用户指定的,算法的目的是找到数据集中的K个簇的质心,把数据集中的点分配给距离该点最近的质心,并将该点分配给该质心对应的类别。
[0020] 进一步地,所述的立磨稳定工况模式库建立模块,按照对聚类分群中数据状态的定义,完成对已有的运行工况记录的类别标注,把稳定工况类别标签设置为0,非稳定工况标签设置为1,并从中提取稳定工况,建立稳定模式工况库。
[0021] 进一步地,所述的立磨状态评估指标特征获取模块,以振动、料层厚度、磨机压差、磨机出口温度这4个状态评估指标的实时数据为基础,计算每个参数在取数窗口时间内的均值、方差和异常值出现次数,把得到的结果作为稳定工况判断的特征变量。
[0022] 进一步地,所述的立磨实时特征参数预测模块,采用时间序列算法对运行状态进行预测,并用得到的预测值辅助状态判断。需要预测的参数包括振动、料层厚度、磨机出口温度、磨机压差、异常值次数,对这五个参数分别训练时间序列模型。得到的模型可以检测一段序列是否是平稳序列,给出参数的数值预测,用预测值辅助状态识别。
[0023] 根据立磨工况的特点,由于环境等外部因素和其他参数对振动的联合影响,导致工况序列属于非平稳序列,采用ARIMA模型进行时间序列的建模。
[0024] 平稳序列:对与一个序列{X(t)},如果数值在某一有限范围内波动,序列有常数的均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的,则该序列是平稳序列。
[0025] 差分运算:假定两个序列的时间间隔为T,差分运算就是把相隔为k个T的序列的对应值做减法运算,k=1时,称为一阶差分运算。
[0026] ARIMA模型的实质是在ARMA运算之前加上差分运算,然后使用ARMA进行建模,计算公式如下:
[0027] xt=φ0+φ1xt-1+φ2xt-2+...+φpxt-p+εt-θ1εt-1-θ2εt-2-...-θqεt-q[0028] 该模型认为在t时刻的变量x的值是前p期的x取值和前q期的干扰ε的多元线性函数。误差项是当前的随机干扰εt,是零均值白噪声序列。ARMA模型认为过去p期的序列值和过去q期的误差项共同影响xt的取值。
[0029] 进一步地,所述的立磨运行智能调控模块,在稳定指标中的参数出现异常时,启动调控程序,程序会从稳定模式库中搜索调控目标,返回距离当前状态最近的点作为待选工况。之后,比较当前状态与待选工况的差异,统计当前状态调至待选目标时需要调控的参数、需要调控的幅度以及调控参数个数,从这三个维度考虑,从待选工况中确定一个调控目标。调控目标的选取原则是调控个数尽可能少,调节幅度尽可能小。最后,确定调整目标后,按照设定的调节幅度进行参数的调整对可控变量进行调整,直到参数达到目标值。在调控过程中会监测稳定指标的变化走势,如果指标没有回归正常,可以随时切断调控进程,进入人工调控环节。
[0030] 一种基于数据挖掘的立磨运行调控方法,步骤如下:
[0031] 1)利用综合的特征筛选方法对工况数据进行分析,确定影响稳定的关键参数,作为稳定状态的判断指标。分析历史数据中关键参数的取值范围,根据其分布区间,确定触发稳定调控的临界值;
[0032] 2)以步骤1)中确定的稳定判断指标为特征,对工况状态进行聚类分析,使用基于K-均值的聚类算法对数据进行挖掘,分析聚类挖掘得到的各个工况簇的特点,获得历史工况中的状态分布情况;
[0033] 3)根据聚类分析的挖掘结果,定义历史工况中的运行状态类别,对工况所属的状态进行类别标注和筛选,得到稳定模式工况库;
[0034] 4)然后对立磨运行状态下的采集的实时数据的特点进行分析,确定进行实时状态判断的特征值及其获取方法;
[0035] 5)利用ARIMA算法对步骤4)中确定的特征值进行模型训练,对参数的变化趋势进行预测,用预测值辅助状态判断;
[0036] 6)根据该时刻的状态指标的数值,并结合ARIMA模型给出的预测值,对立磨的运行状态进行判断,当判定该时刻的运行状态为异常时,从稳定工况模式库中读取工况记录,得到推荐的调控目标值,然后根据推荐的目标值对该时刻的可控参数进行调控。
[0037] 本发明的有益效果主要表现在可以保持立磨生料粉磨过程的稳定运行,提高生料品质和单位产量,保证在工况变化时工艺指标能够保持在期望范围内,对影响粉磨过程的关键变量进行优化调控,达到优化生产目的。附图说明
[0038] 图1为基于数据挖掘的立磨运行调控系统结构示意图。
[0039] 图2为立磨数据的预处理过程图。
[0040] 图3为立磨健康状态评估指标挖掘过程图。
[0041] 图4为立磨健康状态K-means聚类分析流程图
[0042] 图5为k=3时,聚类分析分群的参数分布概率密度图,(a)为类别0,(b)为类别1,(c)为类别2。
[0043] 图6为立磨稳定工况模式库建立过程图。
[0044] 图7为立磨状态评估指标特征获取流程图。
[0045] 图8为立磨实时特征参数预测的时间序列建模过程图。
[0046] 图9为振动一段时间内的原始序列图。
[0047] 图10为振动一段时间内的原始序列一阶差分后的偏自相关图。
[0048] 图11为系统的预测值和实际值的关系图。
[0049] 图12为立磨运行智能调控模块流程图。

具体实施方式

[0050] 参考附图能更加全面地描述本发明,图上显示本发明的某些实施例,但是并非所有的实施例。实际上,本发明可以以很多不同的形式被体现,不应该把它看作仅限于这里所阐述的实施例,而应该把本发明的实施例看作是为了使本发明公开的内容满足可应用的合法要求而提供的。下面结合说明书附图和具体实现方式对本发明内容作详细说明说明。
[0051] 图1列出了基于数据挖掘的立磨运行调控系统各模块的功能以及各模块之间的逻辑关系。
[0052] 数据预处理模块,对立磨采集的数据进行异常值处理、空值处理、离散化处理和归一化处理,为数据的挖掘分析做好了准备;
[0053] 立磨健康状态评估指标挖掘模块,利用一种综合的特征筛选方法对工况数据进行挖掘分析,得到影响立磨稳定的关键参数,作为立磨健康状态评估的指标;
[0054] 立磨健康状态聚类分析模块,基于确定的立磨健康状态评估的指标,对工况状态进行聚类挖掘分析,得到稳定模式工况库;
[0055] 立磨状态评估指标特征获取模块,分析立磨运行状态下的采集的实时数据的特点,确定进行实时状态判断的特征值及其获取方法;
[0056] 立磨实时特征参数预测模块,利用ARIMA算法对立磨健康状态特征获取模块中确定的特征值进行模型训练,预测参数的变化趋势,用预测值辅助状态识别。
[0057] 如图2所示为立磨数据的预处理过程图。数据质量对数据挖掘的分析结果有很大影响。获取的立磨原始数据中包含了大量属性,存在错误值和异常值,需要对数据进行初步筛选,去除错误值和异常值,确保数据的准确性,并去除与挖掘无关的属性,而且要保证样本数据的多样性和特征信息的完备性。此外,还需要根据算法需求对数据进行处理,使数据满足算法的输入要求。
[0058] 所述的数据预处理模块中,数据异常值处理、空值处理,通过数据筛选和数据清洗实现:已有数据中包含了立磨供料、研磨、供风设备、粉尘分离设备、液压站、热风炉、仓库等部分的65个测点获得的参数属性。经过属性筛选后从65个属性得到包含立磨的30个主要工艺和性能参数的属性子集,包括立磨的振动、喂料量、电流、研磨压力、料层厚度,供风系统冷热风阀的开度、循环风阀的开度,选粉机转速、各主要电流等。在立磨启动、停机以及故障发生前后,由于工况非常不稳定,参数会剧烈波动。而且立磨数据中存在记录缺失、异常和记录错误的情况。有的记录缺失某些参数值,有的是人工录入错误或传感器故障等因素导致的数据偏差、缺失或异常。为了排除这些因素对数据的干扰,必须对这些缺失记录和错误值进行处理,确保数据的正确、可信,这样才能保证挖掘结果的可靠和有效性。
[0059] 所述的数据预处理模块中,数据异常值处理、空值处理,由特征简约和数据变换实现:综合考虑立磨数据的特征分布、企业对参数的人为设置,以及实际运行中参数的可控性等情况,对数据进行简约,以降低数据的维度,节约数据处理时间。在经过特征简约的剩余14特征参数中,包含了磨机主机电流、选粉机电流、主排风机电流三个主要电流参数。由于在降低能耗时更关心的是整体生产能耗的减少,而非单个部分的能耗变化,因此构造一个新的属性用来表征耗电的大小,命名为总电流。总电流的值等于磨机主机电流、选粉机电流、主排风机电流的代数和。这样待选特征集简化到12个特征。
[0060] 如图3所示为立磨健康状态评估指标挖掘过程图,具体挖掘步骤如下:
[0061] 1)以振动作为输出y,以其他特征为输入x,分别使用五种方法对待选特征集进行筛选,计算每个特征的得分;
[0062] 2)不同的方法特征筛选的机制不一样,为消除筛选机制的不同造成的分数差异,对每种算法的得分结果都利用最大最小值的规范化方法进行了处理,把得分限制在了[0,1]之间,然后求每个参数特征的平均得分,把平均值作为特征重要性排序的依据,进行特征值选择。在立磨数据上应用,算法处理后得到结果如下表1所示。
[0063] 表1不同的特征选择方法待选特征的得分情况
[0064]方法特征 随机LASSO 岭回归 随机森林 稳定性选择 递归特征消除 平均得分喂料量 0.1 0 0.03 0.08 0.18 0.08
微粉比表 0.31 0.39 0.07 0.0 0.09 0.17
料层厚度 0.6 1.0 1.0 0.8 0.71 0.82
磨机出口温度 0.21 0.45 0.32 0.66 0.42 0.41
磨机进口温度 0.0 0.0 0.23 0.0 0.14 0.07
磨机进口压力 0.11 0.0 0.43 0.24 0.13 0.18
选粉机转速 0.06 0.0 0.27 0.0 0.59 0.18
磨机压差 0.5 0.79 0.67 0.95 0.95 0.77
冷风阀开度 0.29 0.0 0.0 0.0 0.09 0.08
热风阀开度 0.21 0.0 0.01 0.12 0.0 0.07
循环风阀开度 0.6 0.21 0.14 0.24 0.33 0.3
主排风机转速 0.01 0.1 0.01 0.0 0.0 0.02
[0065] 3)对参数的综合得分进行分析,结合参数的可控性和实际含义确定对影响振动的关键参数。从得分情况看,喂料量、微粉比表、磨机进口压力、主排风机转速、循环风阀开度磨机进口温度的平均值比较低,排除这些得分偏低的特征参数。得分最高的几个参数,按照从高到低的顺序依次为:料层厚度、磨机压差、磨机出口温度、循环风阀开度。
[0066] 4)根据步骤2)和步骤3)中的分析,评估特征参数的筛选结果。四个得分较高的参数中,磨机压差、料层厚度、立磨出口温度三个参数都属于结果变量,参数的取值是在其他可控变量的综合影响下得到的结果。而循环风阀开度是调控变量不适合作为工况状态的判断指标。
[0067] 综合以上分析,最终确定振动、料层厚度、磨机压差、磨机出口温度4个参数一起作为稳定状态判断的指标。
[0068] 如图4所示为立磨健康状态K-means聚类分析流程图。结合实际生产经验和工况库中的数据分布,确定了四个稳定判断指标会导致运行异常的临界值,在多个临界值的限定范围内对预处理后的数据进行进一步筛选,求满足所有限制条件的数据,得到的筛选结果作为聚类的输入数据。聚类分析采用的是K-均值(k-means)来发现数据集中的K个工况簇。这里的K是用户指定的,算法的目的是找到数据集中的K个簇的质心,把数据集中的点分配给距离该点最近的质心,并将该点分配给该质心对应的类别。
[0069] 选取K=3时,聚类结果如下,聚类中心及每个簇中的数据点个数如表2所示,分群的参数分布概率密度图如图5所示。
[0070] 表2 k=3,分群聚类中心表
[0071]类别 料层厚度 磨机出口温度 磨机压差 磨机壳体振动 类别数目
0 -0.464651 0.564229 -0.110864 0.520456 2276
1 -0.182965 -0.963877 -0.437062 -0.448334 2178
2 1.551188 0.872879 1.284423 -0.219220 937
[0072] 从图5中可以看出:
[0073] 类别0特点:料层厚的取值范围在125~135mm之间,磨机出口温度在100~108℃,磨机压差在2800~3200Pa,振动值集中在7、8、9三个值附近。
[0074] 类别1特点:料层厚的取值范围在125~144mm之间,磨机出口温度在95~103℃,磨机压差在2800~3200Pa,振动值集中在6、7、8三个值附近。
[0075] 类别2特点:料层厚的取值范围在140~150mm之间,磨机出口温度在102~108℃,磨机压差在3200~3500Pa,振动值集中在6~8之间。
[0076] 选取K=3时,振动的重叠性较大,其他三个参数的距离间隔比较合理,结合本文数据来源立磨的设计生产建议,取三个聚簇中心时得到的类别0定义为非稳定状态,类别1和2中的记录定义为稳定状态。
[0077] 按照对聚类分群中数据状态的定义,完成对已有的运行工况记录的类别标注,把稳定工况类别标签设置为0,非稳定工况标签设置为1,并从中提取稳定工况,建立稳定模式工况库。立磨稳定工况模式库建立过程图,如图6所示:一条工况中包含可控变量作为X,稳定表征变量Y以及类别标签,对每条工况计算X中的参数与工况库中已有工况之间的距离,若距离为零,则认为工况库中已存在该工况,不再重复记录。否则,将该工况加上时间标签,以向量形式存入稳定工况库。
[0078] 如图7所示为立磨状态评估指标特征获取流程图,具体获取过程如下:
[0079] 1)采集T时刻的实时工况数据,对采集到的数据进行空值和异常值检测,如果读取的过程中出现空值,舍弃数据或者用历史均值填补空值。处理完毕,按照设定的稳定指标数据采样间隔△t,继续读取下个采集时刻的数据,进行数据检测,重复这个过程直至获得n条记录;
[0080] 2)在采集n条记录的过程中,如果有异常值出现,累计每个参数的异常值出现的次数。异常值的判断依据参照从稳定工况模式库中得到的各个参数取值范围,当采集到的参数超出正常范围,则认为该时刻的数据为异常值。
[0081] 3)计算n条记录中各个参数的均值和标准差。最后得到每个参数在取数周期内得到的均值、方差和异常值次数三个维度共12个数值作为工况判断的特征值,用以稳定状态的判断。
[0082] 如图8所示为立磨实时特征参数预测的时间序列建模过程图。根据立磨工况的特点,由于环境等外部因素和其他参数对振动的联合影响,导致工况序列属于非平稳序列,采用ARIMA模型进行时间序列的建模。
[0083] 平稳序列:对与一个序列{X(t)},如果数值在某一有限范围内波动,序列有常数的均值和常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的,则该序列是平稳序列。
[0084] 差分运算:假定两个序列的时间间隔为T,差分运算就是把相隔为k个T的序列的对应值做减法运算,k=1时,称为一阶差分运算。
[0085] ARIMA模型的实质是在ARMA运算之前加上差分运算,然后使用ARMA进行建模,计算公式如下:
[0086] xt=φ0+φ1xt-1+φ2xt-2+...+φpxt-p+εt-θ1εt-1-θ2εt-2-...-θqεt-q[0087] 该模型认为在t时刻的变量x的值是前p期的x取值和前q期的干扰ε的多元线性函数。误差项是当前的随机干扰εt,是零均值白噪声序列。ARMA模型认为过去p期的序列值和过去q期的误差项共同影响xt的取值。
[0088] 以振动值为例说明采用时间序列进行建模的过程。首先对一段连续时间内采集到的振动值进行平稳性检测,取数间隔为5秒,连续35个振动取值的数据如下图9所示,可以看出该序列有上升趋势,属于非平稳序列。对序列求取自相关系数,相关系数的绝对值长期大于零,表明该序列具有长期的相关性。对这个序列进行一阶差分后得到的偏自相关图如图10所示。可以看出一阶差分后序列的时序图在均值附近波动,且波动范围不大,所以一阶差分后的序列是平稳序列。
[0089] 接着对一阶差分后的序列进行白噪声检测,得到的P值小于0.05,所以一阶差分后的序列属于平稳非白噪声序列,可以用ARMA模型进行拟合。接下来对ARMA模型进行定阶,也就是求模型中的参数。进行模型定阶主要有两种方法,一种是根据一阶差分的自相关图呈现的特点,来确定p和q。另一种方法是根据p、q的所有组合得到的BIC信息量的大小来确定,选择令BIC信息量达到最小的p、q组合。模型定阶后就可以利用建立的ARIMA模型进行预测。
[0090] 预测模型可以给出连续5分钟的预测值、标准误差和置信区间,预测值和实际值的关系如图11所示。从图中可以看出预测误差较低,预测值基本能够反映数值的变化趋势,模型的预测效果良好。
[0091] 如图12所示为立磨运行智能调控模块流程图。当稳定判断指标的取值偏离正常范围,会自动触发稳定状态自动调控。具体的调节方法如下:
[0092] 1)当稳定指标中的参数出现异常,启动调控程序后,程序会从稳定模式库中搜索调控目标,返回距离当前状态最近的点作为待选工况。
[0093] 2)比较当前状态与待选工况的差异,统计当前状态调至待选目标时需要调控的参数、需要调控的幅度以及调控参数个数,从这三个维度考虑,从待选工况中确定一个调控目标。调控目标的选取原则是调控个数尽可能少,调节幅度尽可能小。
[0094] 3)确定调整目标后,按照设定的调节幅度进行参数的调整对可控变量进行调整,直到参数达到目标值。在调控过程中会监测稳定指标的变化走势,如果指标没有回归正常,可以随时切断调控进程,进入人工调控环节。
QQ群二维码
意见反馈