首页 / 专利库 / 人工智能 / 人工神经网络 / 人工神经元 / 基于交叉相关时滞灰色关联分析的流程工业系统预测模型

基于交叉相关时滞灰色关联分析的流程工业系统预测模型

阅读:1024发布:2020-07-02

专利汇可以提供基于交叉相关时滞灰色关联分析的流程工业系统预测模型专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于交叉相关时滞灰色关联分析的流程工业系统 预测模型 。本发明先计算各候选变量与目标变量之间的相关联度;以降序方式对变量进行排序,取关联度大于关联度 阈值 的变量,得到特征变量集合。以特征变量集合作为指标预测模型的输入变量,并将其相对延迟时间融合到模型建立的过程。以 人工神经网络 对指标变化趋势进行预测,训练预测模型,以最小化预测误差为目标,选择最优的输入特征,建立预测模型。将最优输入特征子集中的特征变量的不同时段的时间序列融合延迟时间作为指标预测模型的输入,测试模型,将结果与目标变量的真实值比较,定量评价预测性能。本发明提高了模型整体的精确度,最终实现 对流 程工业关键指标的有效预测。,下面是基于交叉相关时滞灰色关联分析的流程工业系统预测模型专利的具体信息内容。

1.基于交叉相关时滞灰色关联分析的流程工业系统预测模型,其特征在于,该模型的建立包括:
步骤1:计算各候选变量与目标变量之间的相关联度;
从流程工业企业的监控与数据采集系统中获取被预测的指标以及与被预测的指标相关的同一时段连续的特征变量,特征变量即为时间序列;考虑工业生产过程变量间的非线性和时滞性以及数据采集的方式,在对采集数据进行误差消除后,用基于交叉相关性时滞计算的方法确定目标变量与候选变量的相对延迟时间,并将延迟时间作为输入参数引入到考虑延时的灰色关联分析法中分别计算各候选变量与目标变量之间的相关联度;通过各变量与指标的逐一分析并以绝对关联度的降序方式对变量进行排序,与关联度阈值比较,最终得到变量集合S={s(1),s(2),...,s(n)};
具体方法和相关公式如下:
1.1 消除显著误差以及随机误差;
首先消除显著误差,设实测数据x1,x2,…,xn的均值 偏差为 i=1,2,…,n;
显著误差判别条件如下:
若某一实测数据的xi偏差vi大于δ,则认为该点是显著误差点,应剔除;
然后消除随机误差,采用一阶数据平滑过滤法消除数据中的随机误差,具体数学表达式如下:
yi=Pyi-1+Qxi+1+(1-P-Q)xi
式中,yi表示当前时刻的处理值;yi-1表示前一时刻的处理值;xi+1表示下一时刻的实测值;P,Q为加权参数,并且需满足P+Q<1;
最后将所有剔除的数据用样本数据的平均值补偿;
1.2 交叉相关法计算时滞;
设有m个候选变量X1,X2…,Xm,目标变量为Y,变量的采样周期为T;计算Y(t)和候选变量Xi(t+l)间的相对时滞;采集到的样本分别为:Y(t)和Xi(t+l),t=0…N,其中t为采样时刻,N为最大滞后步长,l为时间窗长度;那么Xi(t+l)相对于Y(t)的时滞τi由下式表示;
其中:
RY=E{(Y(t)-μY(t))2}
式中μY(t), 分别为Y(t)和Xi(t+l)的平均值,E{·}表示期望值;
1.3 考虑时滞的灰色关联分析法分析变量的相关性;
设Xi(t)=[Xi(1),…Xi(n)]为与被预测的指标相关的候选变量,即比较序列,i表示标号,n是样本量;而目标变量Y(t)=[y(1),…y(n)],n为样本量;先对序列进行无量纲化处理,表达式如下:
X′i=XiD=[x′i(1),...,x′i(n)]=[xi(1)c,...,xi(n)c]
Y′=YD=[y′(1),...,y′(n)]=[y(1)c,...,y(n)c]
其中xi(k)=xi(k)c=xi(k)-xi(1),y(k)=y(k)c=y(k)-y(1),D称为始点零化算子;
而X′i(t)在k时刻的标准增量表示为:
式中
同理,Y在k时刻的标准增量表示为:
式中
时间延迟为d的情形下,X′i与Y′的灰色关联度为:
式中,μ(k,d)表示增量相关系数,v(k,d)表示变化率相关系数,分别用以下公式表示:
从而,伴随着延迟时间d,候选变量序列X′i和目标变量序列Y′相关联度表示为:
1.4 候选变量与目标变量逐一通过1.3的考虑时滞的灰色关联分析法的计算,得到各候选变量与目标变量间对应的关联度;根据关联度的绝对值降序排序,以生产过程实际情况和关联度的平均值设置关联度阈值;将各候选变量与目标变量的关联度值与关联度阈值比较,取关联度大于关联度阈值的变量,得到特征变量集合S={s(1),s(2),...,s(n)};
步骤2:通过步骤1挑选出与被预测指标最相关的特征变量集合S={s(1),s(2),...,s(n)};以特征变量集合S作为指标预测模型的输入变量,并将特征变量对应的相对延迟时间融合到模型建立的过程;以递进式选择策略融合指标预测模型中,采用基于数据建模的且具有较强的非线性拟合性的人工神经网络对指标或指标变化趋势进行预测,训练预测模型,以最小化预测误差为目标,去除无关和冗余特征变量,选择出最优的输入特征,也建立了相对稳定、预测精度良好的指标预测模型;
具体方法和相关公式如下:
2.1 初始化最优输入特征子集,即A={s(1)},令i=1;s(1)来自于步骤1选择出的与被预测指标最相关的特征变量集合S={s(1),s(2),...,s(n)};
2.2 初始化人工神经网络隐含层神经元个数和学习率;最优输入特征子集A结合当前时刻t和延迟时间d的值以及历史时刻r的真实指标值作为人工神经网络的输入来预测系统输出,并以此预测输出值反馈到系统输入端以滚动优化;t时刻的预测指标值表示为:
计算预测值与真实值的差值
y(t)为t时刻待预测指标的真实值,并根据差值D调整人工神经网络的参
数,对每个时刻重复上述过程,直到差值D不超过设定的范围;
以指标预测误差ε(i)定量评价预测性能,其定义如下:
其中:n为样本量,yi为观测值, 为预测值;
2.3 更新最优输入特征子集A=A+{s(i+1)},使用更新后的最优输入特征子集对生产过程的目标变量进行预测,得到指标变量预测误差ε(i+1);
2.4 比较ε(i)与ε(i+1)的大小,若ε(i)>ε(i+1),则认为第i+1个变量为有效变量,保留第i+1个变量,同时令i=i+1,返回2.2;否则,令A=A-{s(i+1)};这样便得到与被预测指标的最相关的且去除无关和冗余特征变量的最优输入特征子集,同时也建立了稳定的、预测精度良好的指标或指标变量趋势的预测模型;
步骤3:将最优输入特征子集中的特征变量的不同时段的时间序列融合延迟时间作为指标预测模型的输入,测试模型,将测试结果与同一时段目标变量的真实值做比较,定量评价预测性能;若不能达到满意的预测效果,则返回步骤2,调整人工神经网络的参数,重新训练测试指标预测模型,直至达到满意的预测效果。

说明书全文

基于交叉相关时滞灰色关联分析的流程工业系统预测模型

技术领域

[0001] 本发明涉及流程工业生产领域,涉及一种基于交叉相关时滞灰色关联分析的流程工业系统预测模型。

背景技术

[0002] 流程工业主要包括石油、化工、冶金、电、制药等在国民经济中占有主导地位的行业,其生产过程普遍包含大量的指标或变量,对其中重要指标的监测是保证正常生产的关键,如炼化厂加氢裂化装置中的反应器温度,塔体压力等多种重要指标。而流程工业生产具有规模大、工艺复杂多变、非线性、强耦合、大滞后等特点,现场操作人员常用人工经验对个别关键指标进行监测的方法难以确保在故障潜伏期就发现异常,另外,从实时生产调度出发,操作人员希望预先了解某些关键指标的未来变化趋势,以做出相应地调整,因此针对流程工业系统建立有效的数学模型进行实时预测就显得尤为重要。被预测的指标值往往与生产过程中的多个过程变量相关,进行生产过程指标预测首先需要将与被预测指标相关性较强的特征变量从众多候选变量中挑选出来。相关变量的选择方法通常包括基于经验知识手动选择和基于数据分析的选择方法。基于经验知识的方法虽然方便快捷,但时常会因为经验不足出现错选漏选或特征冗余的情况。流程工业生产过程的时滞性一方面决定了输入变量的变化往往需要经过一段时间才能影响指标变量或是被预测变量。另一方面表现为输入变量之间也常常存在时滞。而变量的时滞性对于变量相关性分析、变量选择、预测建模均有影响。而考虑时滞影响的关键在于选定变量的延迟时间。但目前通常是通过人工经验或者专家建议手动确定变量间的时滞,变量选择的准确性以及预测建模的精度均难以保证。同时传统的生产过程指标预测采用基于机理的建模方法,即在工艺机理分析的基础上依据物性方程建立数学模型。然而此类模型对于建模误差、参数摄动、噪声和干扰非常敏感,并不适用于多变量的流程工业过程。基于数据的预测建模与基于机理建模的区别在于此类方法只关注模型的输入和输出,不需要准确的数学模型,同时又能有效地把过程操作经验、工艺知识、历史故障记录等专家知识融入到故障预测中去。

发明内容

[0003] 本发明的目的是对流程工业系统中关键指标进行预测,针对流程工业数据变量的复杂关联性以及变量选择中的基于知识手动选择变量的方法的局限性,考虑到流程工业生产过程的时滞性及基于数据建模方法的优越性,提出了一种基于交叉相关性时滞灰色关联分析的流程工业系统预测模型。本发明解决其技术问题所采用的技术方案是:
[0004] 步骤1:计算各候选变量与目标变量之间的相关联度;
[0005] 从流程工业企业的监控与数据采集系统中获取被预测的指标以及与被预测的指标相关的同一时段连续的特征变量,特征变量即为时间序列;考虑工业生产过程变量间的非线性和时滞性以及数据采集的方式,在对采集数据进行误差消除后,用基于交叉相关性时滞计算的方法确定目标变量与候选变量的相对延迟时间,并将延迟时间作为输入参数引入到考虑延时的灰色关联分析法中分别计算各候选变量与目标变量之间的相关联度。通过各变量与指标的逐一分析并以绝对关联度的降序方式对变量进行排序,与关联度阈值比较,最终得到变量集合S={s(1),s(2),...,s(n)}。
[0006] 具体方法和相关公式如下:
[0007] 1.1消除显著误差以及随机误差。
[0008] 首先消除显著误差,设实测数据x1,x2,...,xn的均值 偏差为显著误差判别条件如下:
[0009]
[0010] 若某一实测数据的xi偏差vi大于δ,则认为该点是显著误差点,应剔除。
[0011] 然后消除随机误差,采用一阶数据平滑过滤法消除数据中的随机误差,具体数学表达式如下:
[0012] yi=Pyi-1+Qxi+1+(1-P-Q)xi
[0013] 式中,yi表示当前时刻的处理值;yi-1表示前一时刻的处理值;xi+1表示下一时刻的实测值;P,Q为加权参数,并且需满足P+Q<1。
[0014] 最后将所有剔除的数据用样本数据的平均值补偿。
[0015] 1.2交叉相关法计算时滞。
[0016] 设有m个候选变量X1,X2…,Xm,目标变量为Y,变量的采样周期为T;计算Y(t)和候选变量Xi(t+l)间的相对时滞。采集到的样本分别为:Y(t)和Xi(t+l),t=0…N,其中t为采样时刻,N为最大滞后步长,l为时间窗长度;那么Xi(t+l)相对于Y(t)的时滞τi由下式表示。
[0017]
[0018] 其中:
[0019]
[0020]
[0021] RY=E{(Y(t)-μY(t))2}
[0022]
[0023] 式中μY(t), 分别为Y(t)和Xi(t+l)的平均值,E{·}表示期望值;
[0024] 1.3考虑时滞的灰色关联分析法分析变量间的相关性。
[0025] 设Xi(t)=[Xi(1),…Xi(n)]为与被预测的指标相关的候选变量,即比较序列,i表示标号,n是样本量。而目标变量Y(t)=[y(1),…y(n)],n为样本量。先对序列进行无量纲化处理,表达式如下:
[0026] X′i=XiD=[x′i(1),…,x′i(n)]=[xi(1)c,…,xi(n)c]
[0027] Y′=YD=[y′(1),…,y′(n)]=[y(1)c,…,y(n)c]
[0028] 其中xi(k)=xi(k)c=xi(k)-xi(1),y(k)=y(k)c=y(k)-y(1),D称为始点零化算子。
[0029] 而X′i(t)在k时刻的标准增量表示为:
[0030]
[0031] 式中
[0032] 同理,Y在k时刻的标准增量表示为:
[0033]
[0034] 式中
[0035] 时间延迟为d的情形下,X′i与Y′的灰色关联度为:
[0036]
[0037] 式中,μ(k,d)表示增量相关系数,υ(k,d)表示变化率相关系数,分别用以下公式表示:
[0038]
[0039] 其他
[0040] 从而,伴随着延迟时间d,候选变量序列X′i和目标变量序列Y′相关联度表示为:
[0041]
[0042] 两变量的相关联度可能为正也可能为负,这取决于Δsi(k)·Δsy(k+d)的符号。当两个变量信号在一定的时间结构上有相同的增量和变化率,那么他们的相关联度为1。
[0043] 1.4候选变量与目标变量逐一通过1.3的考虑时滞的灰色关联分析法的计算,得到各候选变量与目标变量间对应的关联度。根据关联度的绝对值降序排序,以生产过程实际情况和关联度的平均值设置关联度阈值。将各候选变量与目标变量的关联度值与关联度阈值比较,取关联度大于关联度阈值的变量,得到特征变量集合S={s(1),s(2),...,s(n)}。
[0044] 步骤2:通过步骤1挑选出与被预测指标最相关的特征变量集合S={s(1),s(2),...,s(n)}。以特征变量集合S作为指标预测模型的输入变量,并将特征变量对应的相对延迟时间融合到模型建立的过程。目前大部分基于相关性分析的特征选择方法仅仅只分析了候选特征与被预测指标之间的关联性,而未考虑各输入特征之间可能存在的联系,从而导致选出的特征中存在冗余信息,在一定程度上影响预测模型的效率和预测精度。以递进式选择策略融合指标预测模型中,采用基于数据建模的且具有较强的非线性拟合性的人工神经网络对指标或指标变化趋势进行预测,训练预测模型,以最小化预测误差为目标,去除无关和冗余特征变量,选择出最优的输入特征,也建立了相对稳定、预测精度良好的指标预测模型。
[0045] 具体方法和相关公式如下:
[0046] 2.1初始化最优输入特征子集,即A={s(1)},令i=1。s(1)来自于步骤1选择出的与被预测指标最相关的特征变量集合S={s(1),s(2),...,s(n)}。
[0047] 2.2初始化人工神经网络隐含层神经元个数和学习率。最优输入特征子集A结合当前时刻t和延迟时间d的值以及历史时刻r的真实指标值作为人工神经网络的输入来预测系统输出,并以此预测输出值反馈到系统输入端以滚动优化。t时刻的预测指标值表示为:计算预测值与真实值的差值
y(t)为t时刻待预测指标的真实值,并根据差值D调整人工神经网络的参
数,对每个时刻重复上述过程,直到差值D不超过设定的范围。
[0048] 以指标预测误差ε(i)定量评价预测性能,其定义如下:
[0049]
[0050] 其中:n为样本量,yi为观测值, 为预测值。
[0051] 2.3更新最优输入特征子集A=A+{s(i+1)},使用更新后的最优输入特征子集对生产过程的目标变量进行预测,得到指标变量预测误差ε(i+1);
[0052] 2.4比较ε(i)与ε(i+1)的大小,若ε(i)>ε(i+1),则认为第i+1个变量为有效变量,保留第i+1个变量,同时令i=i+1,返回2.2;否则,令A=A-{s(i+1)}。这样便得到与被预测指标的最相关的且去除无关和冗余特征变量的最优输入特征子集,同时也建立了稳定的、预测精度良好的指标或指标变量趋势的预测模型。
[0053] 步骤3:将最优输入特征子集中的特征变量的不同时段的时间序列结合延迟时间作为指标预测模型的输入,测试模型,将测试结果与同一时段目标变量的真实值做比较,定量评价预测性能。若不能达到满意的预测效果,则返回步骤2,调整人工神经网络的参数,重新训练测试指标预测模型,直至达到满意的预测效果。
[0054] 本发明相对现有技术具有的效果:不仅能够选择合适的相关特征变量,并采用数学解析式的方法确定目标变量与相关变量的延迟时间,再将延迟时间与灰色关联分析法结合来确定目标变量与相关变量的关联程度,筛选特征子集建立预测模型,以递进选择策略去除冗余变量,优化模型参数,提高了模型整体的精确度,最终实现对流程工业关键指标的有效预测。附图说明
[0055] 图1为本发明的具体流程图

具体实施方式

[0056] 流程工业中,对关键指标的预测可以对故障的预报和诊断分析提供有效的帮助。确定待预测指标和相关指标后,通过本发明提出的基于交叉相关时滞灰色关联分析的流程工业系统预测模型,在完成数据误差消除的基础上确定各指标变量与待预测指标的延迟时间,选择出合适的与待预测指标相关性较强的指标变量,并将延迟时间结合人工神经网络预测模型,以递进选择策略去除无关的和冗余的指标变量,优化模型参数,最终实现待预测指标的有效预测。
[0057] 如图1所示,本发明的具体实施步骤包括:
[0058] 步骤1:确定待预测指标和相关指标,所述相关指标是指对待预测指标产生影响的指标变量;获取待预测指标变量某一时段的时间序列,作为目标序列;获取所述相关指标变量在同一时段的时间序列,作为比较序列;设比较序列为Xi(t)=[Xi(1),…Xi(n)],目标序列为Y(t)=[y(1),…y(n)]。
[0059] 1.1对目标序列和比较序列的变量进行误差消除等预处理操作,剔除显著误差判别条件如下:
[0060]
[0061] 若某一样本数据的xi偏差 大于δ,则剔除该点。
[0062] 然后采用一阶数据平滑过滤法消除数据中的随机误差(随机噪声),具体表达式如下:
[0063] yi=Pyi-1+Qxi+1+(1-P-Q)xi
[0064] 最后将所有剔除的数据用样本数据的平均值补偿。
[0065] 1.2使用交叉相关法计算目标序列与比较序列的时滞,根据公式:
[0066]
[0067] 其中:
[0068]
[0069]
[0070] RY=E{(Y(t)-μY(t))2}
[0071]
[0072] 将目标序列Y分别与其他比较序列Xi进行计算即可求出目标序列与比较序列之间的延迟时间。
[0073] 1.3计算所述目标序列和比较序列的相关联度。先对序列进行无量纲化处理:
[0074] X′i=XiD=[x′i(1),…,x′i(n)]=[xi(1)c,…,xi(n)c]
[0075] Y′=YD=[y′(1),…,y′(n)]=[y(1)c,…,y(n)c]
[0076] 在已经获得目标序列与比较序列之间的延迟时间d的基础上,根据公式:
[0077]
[0078] 其中,
[0079] 表示增量相关系数;
[0080] 其他,表示变化率相关系数。
[0081] 计算候选变量序列X′i和目标变量序列Y′相关联度:
[0082]
[0083] 1.4设置关联度阈值,根据相关联度对相关指标进行筛选,得到相关指标的特征变量集合S。具体是指:根据关联度的绝对值降序排序,并设置关联度阈值。将各候选变量与目标变量的关联度值与关联度阈值比较,取关联度大于关联度阈值的变量,得到特征变量集合S={s(1),s(2),...,s(n)}。
[0084] 步骤2:将所述特征变量集合S作为人工神经网络的输入变量,将待预测指标变量作为判断的基准变量,以最小化预测误差为目标,去除特征变量集合S中的无关和冗余特征变量,并在此过程中调整人工神经网络的参数,最终得到最优输入特征子集A,同时也建立了有效的待预测指标预测模型,具体包括:
[0085] 2.1初始化最优输入特征子集,即A={s(1)},令i=1,初始化人工神经网络隐含层神经元个数和学习率。
[0086] 2.2将最优输入特征子集A结合当前时刻t和延迟时间d的值以及历史时刻r的待预测指标的值作为人工神经网络的输入样本,送入人工神经网络,计算人工神经网络的实际输出,t时刻的待预测指标值可表示为:
[0087] 计算预测值与真实值的差值 y(t)为t时刻待预测指标的真实值,并根据差值D调整人工神经网络的参数,差值D对应的损失函数和人工神经网络的权重有关,通过损失函数对权重求偏导数,偏导数乘以人工神经网络的学习率,用权重减去这个乘值,就能得到修正后的新的权重who,原先的人工神经网络也得到了更新,公式如下:
[0088]
[0089] 式中,α为学习率,e(who)为误差的损失函数。
[0090] 以最小化预测值与实际值的差值为原则,当误差对权重的偏导数大于零时,权值调整量为负,实际输出大于期望输出,权值向减少方向调整,使得实际输出与期望输出的差减少。当误差对权值的偏导数小于零时,权值调整量为正,实际输出少于期望输出,权值向增大方向调整,使得实际输出与期望输出的差减少;对每个时刻重复上述过程,直到差值D不超过设定的范围。
[0091] 计算待预测指标误差ε(i):
[0092]
[0093] 其中:n为第i个样本量,yi为待预测指标的真实值。 为待预测指标的预测值。
[0094] 2.3更新最优输入特征子集A=A+{s(i+1)},得到待预测指标误差ε(i+1);比较ε(i)与ε(i+1)的大小,若ε(i)>ε(i+1),则认为第i+1个变量为有效变量,保留第i+1个变量,返回步骤2.2;否则,令A=A-{s(i+1)},返回步骤2.2。当i=n-1时,循环结束,从而得到与待预测指标最相关的且去除无关和冗余特征变量的最优输入特征子集A,此时便建立了预测精度良好的待预测指标预测模型。
[0095] 步骤3:获取最优输入特征子集中的特征变量的其他时段的时间序列作为测试集并结合延迟时间作为步骤2建立的待预测指标预测模型的输入,将测试结果与该时段待预测指标的实际值一一比较,定量评价预测性能。若不能达到满意的预测效果,则返回步骤2,调整人工神经网络的隐含层神经元个数和学习率以及历史时刻r,重新训练并测试模型,直至达到满意的预测效果。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈