首页 / 专利库 / 林业机械与工程 / 森林健康 / 一种压裂装备作业时健康状态的评估方法及装置

一种压裂装备作业时健康状态的评估方法及装置

阅读:496发布:2020-05-13

专利汇可以提供一种压裂装备作业时健康状态的评估方法及装置专利检索,专利查询,专利分析的服务。并且本 申请 提供了一种压裂装备作业时 健康状态 的评估方法及装置,其中,该方法包括:获取压裂装备工作时的目标振动数据;利用集合经验模态分解 算法 对目标振动数据进行分解,得到多个本征模函数;确定多个本征模函数中各本征模函数对应的本征模 能量 ,得到多个本征模能量;根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。上述方法可以准确地确定压裂装备的健康状态,为压裂施工安全有序进行提供技术保障,并帮助操作人员了解压裂装备的健康状态变化,及时捕捉异常状态。,下面是一种压裂装备作业时健康状态的评估方法及装置专利的具体信息内容。

1.一种压裂装备作业时健康状态的评估方法,其特征在于,包括:
获取压裂装备工作时的目标振动数据;
利用集合经验模态分解算法对所述目标振动数据进行分解,得到多个本征模函数;
确定所述多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量;
根据训练好的分类器模型和所述多个本征模能量,确定所述压裂装备的健康状态。
2.根据权利要求1所述的方法,其特征在于,根据训练好的分类器模型和所述多个本征模能量,确定所述压裂装备的健康状态,包括:
根据所述目标振动数据、所述多个本征模能量和所述训练好的分类器模型,确定所述压裂装备工作时的工况类型;
根据预设的第一关系表确定所述工况类型对应的健康状态,其中,所述预设的第一关系表中包括工况类型与健康状态的对应关系。
3.根据权利要求2所述的方法,其特征在于,在根据训练好的分类器模型和所述多个本征模能量,确定所述压裂装备的健康状态之前,还包括:
获取多个训练样本,其中,所述多个训练样本中包括多种工况下的训练样本;
利用所述多个训练样本对预设的分类器模型进行训练,得到训练好的分类器模型。
4.根据权利要求3所述的方法,其特征在于,所述分类器模型为随机森林模型;
获取多个训练样本,包括:
获取压裂装备在多种工况中各工况下的多个振动数据;
利用集合经验模态分解算法对所述各工况下的多个振动数据中各振动数据进行分解,得到各振动数据对应的多个本征模函数;
确定各振动数据对应的多个本征模函数中各本征模函数对应的本征模能量;
获取各振动数据的有量纲特征指标和无量纲特征指标,其中,所述有量纲特征指标包括振动数据的均方根值,所述无量纲特征指标包括振动数据的偏斜度、峭度指标、波形指标、峰值指标、脉冲指标和裕度指标;
根据所述各振动数据对应的工况类别以及所述各振动数据的本征模能量、有量纲特征指标和无量纲特征指标构建各振动数据对应的特征属性集合,其中,所述各振动数据的本征模能量、有量纲特征指标和无量纲特征指标作为条件属性,所述各振动数据对应的工况类别作为决策属性;
对所述各振动数据对应的特征属性集合进行约简,得到各振动数据对应的约简后的特征属性集合;
将所述各振动数据对应的约简后的特征属性集合作为训练样本,得到多个训练样本。
5.根据权利要求4所述的方法,其特征在于,对所述特征属性集合进行约简,得到约简后的特征属性集合,包括:
确定所述特征属性集合的多个条件属性中各条件属性对决策属性的重要度;
筛选出重要度大于预设阈值的条件属性,作为目标条件属性;
将所述决策属性和所述目标条件属性组成的集合确定为约简后的特征属性集合。
6.根据权利要求2所述的方法,其特征在于,在确定所述多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量之后,还包括:
根据所述多个本征模能量,确定所述压裂装备的能量熵;
在根据训练好的分类器模型和所述多个本征模函数,确定所述压裂装备的健康状态之后,还包括:
获取与所述压裂装备工作时的工况类型对应的多个能量熵;
根据预设的第二关系表和所述工况类型对应的多个能量熵,对所述压裂装备的能量熵进行修正,得到所述压裂装备的修正后的能量熵,其中,所述预设的第二关系表中包括能量熵范围和健康状态的对应关系。
7.根据权利要求6所述的方法,其特征在于,根据所述多个本征模能量,确定所述压裂装备的能量熵,包括:
按照以下公式计算所述压裂装备的能量熵:
其中,QEj为目标振动数据xj(t)的能量熵,其中, 其中,Eji为目标振动数据xj(t)的第i个本征模函数对应的本征模能量, SEi为N种不同健康状态下的振动数据xk(t)的第i个本征模函数对应的本征模能量之和,j为大于等于1且小于等于N的整数。
8.一种压裂装备作业时健康状态的评估装置,其特征在于,包括:
获取模,用于获取压裂装备工作时的目标振动数据;
分解模块,用于利用集合经验模态分解算法对所述目标振动数据进行分解,得到多个本征模函数;
第一确定模块,用于确定所述多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量;
第二确定模块,用于根据训练好的分类器模型和所述多个本征模能量,确定所述压裂装备的健康状态。
9.一种计算机设备,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1至7中任一项所述方法的步骤。

说明书全文

一种压裂装备作业时健康状态的评估方法及装置

技术领域

[0001] 本申请涉及气藏开采技术领域,特别涉及一种压裂装备作业时健康状态的评估方法及装置。

背景技术

[0002] 页岩气储量丰富,由于页岩气多分布在偏远山区,并且距地表较深,导致开采困难,往往需要使用平井+多段压裂技术来提高产量。随着压裂施工作业中压排量的不断增加,压裂装备的研制也朝着高压力和大排量方向发展。
[0003] 目前,页岩气开发过程中使用较多的压裂装备为2500型和3000型压裂装备,页岩气压裂施工中单井配置的压裂装备数量在18台左右,一般每口井要进行十几次压裂施工,每一次压裂施工都至关重要,并且影响最终的产量。在单次压裂施工过程中,压裂注设备作为主要压裂装备,其健康状态的好坏决定着压裂施工能否顺利进行。
[0004] 虽然已有研究对压裂作业过程中设备振动进行仿真分析和实验分析,但这些研究只是简单地对振动信号的时频域幅值对比。然而,一般情况下压裂作业工况复杂,现场环境中噪声源较多,所以实际测量的信号本质上是非线性的,并且包含大量噪声,如果直接对其频谱进行分析,很难找到对应的特征频率,造成故障特征提取困难的问题,并最终影响设备健康状态评价结果的准确率。
[0005] 因此,亟需一种能够准确评估压裂装备的健康状态的方法。发明内容
[0006] 本申请实施例提供了一种压裂装备作业时健康状态的评估方法及装置,能够准确地评估压裂装备的健康状态。
[0007] 本申请实施例提供了一种压裂装备作业时健康状态的评估方法,包括:获取压裂装备工作时的目标振动数据;利用集合经验模态分解算法对目标振动数据进行分解,得到多个本征模函数;确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量;根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。
[0008] 在一个实施例中,根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态,包括:根据目标振动数据、多个本征模能量和训练好的分类器模型,确定压裂装备工作时的工况类型;根据预设的第一关系表确定工况类型对应的健康状态,其中,预设的第一关系表中包括工况类型与健康状态的对应关系。
[0009] 在一个实施例中,在根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态之前,还包括:获取多个训练样本,其中,多个训练样本中包括多种工况下的训练样本;利用多个训练样本对预设的分类器模型进行训练,得到训练好的分类器模型。
[0010] 在一个实施例中,分类器模型为随机森林模型,获取多个训练样本,包括:获取压裂装备在多种工况中各工况下的多个振动数据;利用集合经验模态分解算法对各工况下的多个振动数据中各振动数据进行分解,得到各振动数据对应的多个本征模函数;确定各振动数据对应的多个本征模函数中各本征模函数对应的本征模能量;获取各振动数据的有量纲特征指标和无量纲特征指标,其中,有量纲特征指标包括振动数据的均方根值,无量纲特征指标包括振动数据的偏斜度、峭度指标、波形指标、峰值指标、脉冲指标和裕度指标;根据各振动数据对应的工况类别以及各振动数据的本征模能量、有量纲特征指标和无量纲特征指标构建各振动数据对应的特征属性集合,其中,各振动数据的本征模能量、有量纲特征指标和无量纲特征指标作为条件属性,各振动数据对应的工况类别作为决策属性;对各振动数据对应的特征属性集合进行约简,得到各振动数据对应的约简后的特征属性集合;将各振动数据对应的约简后的特征属性集合作为训练样本,得到多个训练样本。
[0011] 在一个实施例中,对特征属性集合进行约简,得到约简后的特征属性集合,包括:确定特征属性集合的多个条件属性中各条件属性对决策属性的重要度;筛选出重要度大于预设阈值的条件属性,作为目标条件属性;将决策属性和目标条件属性组成的集合确定为约简后的特征属性集合。
[0012] 在一个实施例中,在确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量之后,还包括:根据多个本征模能量,确定压裂装备的能量熵;在根据训练好的分类器模型和多个本征模函数,确定压裂装备的健康状态之后,还包括:获取与压裂装备工作时的工况类型对应的多个能量熵;根据预设的第二关系表和工况类型对应的多个能量熵,对压裂装备的能量熵进行修正,得到压裂装备的修正后的能量熵,其中,预设的第二关系表中包括能量熵范围和健康状态的对应关系。
[0013] 在一个实施例中,根据多个本征模能量,确定压裂装备的能量熵,包括:按照以下公式计算压裂装备的能量熵:
[0014]
[0015] 其中,QEj为目标振动数据xj(t)的能量熵,其中, 其中,Eji为目标振动数据xj(t)的第i个本征模函数对应的本征模能量, SEi为N种不同健康状态下的振动数据xk(t)的第i个本征模函数对应的本征模能量之和,j为大于等于1且小于等于N的整数。
[0016] 本申请实施例还提供了一种压裂装备作业时健康状态的评估装置,包括:获取模,用于获取压裂装备工作时的目标振动数据;分解模块,用于利用集合经验模态分解算法对目标振动数据进行分解,得到多个本征模函数;第一确定模块,用于确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量;第二确定模块,用于根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。
[0017] 本申请实施例还提供一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述任意实施例中所述的压裂装备作业时健康状态的评估方法的步骤。
[0018] 本申请实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意实施例中所述的压裂装备作业时健康状态的评估方法的步骤。
[0019] 在本申请实施例中,提供了一种压裂装备作业时健康状态的评估方法,利用集合经验模态分解算法对获得的压裂装备工作时的目标振动数据进行分解,得到多个本征模函数,然后确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量,根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。上述方案中,通过利用集合经验模态分解算法对目标振动数据进行分解,可以将能够反映装备健康状态的低频信号和高频噪声信号分离开,从而可以克服本征模函数分量之间的模态混叠问题,提高确定健康状态的准确性;之后,确定得到的多个本征模函数中各本征模函数对应的本征模能量,并根据本征模能量和训练好的分类器模型确定压裂装备的健康状态,从而可以准确地评估压裂装备的健康状态,为压裂施工安全有序进行提供技术保障,并帮助操作人员了解压裂装备的健康状态变化,及时捕捉异常状态,并将异常信息直接呈现给操作人员,以便其采取必要措施对设备进行维护和降低施工险。附图说明
[0020] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。在附图中:
[0021] 图1示出了本申请一实施例中的压裂装备作业时健康状态的评估方法的流程图
[0022] 图2示出了本申请一实施例中获得的工况1下的振动数据的示意图;
[0023] 图3示出了本申请一实施例中利用集合经验模态分解算法对图2中的振动数据进行分解后得到的多个本征模分量的示意图;
[0024] 图4示出了本申请一实施例中计算得到的7种工况下多个样本的能量熵的示意图;
[0025] 图5示出了本申请一实施例中确定的各条件属性对决策属性的重要度的示意图;
[0026] 图6示出了本申请一实施例中分别根据对特征属性集合进行约简前后训练得到的分类器模型对测试样本进行识别的准确率的对比图;
[0027] 图7示出了本申请一实施例中对图4中的能量熵进行修正后得到的能量熵的示意图;
[0028] 图8示出了本申请一实施例中的压裂装备作业时健康状态的评估装置的示意图;
[0029] 图9示出了本申请一实施例中的计算机设备的示意图。

具体实施方式

[0030] 下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0031] 本领域的技术人员知道,本申请的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本申请公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
[0032] 在开采页岩气时,往往需要使用水平井和多段压裂技术来提高产量,压裂设备的研制也朝着高压力,大排量方向发展。在单次压裂施工过程中,压裂泵注设备作为主要压裂装备,其健康状态的好坏决定着压裂施工能否顺利进行。为了能够准确地评估压裂装备的健康状态,本申请实施例提供了一种压裂装备作业时健康状态的评估方法,能够准确地评估压裂装备工作时的健康状态。
[0033] 图1示出了本申请一实施例中压裂装备作业时健康状态的评估方法的流程图。虽然本申请提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本申请实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。
[0034] 具体地,如图1所示,本申请一种实施例提供的压裂装备作业时健康状态的评估方法可以包括以下步骤:
[0035] 步骤S101,获取压裂装备工作时的目标振动数据。
[0036] 具体地,在压裂装备工作时,可以由振动传感器检测压裂装备的振动数据,并将振动数据发送至执行本申请提供的压裂装备作业时健康状态的评估方法的计算机。其中,目标振动数据可以是预设时间内振动加速度随时间变化的曲线,或者是预设时间内振动速度随时间变化的曲线,或者是预设时间内振幅随时间变化的曲线,等等。
[0037] 步骤S102,利用集合经验模态分解算法对目标振动数据进行分解,得到多个本征模函数。
[0038] 在获取压裂装备工作时的目标振动数据之后,可以利用集合经验模态分解算法(EEMD,Ensemble Empirical Mode Decomposition)对目标振动数据进行分解,得到多个本征模函数。其中,EEMD算法可以具体包括以下步骤。
[0039] 1)设目标振动数据为x(t),将聚合次数为设置为正整数M,初始化m=1;
[0040] 2)在目标振动数据x(t)中加入幅度系数为k的高斯白噪声k·nm(t),生成新的信号xm(t),表达式如下:
[0041] xm(t)=x(t)+k·nm(t);
[0042] 3)利用经验模态分解算法(EMD,Empirical Mode Decomposition),将xm(t)分解为若干个本征模态函数;
[0043] 4)令m=m+1,当m≤M时,重复步骤2)和3),在步骤2)中每次加入不同序列的高斯白噪声k·nm(t);
[0044] 5)经过M次分解后,可以产生多组IMF(Intrinsic Mode Function,本征模函数)分量,计算每个IMF分量的平均值:
[0045]
[0046] 其中:M为聚合次数;ci,m为由第m次EMD分解得到的第i个IMF分量;
[0047] 6)取每个IMF的M次分解的均值作为最后的IMF分量,此时目标振动数据可由下式表示:
[0048] x(t)=∑ici(t)+r(t)。
[0049] 综上所述,EEMD分解算法能够将任意目标振动数据x(t)分解成若干数量的本征模态函数和一个残余项相加的形式。其中,各个本征模态函数ci(t)(i=1,2,…)的频率成分各不相同,c1(t)的频率成分最高,其余按序号频率依次降低,但不同的振动数据分解得到的本征模态函数频段并不相同,EEMD会令本征模态分量随原始信号特点实现自适应的分解。其中,r(t)为最终的残余项,作为信号的总体趋势的表征。
[0050] 步骤S103,确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量。
[0051] 步骤S104,根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。
[0052] 在得到多个本征模函数之后,确定多个本征模函数中各本征模函数对应的本征模能量。例如,与本征模态函数ci(t)(i=1,2,…)对应的本征模能量为Ei=∑t|ci(t)|2。在得到多个本征模能量之后,可以根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。其中,健康状态为一种描述装备工作状态是否正常的数据。压裂装备的健康状态可以包括:健康、亚健康、轻微故障、故障和严重故障等。其中,分类器模型可以包括以下之一:支持向量机(Support Vector Machine,SVM)模型、BP(Back Propagation,反向传播)神经网络模型、广义回归神经网络(General Regression Neural Network,GRNN)模型、概率神经网络(Probabilistic Neural Network,PNN)模型以及随机森林(Random Forest,RF)模型等。
[0053] 上述实施例中,通过利用集合经验模态分解算法对目标振动数据进行分解,可以将能够反映装备健康状态的低频信号与高频噪声信号分离开,从而可以克服本征模函数分量之间的模态混叠问题,进而提高确定健康状态的准确性;之后,确定得到的多个本征模函数中各本征模函数对应的本征模能量,并根据本征模能量和训练好的分类器模型确定压裂装备的健康状态,从而可以准确地评估压裂装备的健康状态,为压裂施工安全有序进行提供技术保障,并帮助操作人员了解压裂装备的健康状态变化,及时捕捉异常状态,并将异常信息直接呈现给操作人员,以便其采取必要措施对设备进行维护和降低施工风险。
[0054] 在本申请一些实施例中,根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态,可以包括:根据目标振动数据、多个本征模能量和训练好的分类器模型,确定压裂装备工作时的工况类型;根据预设的第一关系表确定工况类型对应的健康状态,其中,预设的第一关系表中包括工况类型与健康状态的对应关系。
[0055] 具体地,在得到多个本征模能量之后,可以根据目标振动数据、多个本征模能量和训练好的分类器模型确定压裂装备工作时的工况类型。例如,分类器模型中包括以下7种工况类型,工况类型1可以对应于工况:压力1MPa,电机频率为20HZ;工况类型2可以对应于工况:压力3MPa,电机频率为30HZ;工况类型3可以对应于工况:压力3-4MPa,电机频率为30HZ,柱塞泵流量不足;工况类型4可以对应于工况:压力4.5MPa,电机频率为50HZ;工况类型5可以对应于工况:压力5MPa,电机频率为30HZ,泵头体磨损;工况类型6可以对应于工况:压力7MPa,电机频率为40HZ;工况类型7可以对应于工况:压力7MPa,电机频率为50HZ。上述工况类型仅是示例性的,可以理解的是,分类器模型可以包括更多种工况类型,包括的工况类型越多,识别的准确性越高。
[0056] 在确定压裂装备当前工作时的工况类型之后,可以根据预设的第一关系表确定该工况类型对应的健康状态。例如,预设的第一关系表可以如表1所示。
[0057] 表1
[0058]
[0059] 如表1所示,在确定压裂装备工作时的工况类型之后,可以根据预设的第一关系表确定对应的健康状态。例如,确定压裂装备工作时的工况类型为工况类型3,则压裂装备目前处于故障状态,需要在短时间内停机检修。一种健康状态可以对应于一种或多种工况类型。相比于将健康状态作为分类器模型的决策属性,将工况类型作为分类器模型的决策属性,可以让用户获悉压裂装备的具体工况参数,并且在对应的健康状态为轻微故障/故障/严重故障时,便于用户根据具体工况参数进行检修或维修。
[0060] 在本申请一些实施例中,在根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态之前,还可以包括:获取多个训练样本,其中,多个训练样本中包括多种工况下的训练样本;利用多个训练样本对预设的分类器模型进行训练,得到训练好的分类器模型。具体地,可以获取多种工况下的训练样本,并利用多个训练样本对预设的分类器模型进行训练,得到训练好的分类器模型。在其他实施例中,还可以获取多种工况下的测试样本,用于检验训练好的分类器模型的识别准确率。通过上述方式,可以得到训练好的分类器模型。
[0061] 在本申请一些实施例中,分类器模型为随机森林模型,获取多个训练样本,可以包括:获取压裂装备在多种工况中各工况下的多个振动数据;利用集合经验模态分解算法对各工况下的多个振动数据中各振动数据进行分解,得到各振动数据对应的多个本征模函数;确定各振动数据对应的多个本征模函数中各本征模函数对应的本征模能量;获取各振动数据的有量纲特征指标和无量纲特征指标,其中,有量纲特征指标包括振动数据的均方根值,无量纲特征指标包括振动数据的偏斜度、峭度指标、波形指标、峰值指标、脉冲指标和裕度指标;根据各振动数据对应的工况类别以及各振动数据的本征模能量、有量纲特征指标和无量纲特征指标构建各振动数据对应的特征属性集合,其中,各振动数据的本征模能量、有量纲特征指标和无量纲特征指标作为条件属性,各振动数据对应的工况类别作为决策属性;对各振动数据对应的特征属性集合进行约简,得到各振动数据对应的约简后的特征属性集合;将各振动数据对应的约简后的特征属性集合作为训练样本,得到多个训练样本。
[0062] 具体地,获取压裂装备在多种工况中各工况下的多个振动数据,即,在各个工况下获取多个样本。随机森林模型是利用多个决策树对样本进行训练并预测的一种分类器模型。为了训练随机森林模型,需要使用多个训练样本进行训练,各训练样本包括多个条件属性和一个决策属性。其中,决策属性可以是该样本所述的工况类型。条件属性可以是该样本的特征属性,例如,条件属性可以包括振动数据的本征模能量以及表征振动数据随时间波动变化性质的有量纲特征指标和无量纲特征指标。其中,有量纲特征指标可以包括振动数据的均方根值。无量纲特征指标可以包括振动数据的偏斜度、峭度指标、波形指标、峰值指标、脉冲指标和裕度指标。可以将得到的多个本征模能量、有量纲特征指标和无量纲特征指标作为特征属性集合。
[0063] 上述特征属性集合中有可能存在冗余属性,会导致建模和识别过程耗时增加,并影响最终的识别准确率。因此可以对特征属性集合进行约简,剔除冗余的属性。例如,可以采用邻域粗糙集方法对特征属性集合进行约简。在对各振动数据对应的特征属性集合进行约简之后,得到各振动数据对应的约简后的特征属性集合。可以将得到的多个约简后的特征属性集合中的一部分作为训练样本,用于对预设的随机森林模型进行训练,得到训练好的随机森林模型。而且,将得到的多个约简后的特征属性集合中的另一部分作为测试样本,用于对训练好的随机森林模型进行检测,以确定其分类的准确性。通过上述方式,可以提高训练随机森林模型的效率和成本,并且能够提高训练好的随机森林模型预测的准确性。
[0064] 进一步地,在本申请一些实施例中,对特征属性集合进行约简,得到约简后的特征属性集合,可以包括:确定特征属性集合的多个条件属性中各条件属性对决策属性的重要度;筛选出重要度大于预设阈值的条件属性,作为目标条件属性;将决策属性和目标条件属性组成的集合确定为约简后的特征属性集合。
[0065] 具体地,可以使用邻域粗糙集的方法,计算每个条件属性对决策属性的重要度,根据每个条件属性的重要度大小,对条件属性进行约简。例如,可以将重要度大于预设阈值的条件属性筛选出来,作为目标条件属性,并将决策属性和目标条件属性组成的集合确定为约简后的特征属性集合。在其他实施例中,可以将重要度从大到小排序,并将排在前面预设位数的重要度对应的条件属性作为目标条件属性。通过上述方式,可以对特征属性集合进行约简。
[0066] 为了对比不同分类器模型之间的性能差异,可以选取支持向量机(Support Vector Machine,SVM)模型、BP(Back Propagation,反向传播)神经网络模型、广义回归神经网络(General Regression Neural Network,GRNN)模型、概率神经网络(Probabilistic Neural Network,PNN)模型以及随机森林(Random Forest,RF)模型,分别对其识别准确率、建模耗时和识别耗时进行对比。每个输入样本共10个特征属性,包含邻域粗糙集方法约简后的9个属性(条件属性)和对应的工况类型(决策属性)。随机选择372个训练样本,构造372×10的训练矩阵,使用训练矩阵构建相应的识别模型,并统计建模耗时。然后使用训练好的模型进行1000次分类识别,每次从总样本中随机选择35个样本作为测试集,并统计1000次分类识别耗时。
[0067] 经过计算对比之后可以得出,SVM模型的识别准确率最高,但其建模过程耗时最长,主要是因为SVM模型构建过程中,使用交叉验证的方法寻找最佳的参数,当样本量大时,耗时也会相应增加。其中,随机森林模型在构建模型过程中耗时最短,并且进行1000次分类识别后得到的识别准确率较高,而且总识别耗时不到20秒,识别耗时较短。具体地,可以根据实际需要选取上述多种分类器模型中的一种。在本申请一些实施例中,分类器模型为随机森林模型。
[0068] 在本申请一些实施例中,在确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量之后,还可以包括:根据多个本征模能量,确定压裂装备的能量熵;在根据训练好的分类器模型和多个本征模函数,确定压裂装备的健康状态之后,还包括:获取与压裂装备工作时的工况类型对应的多个能量熵;根据预设的第二关系表和工况类型对应的多个能量熵,对压裂装备的能量熵进行修正,得到压裂装备的修正后的能量熵,其中,预设的第二关系表中包括能量熵范围和健康状态的对应关系。
[0069] 具体地,能量熵可以用于表示振动数据分解后得到的本征模能量分布的杂乱程度。在确定目标振动数据对应的多个本征模能量之后,可以根据多个本征模能量确定压裂装备的能量熵。在一些实施例中,可以通过计算压裂装备在平稳运行状态下振动数据的能量熵,并记为 将根据任意工况下振动数据计算所得的能量熵与 进行比较,即可判断装备当前运行状况的好坏。
[0070] 考虑到在某些工况条件下能量熵计算结果区分不明显,导致不易判断装备的当前健康状态,因此,可以对计算得到的能量熵进行修正。在根据训练好的分类器模型、目标振动数据和多个本征模函数确定出压裂装备工作时的工况类型后,可以获取与工况类型对应的多个能量熵。其中,获取与工况类型对应的多个能量熵,可以是在训练分类器模型时,获取的该工况类型下的多个振动数据对应的能量熵。之后,根据预设的第二关系表确定与压裂装备的健康状态对应的能量熵取值范围。其中,预设的第二关系表可以如表2所示。
[0071] 表2
[0072]
[0073] 由表2可知,不同健康状态下的能量熵取值范围区分显著。例如,在健康状态为亚健康的情况下,对应的能量熵取值范围为0.2≤QE<0.4。例如,获得的与该工况类型对应的多个能量熵组成的能量熵矩阵为[1 2 4 2 6],先前计算的压裂装备工作时的目标振动数据对应的能量熵为3,则根据能量熵取值范围[0.2,0.4)和能量熵矩阵[1 2 4 2 6]对计算得到的能量熵3进行修正。例如,可以采用matlab中的mapminmax函数来进行修正,可以得到修正后的能量熵为0.28。上述实施例仅是示例性的,一般情况下能量熵矩阵中的元素的数目较多,这样可以使得修正后的能量熵结果更加准确。
[0074] 上述实施例中的方法,在通过分类器模型确定压裂装备当前的工况类型和健康状态的基础上,可以对压裂装备当前的能量熵进行修正,得到修正后的能量熵,使得不同工况下的能量熵明显区别开来,以便及时显示设备的异常状态,方便操作人员采取进一步控制措施。此外,在实时获取压裂装备的目标振动数据(例如,每隔预设时间间隔获取一次目标振动数据)的情况下,可以实时得到修正后的能量熵,根据能量熵的波动变化,可以实时评估压裂装备长周期连续作业下的健康状态,为压裂施工安全有序进行提供技术保障,并帮助操作人员了解压裂装备的健康状态变化,及时捕捉异常状态。
[0075] 在本申请一些实施例中,根据多个本征模能量,确定压裂装备的能量熵,可以包括:按照以下公式计算压裂装备的能量熵:
[0076]
[0077] 其中,QEj为目标振动数据xj(t)的能量熵,其中, 其中,Eji为目标振动数据xj(t)的第i个本征模函数对应的本征模能量, SEi为N种不同健康状态下的振动数据xk(t)的第i个本征模函数对应的本征模能量之和,j为大于等于1且小于等于N的整数。
[0078] 具体地,设实验测得N组不同状态下的振动数据,且信号长度相同,设第j组振动数据xj(t)={xj1,xj2,…,xjT}为目标振动数据,j为大于等于1且小于等于N的整数,目标振动数据的EEMD分解结果如下:
[0079] xj(t)=∑icji(t)+rj(t);t=1,2,…,T;i=1,2,…,I;
[0080] 其中:cji(t)表示信号xj(t)完成EEMD分解后得到的第i个IMF分量,T为时间序列长度,j=1,2,…,N,I为IMF分量的总个数;
[0081] 目标振动数据xj(t)分解后得到的各IMF分量对应的本征模能量为:Eji=∑t|cji(t)|2,i=1,2,…,I。可以得到,第j组信号分解后各本征模能量矩阵为Ej=[Ej1,Ej2,…,EjI],在求出N组不同状态下的振动数据中各组振动数据的本征模能量矩阵后,计算下式:
[0082]
[0083] 其中,SEi表示对N组振动数据中的第i个IMF分量能量求和;
[0084] 接下来,计算第j组振动数据xj(t)分解后各本征模能量所占比重:
[0085]
[0086] 则,目标振动数据的xj(t)的能量熵如下式:
[0087]
[0088] 通过上述方式,可以计算得到目标振动数据对应的能量熵。
[0089] 下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本申请,并不构成对本申请的不当限定。
[0090] 在本实施例中,设计并搭建了柱塞泵故障模拟实验平台。该柱塞泵故障模拟实验平台包含以下设备单元:3D2-SZ型柱塞泵(额定工作压力10MPa,流量57L/min)、3D2-SZ-QR型强制润滑系统、耐震压力表(量程10MPa)、3D2-SZ-DF型单项溢流、3D2-SZ-AF型安全阀、HNK-4-11型变频控制柜(含压力显示、流量显示、油压显示、油温显示,所有数据实时传输、数据读取、U盘存储、含传感器、液晶显示)、Y160M-4-11型变频电机(电压380V,功率11kW)、流量计2台、3D2-Y160M型底盘总成、250L循环用水箱、备件箱等。
[0091] 放置泵头体振动传感器,分别进行以下工况实验,并采集以下工况对应的泵头体振动数据:
[0092] 工况1:压力1MPa,电机频率为20HZ(69个样本);
[0093] 工况2:压力3MPa,电机频率为30HZ(101个样本);
[0094] 工况3:压力3-4MPa,电机频率为30HZ,柱塞泵流量不足(53个样本);
[0095] 工况4:压力4.5MPa,电机频率为50HZ(33个样本);
[0096] 工况5:压力5MPa,电机频率为30HZ,泵头体磨损(37个样本);
[0097] 工况6:压力7MPa,电机频率为40HZ(81个样本);
[0098] 工况7:压力7MPa,电机频率为50HZ(33个样本)。
[0099] 如图2所示,示出了工况1下的振动数据的示意图,即振动加速度随时间变化的曲线。
[0100] 在本实施例中,压裂装备作业时健康状态的评估方法可以包括以下步骤。
[0101] 步骤1,根据EEMD分解,计算设备当前能量熵。其中,步骤1包括以下子步骤。
[0102] 子步骤1.1:振动数据的本征模函数IMF求解。具体地,以图2中工况1的振动数据为例,选取4000个数据点,进行EEMD分解,分解前先对数据进行标准化处理,然后设置分解参数Nstd(高斯白噪声的标准差)为0.2,NE(白噪声添加次数)为30。分解后的结果如图3所示。其中,最上面的曲线图为原始振动数据,最下面的曲线图为残余项,中间的10个曲线图为IMF分量。对所有样本中的振动数据进行EEMD分解,得到对应的IMF分量。
[0103] 子步骤1.2:能量熵求解。具体地,根据步骤1.1求得的IMF分量,计算各工况下振动数据的能量熵值,结果如图4所示。从图4中可以看出,工况4和工况7对应计算所得能量熵较高,工况1能量熵最低,并且工况2、工况3和工况5结果区分不明显。从图4中大致能看出压裂装备的健康状态的变化趋势。
[0104] 步骤2,压裂装备健康状态识别。其中,步骤2包括以下几个子步骤。
[0105] 子步骤2.1:特征属性集合构建。具体地,首先根据振动数据随时间波动变化的性质,选择每个样本的均方根值、偏斜度、峭度指标、波形指标、峰值指标、脉冲指标、裕度指标作为条件属性;对每一个样本进行EEMD分解,选取IMF分量对应的IMF能量分别作为条件属性;将每个样本所属的类别作为决策属性。综上,属性特征表可以如表3所示:
[0106] 表3
[0107]
[0108] 对以上7种工况的407个样本分别计算属性表中的前17个条件属性值,最后加上决策属性值,组成一个407×18的矩阵。在每个工况样本中随机选取5个样本作为测试集,剩下样本作为训练集来训练随机森林模型,并使用测试集以检验训练好的随机森林模型的识别准确率。
[0109] 步骤2.2:特征属性集合约简。具体地,使用邻域粗糙集的方法,计算每个条件属性ai对决策属性D的重要度,根据每个条件属性的重要度大小,对条件属性进行约简,17个条件属性的重要度计算结果如图5所示。从图5中可以看出序号为1、2、3、8、9、10、14、15和16的属性的重要度较高,因此选择这9个属性作为输入样本的特征属性,即作为目标条件属性,与决策属性组成约简后的特征属性集合。
[0110] 步骤2.3:基于随机森林模型的健康状态识别。具体地,随机选择372个训练样本,每个样本选择根据邻域粗糙集方法约简后的9个属性特征(条件属性)和最后的工况类型(决策属性)作为属性集合,构造372×10的训练矩阵和35×10的测试矩阵,随机森林决策树颗数设为350,分别进行1000次分类识别。图6示出了本申请一实施例中分别根据对特征属性集合进行约简前后训练得到的随机森林模型对测试样本进行识别的准确率的对比图。从图6中可以看出,基于邻域粗糙集的属性约简方法,能够提高识别准确率,而且减少了模型输入的条件属性个数,提高了随机森林建模效率(属性约简前建模耗时0.4062秒,属性约简后建模耗时0.1875秒)。
[0111] 步骤3,能量熵结果修正。具体地,根据各工况压力、电机频率以及故障类别的不同,可以将7种工况划分为不同的健康状态:工况1(健康)、工况2(亚健康)、工况3(故障)、工况4(轻微故障)、工况5(严重故障)、工况6(亚健康)、工况7(轻微故障)。根据各健康状态的能量熵取值范围,对图4中的能量熵结果进行修正,得到修正后的能量熵结果,如图7所示。从图7可以看出,在根据随机森林模型识别工况类型的基础上,根据工况类型确定所对应的健康状态,对根据振动数据计算所得的能量熵进行区间修正,修正以后的各工况下的能量熵区分显著。由于随机森林模型识别准确率高达98%,所以修正结果可信度较高。
[0112] 步骤4,确定压裂装备当前工作时的健康状态和能量熵。具体地,可以获取当前压裂装备的目标振动数据,对目标振动数据进行EEMD分解,得到多个本征模函数,确定各本征模函数对应的本征模能量,根据多个本征模能量确定当前压裂装备的能量熵。根据多个本征模能量、目标振动数据的有量纲特征指标和无量纲特征指标以及训练好的随机森林模型,确定压裂装备当前的工况类型。根据工况类型与健康状态的对应关系,确定当前工况类型对应的健康状态。根据健康状态与能量熵取值范围的对应关系,确定当前健康状态对应的能量熵取值范围。根据当前健康状态对应的能量熵取值范围以及当前工况类型对应的多个能量熵,对计算得到的当前压裂装备的能量熵进行修正,得到修正后的能量熵。可以实时获取压裂装备工作时的目标振动数据,并实时确定压裂装备的修正后的能量熵,从而可以实时评估压裂装备在长周期连续作业下的工作健康状态。
[0113] 上述实施例中的方法,针对压裂施工现场设备故障特征提取困难的问题,提出了基于EEMD分解得到的能量熵评价压裂装备健康状态的方法,利用EEMD分解,将能够反映设备状态的低频信号和高频环境噪声信号分离开,并计算分解所得多组信号的能量熵,来反映设备运行状态的复杂程度。进一步地,针对某些工况条件下能量熵计算结果区分不明显的问题,提出了基于随机森林模型的样本工况类型识别方法,随机森林模型的建模耗时短、识别准确率高且识别耗时短,可以提高健康状态识别的准确性和效率。在根据随机森林模型识别样本工况类型的基础上,对计算所得能量熵进行区间修正,使得不同工况计算的能量熵区分更加显著,以便及时显示设备的异常状态,方便操作人员采取进一步控制措施。
[0114] 基于同一发明构思,本申请实施例中还提供了一种压裂装备作业时健康状态的评估装置,如下面的实施例所述。由于压裂装备作业时健康状态的评估装置解决问题的原理与压裂装备作业时健康状态的评估方法相似,因此压裂装备作业时健康状态的评估装置的实施可以参见压裂装备作业时健康状态的评估方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图8是本申请实施例的压裂装备作业时健康状态的评估装置的一种结构框图,如图8所示,包括:获取模块801、分解模块802、第一确定模块803和第二确定模块804,下面对该结构进行说明。
[0115] 获取模块801用于获取压裂装备工作时的目标振动数据。
[0116] 分解模块802用于利用集合经验模态分解算法对目标振动数据进行分解,得到多个本征模函数。
[0117] 第一确定模块803用于确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量。
[0118] 第二确定模块804用于根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态。
[0119] 在本申请一些实施例中,第二确定模块可以具体用于:根据目标振动数据、多个本征模能量和训练好的分类器模型,确定压裂装备工作时的工况类型;根据预设的第一关系表确定工况类型对应的健康状态,其中,预设的第一关系表中包括工况类型与健康状态的对应关系。
[0120] 在本申请一些实施例中,该装置还可以包括训练模块,所述训练模块可以具体用于:在根据训练好的分类器模型和多个本征模能量,确定压裂装备的健康状态之前,获取多个训练样本,其中,多个训练样本中包括多种工况下的训练样本;利用多个训练样本对预设的分类器模型进行训练,得到训练好的分类器模型。
[0121] 在本申请一些实施例中,分类器模型为随机森林模型,获取多个训练样本,可以包括:获取压裂装备在多种工况中各工况下的多个振动数据;利用集合经验模态分解算法对各工况下的多个振动数据中各振动数据进行分解,得到各振动数据对应的多个本征模函数;确定各振动数据对应的多个本征模函数中各本征模函数对应的本征模能量;获取各振动数据的有量纲特征指标和无量纲特征指标,其中,有量纲特征指标包括振动数据的均方根值,无量纲特征指标包括振动数据的偏斜度、峭度指标、波形指标、峰值指标、脉冲指标和裕度指标;根据各振动数据对应的工况类别以及各振动数据的本征模能量、有量纲特征指标和无量纲特征指标构建各振动数据对应的特征属性集合,其中,各振动数据的本征模能量、有量纲特征指标和无量纲特征指标作为条件属性,各振动数据对应的工况类别作为决策属性;对各振动数据对应的特征属性集合进行约简,得到各振动数据对应的约简后的特征属性集合;将各振动数据对应的约简后的特征属性集合作为训练样本,得到多个训练样本。
[0122] 在本申请一些实施例中,对特征属性集合进行约简,得到约简后的特征属性集合,可以包括:确定特征属性集合的多个条件属性中各条件属性对决策属性的重要度;筛选出重要度大于预设阈值的条件属性,作为目标条件属性;将决策属性和目标条件属性组成的集合确定为约简后的特征属性集合。
[0123] 在本申请一些实施例中,该装置还可以包括修正模块,所述修正模块可以具体用于:在确定多个本征模函数中各本征模函数对应的本征模能量,得到多个本征模能量之后,根据多个本征模能量,确定压裂装备的能量熵;在根据训练好的分类器模型和多个本征模函数,确定压裂装备的健康状态之后,获取与压裂装备工作时的工况类型对应的多个能量熵;根据预设的第二关系表和工况类型对应的多个能量熵,对压裂装备的能量熵进行修正,得到压裂装备的修正后的能量熵,其中,预设的第二关系表中包括能量熵范围和健康状态的对应关系。
[0124] 在本申请一些实施例中,根据多个本征模能量,确定压裂装备的能量熵,可以包括:按照以下公式计算压裂装备的能量熵:
[0125]
[0126] 其中,QEj为目标振动数据xj(t)的能量熵,其中, 其中,Eji为目标振动数据xj(t)的第i个本征模函数对应的本征模能量, SEi为N种不同健康状态下的振动数据xk(t)的第i个本征模函数对应的本征模能量之和,j为大于等于1且小于等于N的整数。
[0127] 从以上的描述中,可以看出,本申请实施例实现了如下技术效果:通过利用集合经验模态分解算法对目标振动数据进行分解,可以将能够反映装备健康状态的低频信号和高频噪声信号分离开,从而可以克服本征模函数分量之间的模态混叠问题,提高确定健康状态的准确性;之后,确定得到的多个本征模函数中各本征模函数对应的本征模能量,并根据本征模能量和训练好的分类器模型确定压裂装备的健康状态,从而可以准确地评估压裂装备的健康状态,为压裂施工安全有序进行提供技术保障,并帮助操作人员了解压裂装备的健康状态变化,及时捕捉异常状态,并将异常信息直接呈现给操作人员,以便其采取必要措施对设备进行维护和降低施工风险。
[0128] 本申请实施方式还提供了一种计算机设备,具体可以参阅图9所示的基于本申请实施例提供的压裂装备作业时健康状态的评估方法的计算机设备组成结构示意图,所述计算机设备具体可以包括输入设备91、处理器92、存储器93。其中,所述存储器93用于存储处理器可执行指令。所述处理器92执行所述指令时实现上述任意实施例中所述的压裂装备作业时健康状态的评估方法的步骤。
[0129] 在本实施方式中,所述输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。所述输入设备可以包括键盘鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
[0130] 在本实施方式中,该计算机设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
[0131] 本申请实施方式中还提供了一种基于压裂装备作业时健康状态的评估方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现上述任意实施例中所述压裂装备作业时健康状态的评估方法的步骤。
[0132] 在本实施方式中,上述存储介质包括但不限于随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard Disk Drive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口
[0133] 在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
[0134] 显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。
[0135] 应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本申请的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。
[0136] 以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈