首页 / 专利分类库 / 液体变容式机械;液体泵或弹性流体泵 / 非变容式泵 / 基于LSTM神经网络压气机失速预测方法、装置、设备及介质

基于LSTM神经网络压气机失速预测方法、装置、设备及介质

申请号 CN202311768344.2 申请日 2023-12-21 公开(公告)号 CN117909930A 公开(公告)日 2024-04-19
申请人 中国科学院工程热物理研究所; 发明人 李继超; 邓雨阳; 刘景源; 彭峰; 张宏武;
摘要 本 发明 实施例 提供了一种基于LSTM神经网络 压气机 失速 预测方法、装置、设备及介质,涉及轴流压气机失速预测技术领域,该方法包括获取压气机机匣壁面上同一时间段的两个不同 位置 的动态压 力 信号 ,包括稳态到失速过程;其中一个位置的动态压力信号作为训练集,另一个位置的动态压力信号作为测试集;对训练集和测试集进行预处理;对基于LSTM神经网络的待训练压气机失速 预测模型 的超参数进行设定;基于超参数,利用预处理后的训练集对压气机失速预测模型进行训练,获得压气机失速预测模型;利用测试集对压气机失速预测模型的有效性进行判断;有效性判断通过后进行失速预测。该方案提高了压气机失速预测的准确性。
权利要求

1.一种基于LSTM神经网络压气机失速预测方法,其特征在于,包括:
获取压气机机匣壁面上同一时间段的两个不同位置的动态压信号,所述动态压力信号包括稳态到失速过程;所述两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,所述两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;
对所述训练集和所述测试集进行预处理;
对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;
基于所述超参数,利用预处理后的所述训练集对所述压气机失速预测模型进行训练,获得压气机失速预测模型;
利用所述测试集对所述压气机失速预测模型的有效性进行判断;
利用通过有效性判断的所述压气机失速预测模型对压气机进行失速预测。
2.如权利要求1所述的基于LSTM神经网络压气机失速预测方法,其特征在于,所述对所述训练集和所述测试集进行预处理,包括:
对所述训练集和所述测试集进行降频处理;
对降频后的所述训练集进行标准化处理,消除数据中尺度和单位的影响,减少特征间规模差异对所述待训练压气机失速预测模型训练的影响。
3.如权利要求1所述的基于LSTM神经网络压气机失速预测方法,其特征在于,所述超参数包括结构超参数,所述结构超参数包括输入特征的数量、输出的响应数以及LSTM层中隐藏单元的数量。
4.如权利要求3所述的基于LSTM神经网络压气机失速预测方法,其特征在于,所述超参数还包括算法超参数,所述算法超参数包括采用的优化算法类型、训练的最大轮次、每次迭代更新权重的数据子集的大小、初始学习率、学习率下降之前的轮次数、学习率下降因子以及梯度裁剪阈值
5.如权利要求1所述的基于LSTM神经网络压气机失速预测方法,其特征在于,所述利用所述测试集对所述压气机失速预测模型的有效性进行判断,包括:
将所述测试集中未发生失速状态的测试数据输入到所述压气机失速预测模型中;
根据所述压气机失速预测模型的自学习和预测机制,输出失速预测的失速起始点;
将所述失速预测的失速起始点与所述测试集中的失速起始点进行对比;
根据对比结果对所述压气机失速预测模型的有效性进行判断。
6.如权利要求5所述的基于LSTM神经网络压气机失速预测方法,其特征在于,所述预测机制采用递归预测机制。
7.如权利要求1‑6任一项所述的基于LSTM神经网络压气机失速预测方法,其特征在于,所述LSTM神经网络的结构包括遗忘单元、输入门单元、输出门单元和细胞状态更新单元。
8.一种基于LSTM神经网络压气机失速预测装置,其特征在于,包括:
获取模,用于获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,所述动态压力信号包括稳态到失速过程;所述两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,所述两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;
预处理模块,用于对所述训练集和所述测试集进行预处理;
参数设定模块,用于对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;
训练模块,用于基于所述超参数,利用预处理后的所述训练集对所述压气机失速预测模型进行训练,获得压气机失速预测模型;
判断模块,用于利用所述测试集对所述压气机失速预测模型的有效性进行判断;
失速预测模块,用于利用通过有效性判断的所述压气机失速预测模型对压气机进行失速预测。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的基于LSTM神经网络压气机失速预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至7中任一项所述的基于LSTM神经网络压气机失速预测方法的计算机程序。

说明书全文

基于LSTM神经网络压气机失速预测方法、装置、设备及介质

技术领域

[0001] 本发明涉及轴流压气机失速预测技术领域,特别涉及一种基于LSTM神经网络压气机失速预测方法、装置、设备及介质。

背景技术

[0002] 航空发动机被视为现代航空工业的核心要素,对于民用和军用飞行器而言,其稳定性和效率直接影响着飞行器的性能、安全性以及经济性。在航空发动机的众多关键组件中,压气机起着至关重要的作用,它负责对气体进行压缩,以为后续的燃烧过程提供高压和高温的空气。
[0003] 然而,在特定工况下,航空发动机可能会发生失速现象。失速是发动机的某些部分无法正常运行,导致整体性能下降,甚至可能导致发动机故障。压气机失速是这一现象中的一个特定情况,它是由于某些不稳定的气流现象引起的。具体而言,当气流无法沿着叶片表面顺畅流动,而是与叶片表面分离时,就可能发生失速。这种失速可能是局部的,也可能是全局的,但不管是哪种情况,都可能导致压气机的效率急剧下降,甚至引发机械振动和结构损坏。
[0004] 为了有效地检测和预防压气机失速,目前存在多种方法。首先,基于物理原理的模型预测是一种常见方法,它利用模型来描述气流在压气机中的行为,并预测失速的可能性。其次,实时数据监测是另一种方法,基于它通过监测发动机运行时的各种参数,如温度、压等,来检测失速的迹象。此外,各种传感器的检测也被广泛应用,这些传感器可以监测气流的状态和叶片的运动,以及其他与失速相关的信息。
[0005] 然而,这些方法存在一些缺点。基于物理原理的模型预测通常依赖于精确的气流数据和复杂的计算,可能在实际应用中难以实现。实时数据监测受到噪音和干扰的影响,可能无法准确地检测失速。传感器检测也可能受到传感器故障或损坏的影响,导致误报或漏报。

发明内容

[0006] 有鉴于此,本发明实施例提供了一种基于LSTM神经网络压气机失速预测方法,以解决现有技术中的基于物理原理的模型计算复杂导致难于应用,以及实际测试数据无法准确获得的技术问题。该方法包括:
[0007] 获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,所述动态压力信号包括稳态到失速过程;所述两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,所述两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;
[0008] 对所述训练集和所述测试集进行预处理;
[0009] 对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;
[0010] 基于所述超参数,利用预处理后的所述训练集对所述压气机失速预测模型进行训练,获得压气机失速预测模型;
[0011] 利用所述测试集对所述压气机失速预测模型的有效性进行判断;
[0012] 利用通过有效性判断的所述压气机失速预测模型对压气机进行失速预测。
[0013] 本发明实施例还提供了一种基于LSTM神经网络压气机失速预测装置,以解决现有技术中基于物理原理的模型计算复杂导致难于应用,以及实际测试数据无法准确获得的技术问题。该装置包括:
[0014] 获取模,用于获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,所述动态压力信号包括稳态到失速过程;所述两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,所述两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;
[0015] 预处理模块,用于对所述训练集和所述测试集进行预处理;
[0016] 参数设定模块,用于对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;
[0017] 训练模块,用于基于所述超参数,利用预处理后的所述训练集对所述压气机失速预测模型进行训练,获得压气机失速预测模型;
[0018] 判断模块,用于利用所述测试集对所述压气机失速预测模型的有效性进行判断;
[0019] 失速预测模块,用于利用通过有效性判断的所述压气机失速预测模型对压气机进行失速预测。
[0020] 本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意的基于LSTM神经网络压气机失速预测方法,以解决现有技术中基于物理原理的模型计算复杂导致难于应用,以及实际测试数据无法准确获得的技术问题。
[0021] 本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述任意的基于LSTM神经网络压气机失速预测方法的计算机程序,以解决现有技术中基于物理原理的模型计算复杂导致难于应用,以及实际测试数据无法准确获得的技术问题。
[0022] 与现有技术相比,本说明书实施例采用的上述至少一个技术方案能够达到的有益效果至少包括:获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,动态压力信号包括稳态到失速过程;两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;对训练集和测试集进行预处理;对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;基于超参数,利用预处理后的训练集对压气机失速预测模型进行训练,获得压气机失速预测模型;利用测试集对压气机失速预测模型的有效性进行判断;利用通过有效性判断的压气机失速预测模型对压气机进行失速预测。本申请基于深度学习的LSTM模型,通过捕捉时间序列中的长期依赖和非线性模式,为轴流压气机失速提供了准确性的预测,超越了传统方法的局限性,能够自动学习数据特征并适应不同工况,从而实现对关键性失速事件的预测和防范。附图说明
[0023] 为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0024] 图1是本发明实施例提供的基于LSTM神经网络压气机失速预测方法的流程图
[0025] 图2是本发明实施例提供的LSTM结构层示意图;
[0026] 图3是本发明实施例提供的压气机失速预测模型获得的失速预测数据与实际测试数据的比较图;
[0027] 图4是本发明实施例提供的一种计算机设备的结构框图
[0028] 图5是本发明实施例提供的一种基于LSTM神经网络压气机失速预测装置的结构框图。
[0029] 图中:1、遗忘单元;2、输入门单元;3、输出门单元;4、细胞状态更新单元。

具体实施方式

[0030] 下面结合附图对本申请实施例进行详细描述。
[0031] 以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0032] 申请人研究发现,近年来,深度学习作为人工智能的一个重要领域,在各个应用领域取得了巨大的成功。长短时记忆网络(LSTM)是深度学习中的一种特殊类型的循环神经网络,特别适用于处理和预测时间序列数据。鉴于压气机失速与时间序列数据密切相关,因此采用LSTM模型可能为失速的预测和检测提供一种新的、更高效和更准确的方法。
[0033] 基于上述背景,采用LSTM进行压气机失速的预测具有前瞻性和实际应用价值,有望解决传统方法存在的一些问题。
[0034] 本申请为了解决上述问题,提出了一种基于LSTM神经网络压气机失速预测方法,下面对本申请相关的LSTM神经网络技术术语进行说明。
[0035] 1、LSTM的定义
[0036] LSTM(Long Short‑Term Memory)是递归神经网络(RNN)的一个变种。RNN由于梯度消失或梯度爆炸问题在长序列中难以捕获长期依赖关系。LSTM通过引入特殊的内部结构来解决这些问题,使其能够更有效地学习长期依赖。
[0037] 2、LSTM的结构
[0038] LSTM主要结构包括四个部分,分别是遗忘门、输入门、输出门、细胞状态更新。
[0039] (1)遗忘门
[0040] 遗忘门的任务是决定细胞状态应该遗忘或丢弃哪些信息。在某种程度上,它是LSTM中最重要的一个组件,因为它允许模型放弃那些不再重要或不再相关的信息。其作用是如果遗忘门的输出接近1,那么过去的信息将会被保存;如果输出接近0,那么过去的信息将会被遗忘。其表达公式为:
[0041] ft=σ(Wf·[ht‑1,xt]+bf),
[0042] 其中,ft为当前时刻的遗忘门输出,xt表示在t时间步的输入,ht‑1表示上个时间步的输出,σ是sigmoid激活函数,W是权重,b是偏置。
[0043] (2)输入门
[0044] 输入门负责决定哪些新的信息会被更新或写入细胞状态。这个门有两部分:第一部分决定将更新哪些值,第二部分是一个tanh层,其为双曲正切激活函数,将值压缩到‑1和1之间。它创建一个新的候选值向量,这些值可能会被加到细胞状态中。其作用是确定更新细胞状态的哪些部分,同时创建可能的更新值的候选集。下面是其表达公式:
[0045] it=σ(Wi·[ht‑1,xt]+bi)
[0046]
[0047] 其中,it当前时刻的输入门输出, 当前时刻的候选细胞状态。
[0048] (3)输出门
[0049] 最后,需要决定基于细胞状态输出什么值。但是,先不直接输出细胞状态的值,只输出细胞状态的一个过滤版本。首先,运行一个sigmoid层来确定细胞状态的哪一部分将被输出。接着,将细胞状态通过tanh函数(将值压缩到‑1到1之间)并与sigmoid门的输出相乘,以得到想要输出到下一个隐藏状态的部分。其主要作用是确定从细胞状态中输出哪些信息同时根据细胞状态生成下一个隐藏状态。下面是输出门表达公式:
[0050] ot=σ(Wo·[ht‑1,xt]+bo)
[0051] ht=ot·tanh(Ct),
[0052] 其中,ot当前时刻的输出门输出,ht表示当前时间步的输出。
[0053] 各个门之间的关系是遗忘门决定要遗忘细胞状态中的哪些信息,输入门确定要在细胞状态中更新哪些新信息,输出门基于细胞状态决定输出什么,此输出将用于此时间的预测,并传递到下一个LSTM单元。这三个门的协同工作使得LSTM能够自动地学习对于不同的问题应该保存和遗忘哪些信息,这是其在处理长序列和长期依赖时相比传统RNN表现出色的原因。
[0054] (4)细胞更新状态
[0055] 细胞状态是LSTM的核心,它为整个网络提供了一种“记忆”机制,这是LSTM的长期记忆部分,能够在多个时间步骤中携带信息。细胞状态的更新涉及两个关键步骤:首先,通过遗忘门丢弃不再需要的信息;其次,通过输入门添加新的有关信息。细胞状态的更新包括以下步骤:
[0056] 首先,LSTM中的遗忘门负责决策,确定细胞状态中哪些信息应当被遗忘或保留。其后,输入门负责决策细胞状态中的信息更新策略。具体地说,这一过程可以分为两个主要部分。在第一部分,输入门本身权衡并决定哪些新的信息值应当被考虑进入细胞状态。随后,在第二部分,一个具有tanh激活函数的网络层生成一个新的候选值向量,这些值在适当的情况下可能会被纳入细胞状态。在这两个关键步骤之后,细胞状态将进行更新。原有的细胞状态,记作Ct‑1,经过遗忘门处理后,某些不再需要的信息将被遗弃。紧接着,这个状态将与新的候选值结合,这些候选值是经过输入门调节后的结果。从数学的度表示,其更新策略可以用特定的公式来描述,如下所示:
[0057]
[0058] 3、LSTM的类型
[0059] 3.1、LSTM回归
[0060] 在回归问题中,目标是预测一个或多个连续值的输出,而不是将输入分类到不同的类别中。LSTM回归通常用于时间序列预测,其结构如下:
[0061] (1)输入层:接收序列数据,通常是时间步的特征向量
[0062] (2)LSTM层:一个或多个LSTM层用于处理序列数据。每个LSTM单元包含三个门:输入门、遗忘门和输出门,以及一个细胞状态,这些结构帮助网络记住长期和短期的信息;
[0063] (3)全连接层:LSTM层后面通常会有一个或多个全连接层,用于将LSTM的输出转换为预测值;
[0064] (4)输出层:输出层产生预测的连续值。对于单变量预测,输出层只有一个神经元;对于多变量预测,输出层有多个神经元,每个神经元对应一个预测目标。
[0065] 3.2、LSTM分类
[0066] 在分类问题中,目标是将输入数据分配到预定义的类别中。LSTM分类适用于各种序列分类任务,其结构如下:
[0067] (1)输入层:和回归类似,接收序列数据;
[0068] (2)LSTM层:一个或多个LSTM层,用于提取序列中的特征并记住重要的时间依赖性;
[0069] (3)全连接层:用于将LSTM层的输出映射到一个更高层次的特征空间;
[0070] (4)输出层:输出层通常是一个具有softmax激活函数的全连接层,它将网络的输出转换为概率分布,表示输入属于每个类别的概率。
[0071] 在本发明实施例中,提出了一种基于LSTM神经网络压气机失速预测方法,如图1所示,该方法包括:
[0072] 步骤S101、获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,所述动态压力信号包括稳态到失速过程;所述两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,所述两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;
[0073] 步骤S102、对所述训练集和所述测试集进行预处理;
[0074] 步骤S103、对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;
[0075] 步骤S104、基于所述超参数,利用预处理后的所述训练集对所述压气机失速预测模型进行训练,获得压气机失速预测模型;
[0076] 步骤S105、利用所述测试集对所述压气机失速预测模型的有效性进行判断;
[0077] 步骤S106、利用通过有效性判断的所述压气机失速预测模型对压气机进行失速预测。
[0078] 具体实施时,利用搭建的低速压气机试验台采集到的压力数据信号来验证LSTM神经网络对压气机失速预测的有效性和优越性。所有试验都在配置为处理器为AMD Ryzen 7 5800H with Radeon Graphics,16G内存,windows11系统的电脑,通过Matlab语言运行。
[0079] 具体实施时,通过压力信号采集装置在所搭建的低速压气机上获得机匣壁面由稳态至失速过程的动态压力变化信号。在采集到的动态压力变化信号中选取两个不同位置的传感器上收集的同一时间段的动态压力信号。
[0080] 在一个实施例中,参照图2,所述LSTM神经网络的结构包括遗忘门单元1、输入门单元2、输出门单元3和细胞状态更新单元4。对于各单元的内容参照上述LSTM的结构的详细描述。
[0081] 在一个实施例中,所述对所述训练集和所述测试集进行预处理,包括:
[0082] 对所述训练集和所述测试集进行降频处理;
[0083] 对降频后的所述训练集进行标准化处理,消除数据中尺度和单位的影响,减少特征间规模差异对所述待训练压气机失速预测模型训练的影响。
[0084] 具体实施时,降频处理是将训练集和测试集中的数据采集频率通过降频手段由100kHz降为10kHz。然后对训练集进行标准化处理,标准化的目的是消除尺度和单位的影响,同时也减少特征间规模差异对模型训练的影响,提高模型学习效率,有助于加速收敛,并可能提高模型对新数据预测的准确性,从而确保模型能够关注数据的内在动态变化。
[0085] 基于上述动态压力信号,可知压气机失速是一个连续过程,其发生时刻和严重程度都是连续变量。虽然可以通过设定阈值将失速现象划分为不同类别(例如“正常”和“失速”),但这需要根据经验设定阈值。然而,设定的阈值可能并不准确,且不同的压气机可能需要不同的阈值。所以本发明选择LSTM回归模型,其主要原因是其能够直接预测失速的连续变量,无需将其转化为分类问题。通过回归模型,能获取更精确、细致的失速时刻和特征预测,有助于更有效地控制压气机操作。
[0086] 在一个实施例中,所述超参数包括结构超参数,所述结构超参数包括输入特征的数量、输出的响应数以及LSTM层中隐藏单元的数量。所述超参数还包括算法超参数,所述算法超参数包括采用的优化算法类型、训练的最大轮次、每次迭代更新权重的数据子集的大小、初始学习率、学习率下降之前的轮次数、学习率下降因子以及梯度裁剪阈值。
[0087] 具体实施时,在LSTM神经网络回归模型进行建模前,需要设定模型的超参数的数值,LSTM模型超参数分为结构超参数和算法超参数,结构超参数参数如表1所示,Num Features表示输入特征的数量;num Responses表示输出的响应数;num Hidden Units表示LSTM层中隐藏单元的数量,LSTM层中隐藏单元的数量决定了LSTM的复杂度和存储能力。算法超参数如表2所示,Adam表示优化算法,它结合了Momentum和Ada Grad两种优化方法的特点;Max Epochs表示训练的最大轮次;Mini Batch Size表示每次迭代更新权重的数据子集的大小,小批量梯度下降是在每个小批量上进行权重更新的;Gradient Threshold表示梯度裁剪的阈值。在训练深度网络时,梯度可能会爆炸或消失。为了防止这种情况,设置一个阈值来裁剪梯度,使其不超过这个值;Initial Learn Rate表示学习率定义了权重更新的步长。较高的学习率可能会导致训练不稳定,而较低的学习率可能会导致训练过程缓慢。Learn Rate Drop Period表示学习率下降之前的轮次数。在这个例子中,每400个周期学习率都会下降。Learn Rate Drop Factor表示当学习率下降时,它会乘以这个因子。在本实施例中,学习率将乘以0.15。
[0088] 表1
[0089]
[0090] 表2
[0091]
[0092] 需要说明的是,表1和表2中的参数的取值仅作为示例性,在不同的建模情况下可适应性调整。
[0093] 在一个实施例中,所述利用所述测试集对所述压气机失速预测模型的有效性进行判断,包括:
[0094] 将所述测试集中未发生失速状态的测试数据输入到所述压气机失速预测模型中;
[0095] 根据所述压气机失速预测模型的自学习和预测机制,输出失速预测的失速起始点;
[0096] 将所述失速预测的失速起始点与所述测试集中的失速起始点进行对比;
[0097] 根据对比结果对所述压气机失速预测模型的有效性进行判断。
[0098] 在一个实施例中,所述预测机制采用递归预测机制。
[0099] 具体实施时,利用标准化处理过的训练数据对模型训练。模型训练完成后,将测试集前33%的实际数据作为输入数据,需要注意的是,所用的实际数据是在未发生失速状态下的数据集。通过模型的自学习和预测机制,并利用递归预测完成对未来数据的预测,将预测得到的数据与测试集后67%的实测数据进行对比分析。递归预测是时间序列分析中的一种技术,它涉及到使用一个模型在每一步预测未来的值,并将这个预测值用作后续预测的输入,其公式如下面所示:
[0100]
[0101] 详细分析了压气机失速预测模型的预测结果,如图3所示,图3上侧的图为模型的预测结果,图3下侧的图为实际测试结果。由图3可知,预测得到的失速起始点与实测失速起始点基本一致,且预测能够提前识别出失速的发生,从而为提前采取措施以规避失速的发生提供了可能性。这一结果不仅印证了所提出模型的有效性,同时也进一步验证了模型在压气机失速预测方面的实用性。
[0102] 本申请的基于LSTM神经网络压气机失速预测方法,解决了传统压气机失速预测的局限性,基于深度学习的LSTM模型,通过捕捉时间序列中的长期依赖和非线性模式,为轴流压气机失速提供了准确性的预测,超越了传统方法的局限性,能够自动学习数据特征并适应不同工况,从而实现对关键性失速事件的预测和防范。其创新点主要如下:
[0103] 1、深度学习技术在轴流压气机失速预测中的应用:传统方法主要依赖于物理建模或经验公式,而使用LSTM引入深度学习技术在此领域是一次技术刷新,能够更有效地处理时间序列的复杂性。
[0104] 2、捕捉长期依赖与非线性模式:LSTM由于其特有的递归结构,能够捕捉数据中的长期依赖和非线性关系,这对于预测失速这种复杂现象尤为关键。
[0105] 3、自适应学习能力:与固定参数的传统模型不同,LSTM能够从大量数据中自动学习和提取特征,这为模型提供了更好的通用性和适应性。
[0106] 4、模型的通用性与扩展性:经过适当的训练,该LSTM模型可以应用于各种不同型号和规模的轴流压气机,这为未来的技术扩展和推广提供了可能性。
[0107] 5、预测出失速信号的时间更加提前:利用连续预测策略来更精准地捕捉未来的趋势,旨在增长提前预测失速的时间窗口。
[0108] 在本实施例中,提供了一种计算机设备,如图4所示,,包括存储器401、处理器402及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意的基于LSTM神经网络压气机失速预测方法。
[0109] 具体的,该计算机设备可以是计算机终端、服务器或者类似的运算装置。
[0110] 在本实施例中,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述任意的基于LSTM神经网络压气机失速预测方法的计算机程序。
[0111] 具体的,计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD‑ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0112] 基于同一发明构思,本发明实施例中还提供了一种基于LSTM神经网络压气机失速预测装置,如下面的实施例所述。由于基于LSTM神经网络压气机失速预测装置解决问题的原理与基于LSTM神经网络压气机失速预测方法相似,因此基于LSTM神经网络压气机失速预测装置的实施可以参见基于LSTM神经网络压气机失速预测方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0113] 图5是本发明实施例的基于LSTM神经网络压气机失速预测装置的一种结构框图,如图5所示,包括:获取模块501、预处理模块502、参数设定模块503、训练模块504、判断模块505和失速预测模块506,下面对该结构进行说明。
[0114] 获取模块501,用于获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,所述动态压力信号包括稳态到失速过程;所述两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,所述两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;
[0115] 预处理模块502,用于对所述训练集和所述测试集进行预处理;
[0116] 参数设定模块503,用于对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;
[0117] 训练模块504,用于基于所述超参数,利用预处理后的所述训练集对所述压气机失速预测模型进行训练,获得压气机失速预测模型;
[0118] 判断模块505,用于利用所述测试集对所述压气机失速预测模型的有效性进行判断;
[0119] 失速预测模块506,用于利用通过有效性判断的所述压气机失速预测模型对压气机进行失速预测。
[0120] 在一个实施例中,预处理模块502,还用于:
[0121] 对所述训练集和所述测试集进行降频处理;
[0122] 对降频后的所述训练集进行标准化处理,消除数据中尺度和单位的影响,减少特征间规模差异对所述待训练压气机失速预测模型训练的影响。
[0123] 在一个实施例中,参数设定模块503,还用于:
[0124] 所述超参数包括结构超参数,所述结构超参数包括输入特征的数量、输出的响应数以及LSTM层中隐藏单元的数量。
[0125] 在一个实施例中,参数设定模块503,还用于:
[0126] 所述超参数还包括算法超参数,所述算法超参数包括采用的优化算法类型、训练的最大轮次、每次迭代更新权重的数据子集的大小、初始学习率、学习率下降之前的轮次数、学习率下降因子以及梯度裁剪阈值。
[0127] 在一个实施例中,判断模块505,还用于:
[0128] 将所述测试集中未发生失速状态的测试数据输入到所述压气机失速预测模型中;
[0129] 根据所述压气机失速预测模型的自学习和预测机制,输出失速预测的失速起始点;
[0130] 将所述失速预测的失速起始点与所述测试集中的失速起始点进行对比;
[0131] 根据对比结果对所述压气机失速预测模型的有效性进行判断。
[0132] 在一个实施例中,判断模块505,还用于:
[0133] 所述预测机制采用递归预测机制。
[0134] 在一个实施例中,参数设定模块503,还用于:
[0135] 所述LSTM神经网络的结构包括遗忘门单元、输入门单元、输出门单元和细胞状态更新单元。
[0136] 本发明实施例实现了如下技术效果:获取压气机机匣壁面上同一时间段的两个不同位置的动态压力信号,动态压力信号包括稳态到失速过程;两个不同位置的动态压力信号中一个位置的动态压力信号作为训练集,两个不同位置的动态压力信号中另一个位置的动态压力信号作为测试集;对训练集和测试集进行预处理;对基于LSTM神经网络的待训练压气机失速预测模型的超参数进行设定;基于超参数,利用预处理后的训练集对压气机失速预测模型进行训练,获得压气机失速预测模型;利用测试集对压气机失速预测模型的有效性进行判断;利用通过有效性判断的压气机失速预测模型对压气机进行失速预测。本申请基于深度学习的LSTM模型,通过捕捉时间序列中的长期依赖和非线性模式,为轴流压气机失速提供了准确性的预测,超越了传统方法的局限性,能够自动学习数据特征并适应不同工况,从而实现对关键性失速事件的预测和防范。
[0137] 显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
[0138] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
QQ群二维码
意见反馈