首页 / 专利库 / 泵和压缩机 / 喘振裕度 / 基于深度神经网络的航空发动机稳态模型建模方法

基于深度神经网络的航空发动机稳态模型建模方法

阅读:700发布:2020-06-27

专利汇可以提供基于深度神经网络的航空发动机稳态模型建模方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度神经网络 的航空 发动机 稳态模型建模方法,利用深度神经网络构建航空发动机稳态模型,所述深度神经网络为逐层批归一化的深度神经网络,其在相邻隐含层之间均增加一个批归一化层,用于对前一隐含层的输出进行标准化处理。本发明利用深度神经网络进行航空发动机稳态模型的建模,并通过在深度神经网络中引入批归一化层来增加神经网络层数,提高网络的拟合能 力 ,进而提高航空发动机稳态模型的 精度 。,下面是基于深度神经网络的航空发动机稳态模型建模方法专利的具体信息内容。

1.一种基于深度神经网络的航空发动机稳态模型建模方法,利用深度神经网络构建航空发动机稳态模型,其特征在于,所述深度神经网络为逐层批归一化的深度神经网络,其在相邻隐含层之间均增加一个批归一化层,用于对前一隐含层的输出进行标准化处理。
2.如权利要求1所述航空发动机稳态模型建模方法,其特征在于,所述标准化处理具体如下:
其中, 为标准化处理之后的输出,ε为数值很小的正整数, 为进入批归一化层之前的神经网络输出,μB和 分别为样本数据集的均值和方差,γ和β为两个学习参数。
3.如权利要求2所述航空发动机稳态模型建模方法,其特征在于,所述建模方法包括以下步骤:
步骤1、获取航空发动机稳态模型的训练数据
步骤2、确定逐层批归一化的深度神经网络的结构;
步骤3、对逐层批归一化的深度神经网络进行前向计算,得到损失函数值;
步骤4、使用反向传播算法计算逐层批归一化的深度神经网络梯度,并更新权值;
步骤5、判断逐层批归一化的深度神经网络是否收敛,是则输出稳态模型,否则继续迭代,返回步骤3。
4.如权利要求3所述航空发动机稳态模型建模方法,其特征在于,通过发动机试车实验或/和发动机非线性部件级模型得到所述航空发动机稳态模型的训练数据。
5.如权利要求1~4任一项所述航空发动机稳态模型建模方法,其特征在于,所述航空发动机稳态模型以飞行高度、赫数、燃油流量、尾喷管喉道面积、凤扇导叶压气机导叶角为模型输入量,以发动机耗油率、安装推转子转速、压气机转子转速、风扇喘振裕度、压气机喘振裕度和高压涡轮进口温度为模型输出量。

说明书全文

基于深度神经网络的航空发动机稳态模型建模方法

技术领域

[0001] 本发明涉及航空发动机控制技术领域,尤其涉及一种航空发动机稳态模型建模方法。

背景技术

[0002] 航空发动机是多变量、强非线性和复杂的气动学系统,其安全稳定运行对发动机控制系统提出了很高的要求,为了对其进行良好的控制,首先必须建立一个数学模型。利用数学模型代替真实发动机作为被控对象进行仿真研究,如此可节约大量昂贵的实验经费,还可以避免用真实发动机对控制系统进行调试时可能产生的意外失控事故。此外,先进的航空发动机控制技术,如模型基控制、飞行/推进系统性能寻优控制、直接推力控制、寿命延长控制、应急控制,性能恢复等,都是以高精度的机载发动机实时模型为基础
[0003] 航空发动机建模方法有很多,目前比较流行的有部件级模型,分段线性化模型、支持向量机以及传统神经网络,部件级模型其最大的优点是模型精度高,一般作为仿真对象,然而其实时性差,难以作为机载模型;分段线性化模型实时性高,但由于发动机是一个强非线性对象,因而线性化带来的建模误差比较大;支持向量机和传统神经网络的实时性和建模精度在于部件级模型和线性化模型之间,传统神经网络易于陷入局部最优值,使模型过拟合,支持向量机泛化能力强,但其难以应用于大样本训练数据,而发动机是多变量、运行环境复杂、会发生退化且强非线性对象,因而要建立能应用于大包线的机载模型,训练数据必然增加,这些都限制了支持向量机在航空发动机建模的应用。
[0004] 神经网络由于其在理论上可以拟合任意函数而得到广泛关注。传统神经网络一般采用三层,随着网络层数的增加,其网络拟合能力越来越强,但网络层数增加之后,会出现梯度消失和梯度爆炸现象。随着最近十几年神经网络技术的发展,特别是在Hinton G E提出深度学习-深度置信神经网络之后,神经网络在很多关键技术取得突破,并在工程上得到巨大的应用,比如语音识别、图形识别、目标检测以及文字识别等方面。然而目前深度学习-深度神经网络方面在航空发动机稳态建模方面鲜有应用。

发明内容

[0005] 本发明所要解决的技术问题在于克服现有技术不足,提供一种基于深度神经网络的航空发动机稳态模型建模方法,可有效提高航空发动机稳态模型的精度。
[0006] 本发明具体采用以下技术方案解决上述技术问题:
[0007] 一种基于深度神经网络的航空发动机稳态模型建模方法,利用深度神经网络构建航空发动机稳态模型,所述深度神经网络为逐层批归一化的深度神经网络,其在相邻隐含层之间均增加一个批归一化层,用于对前一隐含层的输出进行标准化处理。
[0008] 优选地,所述标准化处理具体如下:
[0009]
[0010] 其中, 为标准化处理之后的输出,ε为数值很小的正整数, 为进入批归一化层之前的神经网络输出,μB和 分别为样本数据集的均值和方差,γ和β为两个学习参数。
[0011] 进一步优选地,所述建模方法包括以下步骤:
[0012] 步骤1、获取航空发动机稳态模型的训练数据;
[0013] 步骤2、确定逐层批归一化的深度神经网络的结构;
[0014] 步骤3、对逐层批归一化的深度神经网络进行前向计算,得到损失函数值;
[0015] 步骤4、使用反向传播算法计算逐层批归一化的深度神经网络梯度,并更新权值;
[0016] 步骤5、判断逐层批归一化的深度神经网络是否收敛,是则输出稳态模型,否则继续迭代,返回步骤3。
[0017] 优选地,通过发动机试车实验或/和发动机非线性部件级模型得到所述航空发动机稳态模型的训练数据。
[0018] 优选地,所述航空发动机稳态模型以飞行高度、赫数、燃油流量、尾喷管喉道面积、凤扇导叶压气机导叶角为模型输入量,以发动机耗油率、安装推力、转子转速、压气机转子转速、风扇喘振裕度、压气机喘振裕度和高压涡轮进口温度为模型输出量。
[0019] 相比现有技术,本发明技术方案具有以下有益效果:
[0020] 本发明利用深度神经网络进行航空发动机稳态模型的建模,并通过在深度神经网络中引入批归一化层来增加神经网络层数,提高网络的拟合能力,进而提高航空发动机稳态模型的精度。附图说明
[0021] 图1为五层神经网络结构示意图;
[0022] 图2为逐层批归一化的深度神经网络的结构示意图;
[0023] 图3为数据分布图;
[0024] 图4为Sigmod曲线图;
[0025] 图5为反向传播原理示意图;
[0026] 图6为深度神经网络训练相对训练误差;
[0027] 图7为三层BP神经网络训练相对训练误差;
[0028] 图8为深度神经网络训练相对测试误差;
[0029] 图9为三层BP神经网络训练相对测试误差。

具体实施方式

[0030] 本发明主要针对传统航空发动机稳态过程建模方法精度难以提高的情况,提出一种基于深度神经网络的航空发动机稳态模型建模方法,该方法使用逐层批归一化法的深度神经网络,其在相邻隐含层之间均增加一个批归一化层,用于对前一隐含层的输出进行标准化处理,从而使得所提出的建模方法的网络层数高,拟合能力强,进而提高航空发动机稳态模型的建模精度。
[0031] 本发明提出基于深度神经网络的航空发动机稳态模型建模方法,其主要包括以下几个步骤:步骤1、获取航空发动机稳态模型的训练数据;
[0032] 步骤2、确定逐层批归一化的深度神经网络的结构;
[0033] 步骤3、对逐层批归一化的深度神经网络进行前向计算,得到损失函数值;
[0034] 步骤4、使用反向传播算法计算逐层批归一化的深度神经网络梯度,并更新权值;
[0035] 步骤5、判断逐层批归一化的深度神经网络是否收敛,是则输出稳态模型,否则继续迭代,返回步骤3。
[0036] 发动机稳态数据为发动机稳定运行时的发动机参数,其数据可通过发动机试车实验或/和发动机非线性部件级模型得到,由于试车实验成本高昂,目前普遍通过发动机非线性部件级模型得到发动机稳态数据。
[0037] 以五层神经网络为例,其基本结构如图1所示。图中wi和bi i=1,2,3,4分别为权重和偏置,J为损失函数。对w1和b1求偏导,得到:
[0038]
[0039]
[0040] 因为σ′(hi)的导数都是小于0.25,当wi≤1时,w2σ′(h2)≤0.25,这说明层数越多,梯度程指数减小,该问题称为梯度消失;而且,假定wi≥100,σ′(h2)=0.1,则w2σ′(h2)≥10,这又会出现,随着层数的增加,梯度程指数增加,该问题称为梯度溢出。
[0041] 为了克服梯度消失问题,本发明采用逐层批归一化(BNBatchNormalization),它在两个隐含层之间增加一个BN层,它能够有效避免了梯度消失和梯度溢出问题,其网络结构如图2所示.
[0042] 在神经网络权重初始化时,往往是让权重符合均值为零,方差为1的高斯分布,与此同时,输入数据进行标准化处理,输出数据进行归一化或标准化处理。经过映射、训练,每一层的数据分布都发生了变化,而且差异很大,这导致每一层神经网络权重的分布差异很大,而训练时每一层的神经网络学习率往往相同,这极大地降低网络的收敛速度。如果对数据进行白化操作,其原理如下图所示,图3a为训练数据分布图,图中可以看出,数据分布偏离了高斯分布,进行减去均值,在去相关等操作之后,得到如图3b所示数据,使得数据符合高斯分布,从而加快了神经网络的学习速率。
[0043] 白化操作有很多种,常用的有PCA白化,它是让数据满足0均值、单位方差并且弱相关,然而,白化不可取的,主要因为白化操作需要计算协方差矩阵、求逆等操作,计算量大,而且,反向传播时,白化操作不一定可导,于是采用批规一化,对每个隐含层节点进行标准化处理,它在权重乘积之后,激活函数之前,假设神经网络正向传播是第l层第i个节点的输出为 其中j∈χk,k代表第k组训练数据集,则有
[0044]
[0045] 其中 为归一化之后的输出,ε为数值很小的正整数, 为进入BN层之前的神经网络输出,μB和 分别为均值和方差,计算公式如下
[0046] hl=σ(Wl-1hl-1+bl-1)  (4)
[0047]
[0048]
[0049] 然而,如果只进行批标准化操作,会降低网络的表达能力。如图4所示,如果激活函数为sigmoid时候,把数据限制在零均值单位方差,那么只相当于使用激活函数的线性部分,而两侧的非线性部分很少涉及,这显然会降低网络的表达能力。
[0050] 为此,本发明又增加了γ和β这两个学习参数,来保持网络的表达能力,其表达式如下:
[0051]
[0052] 上式求得的μB和 是最小批量(Min-batch)下求得的,而理论上应该是整个数据集的均值和方差。
[0053] 深度神经网络的训练方式也是采用反向传播算法,需要更新的网络参数为W,b,γ,β,采用梯度下降法,更新如下:
[0054]
[0055]
[0056]
[0057]
[0058] 采用反向传播算法求得梯度,原理如图5所示,假设 为
[0059]
[0060] 假设δl为
[0061]
[0062] 其中l=nnet,nnet-2,…,2
[0063]
[0064]
[0065]
[0066] 对于l=nnet-1,nnet-2,…,2的 有
[0067]
[0068] 因此得到网络参数的梯度为:
[0069] 除BN层外,其它层求导公式于MGDNN相同。
[0070]
[0071]
[0072]
[0073]
[0074] 为了验证本发明所提出航空发动机稳态建模方法的有效性与先进性,以小涵道比航空发动机部件级模型为仿真对象,建立基于本发明提出方法的用于性能寻优的航空发动机机载模型,并与MGD-NN做比较,MGD-NN使用最小批量梯度下降法(MGD,mini-batch gradient descent)对网络进行训练,克服传统神经网络不能适用于大样本数据的确定,为了使得深度神经网络使用与大样本训练,同样采用MGD方法进行训练,以下称本文提出的深度神经网络稳态模型称为BN-MGD-DNN。经过交叉验证刷选,得到BN-MGD-DNN的网络结构为[6,10,15,15,10,7],MGD-NN的网络结构为[6,40,7],MGD算法中最小训练样本集为3000,正则化常数为10-6.
[0075] 飞机在巡航时,飞行高度H和马赫数Ma在缓慢变化,发动机控制量除了燃油Wfb和尾喷管喉道面积A8,风扇和压气机的导叶角角度对耗油率的影响也很大,因此,本文以H、Ma、Wfb、A8、凤扇导叶角αf和压气机导叶角αc为模型输入量,发动机耗油率Sfc、安装推力Fin、风扇转子转速Nf、压气机转子转速Nc、风扇喘振裕度Smf、压气机喘振裕度Smc和高压涡轮进口温度T4为模型输出量,构建发动机参数的预测模型如下:
[0076] y=fBN-MGD-DNN(x)  (22)
[0077] 其中
[0078]
[0079] 由于神经网络类似于非线性插值器,在内插值时精度高,在外插值时精度低,因此所选的训练样本尽可能地包含输入参数的最大值和最小值,而且为了避免过拟合,训练样本应尽可能地多,针对亚音速和超音速巡航,H取值范围9~13km,Ma选取0.7~1.5,Wfb变化范围为随PLA和Ma变化,A8变化范围为从设计点的尾喷管喉道面积A8,ds到1.3A8,ds,αf和αc的变化范围为-3°到3°。选取训练样本集为3726498个,测试样本集选取7536个
[0080] 图6-9分别给出了BN-MGD-DNN和MGD-NN的相对训练误差,从图中可以看出BN-MGD-DNN的误差基本在3%以下,满足精度要求,而且其训练精度明显高于MGD-NN,特别是Sfc、Nf、Smf和Smc,其训练精度比MGD-NN高了一倍左右。图6和7给出了BN-MGD-DNN和MGD-NN的训练相对误差,从图中可以看出,BN-MGD-DNN的测试误差除了Smf和Smc在2%以内,其它的其精度都在1%以内,满足精度要求,而且从图8和9可以看出,深度神经网络精度比传统BP神经网络有着较大提高,特别是风扇和压气机转子转速和喘振裕度,这说明BN-MGD-DNN具有更强的泛化能力。
[0081] 表1给出了BN-MGD-DNN和MGD-NN的平均相对测试误差和平均相对训练误差,与MGD-NN相比,BN-MGD-DNN具有更高的训练精度和测试精度。其中本文提出BN-MGD-DNN建模方法的Sfc、Nf、Nc、Fin、T4,Smf和Smc的平均训练相对误差在比MGD-NN分别减小了1.4、2.17、2.0、1.3、1.13、2.4和2.8倍,对于与模型泛化性能特别相关的平均相对测试误差,分别减小了1.75、2.0、2.3、1.3、1.3、2.3和3.3倍。
[0082] 表2给出MGD-NN和BN-MGD-DNN的数据存量、计算复杂度、平均测试时间,从表中可以看出两者的算法复杂度低、数据存储量小、平均测试时间短,都满足机载要求。
[0083] 其中MGD-NN的数据存储量为567(权重520(6×40+40×7)+47偏置(40+7));BN-MGD-DNN的数据存储量为940
[0084] MGD-NN的计算复杂度为614(乘法运算520(6×40+40×7)+加法运算47(40+7)+激活函数47(40+7));
[0085] BN-MGD-DNN的数据存储量为940(乘法运算712(6×10+10×15+15×15+15×10+10×7+10+15+15+10+7)+除法运算57(10+15+15+10+7)+加法运算57(10+15+15+10+7+10+15+15+10+7)+减法运算57(10+15+15+10+7)+激活函数57(10+15+15+10+7))
[0086] 两个程序运行环境都为:操作系统Windows 7Ultimate with Service Pack 1(x64);处理器(CPU)为Intel(R)Core(TM)i5-4590h,它的主频为3.30GHz,内存(RAM)为8G,运行的软件为MATLAB2016a,性能寻优模式仿真环境与这相同,以下不在阐述,从表中可以看出MGD-NN和BN-MGD-DNN测试时间分别为0.067毫秒和0.223毫秒。
[0087] 表1平均相对测试与训练误差表
[0088]
[0089] 表2 MGD-NN和BN-MGD-DNN算法比较
[0090]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈