首页 / 专利分类库 / 燃烧设备;燃烧方法 / 使用流体燃料的燃烧方法或设备 / 烟气再循环与锅炉耦合系统的优化控制方法及控制系统

烟气再循环与锅炉耦合系统的优化控制方法及控制系统

申请号 CN202311290319.8 申请日 2023-10-08 公开(公告)号 CN117190173B 公开(公告)日 2024-03-29
申请人 天津大学; 发明人 王赫阳; 周永清; 王家兴; 严延; 樊昱晨; 刘骁;
摘要 本 发明 公开一种烟气再循环与 锅炉 耦合系统的优化控制方法和控制系统,包括获取现有耦合系统的历史数据建立 基础 数据集,作为多目标动态 预测模型 的基础参数;建立耦合系统的多目标动态预测模型,并训练模型;将待调控的耦合系统中关键可调控运行参数视为基于 强化学习 算法 的 自学习 调控机制,并将其与多目标动态预测模型构建的耦合系统运行环境进行交互,将交互反馈的指标参数 信号 作为自学习调控机制调节后系统运行状态的奖惩评估依据,最终根据奖励最大化原则确定最优调控策略,从而完成耦合系统在线自学习优化控 制模 型的构建,并将训练好的模型用于耦合系统现场运行的过程控制,实现锅炉效率和氮 氧 化物排放协调控制的最终目标。
权利要求

1.一种烟气再循环与锅炉耦合系统的优化控制方法,其特征在于,适用于锅炉系统与烟气再循环系统耦合工作的耦合系统;具体包括:
步骤一:获取现有耦合系统的历史数据,对历史数据集中的数据进行预处理后,进行归一化处理后建立基础数据集,作为多目标动态预测模型的基础参数;其中,所述预测模型中的输入项与输出项之间构建动态映射关系网络;
步骤二:利用Transformer模型建立耦合系统的多目标动态预测模型,通过历史时刻内数据的相关性分析确定动态监测时间窗口,训练模型后进行验证,直至预测值和真实值的拟合的误差值在预设范围内时进行下一步;
步骤三:将当前待调控的耦合系统中关键可调控运行参数视为基于强化学习算法自学习调控机制,并将其与步骤二中多目标动态预测模型构建出以动态数字网表征的耦合系统运行环境进行交互,将交互反馈的指标参数信号作为自学习调控机制调节后系统运行状态的奖惩评估依据,最终根据奖励最大化原则确定最优调控策略,从而完成耦合系统在线自学习优化控制模型的构建,并将训练好的模型用于耦合系统现场运行的过程控制;其中所述关键可调控运行参数包括锅炉系统中的量、量、减温量。
2.根据权利要求1所述的耦合系统的优化控制方法,其特征在于,预处理包括:遍历数据集参数,查找缺失项和异常值,使用插值法对缺失项和异常值进行填充/替换。
3.根据权利要求1所述的耦合系统的优化控制方法,其特征在于,所述关键可调控运行参数为一次风量va、二次风量vb和再循环烟气量vg。
4.根据权利要求1所述的耦合系统的优化控制方法,其特征在于,步骤二具体包括:
S201:依据步骤一对于耦合系统运行特性的分析,确定多目标动态预测模型输出项和不同时刻下系统输入项之间历史数据的相关性,并通过历史时刻内数据的相关性分析确定动态预测模型的动态监测时间窗口;
S202:采用Transformer模型搭建耦合系统动态预测模型,从而建立起各参数之间的复杂非线性映射关系;将S201选定的动态监测时间窗口内的历史数据作为动态预测模型的输入数据集,并利用动态映射关系网络中的多目标注意,将不同时刻内锅炉系统的输入运行参数对输出运行参数的影响、不同时刻下不同的输入运行参数对输出运行参数的影响强度考虑到动态预测模型的构建过程中,以实现对锅炉运行状态更加精准的评估;其中锅炉系统的输入运行参数和输出运行参数作为动态预测模型的输入项和输出项;
S203:利用步骤一获得的基础数据集对步骤202搭建的动态预测模型进行训练,并对训练后的模型进行验证,调整模型的参数和超参数,提高模型的性能,完成所述耦合系统动态预测模型的搭建;
S204:将测试集数据带入构建的动态预测模型进行交叉验证分析,引入均方根误差作为评价指标,当预测值和真实值的拟合的误差值在预设范围内时,进入下一步,否则返回S202进行迭代
5.根据权利要求1所述的耦合系统的优化控制方法,其特征在于,步骤三具体包括:
S301:将步骤一中耦合系统的历史数据集中的参数作为观测数据集,并结合当前待调控耦合系统的运行过程,提取步骤一的动态预测模型输入项作为自学习优化模型状态空间参数,其中影响系统运行的关键可调控运行参数作为自学习优化控制模型动作空间参数,其余输入项作为参考空间参数;提取步骤一的动态预测模型输出项作为自学习优化控制模型的性能空间参数;由上述空间参数统一组成观测空间参数,为耦合系统提供调控决策和预测未来状态所需的信息;
S302:将步骤一所搭建的动态预测模型作为耦合系统优化运行阶段的在线环境信息代理模型,实时提供当前系统运行状态下反馈的性能参数信息作为奖惩机制的评估依据;
S303:通过历史工况的数据分析,确定S301确定的动作空间参数的可调控范围,在调控范围内逐步调整动作空间参数,实现耦合系统优化运行的控制过程;
S304:将能评估系统运行状态的指标参数,依据系统安全清洁高效的运行原则,构造相应的奖惩函数组成自学习优化控制模型的奖惩机制;
S305:自学习优化控制模型中的价值网络依据S304构造的奖惩机制对S301执行的动作空间参数反馈未来时刻的奖励回报去指导策略网络的输出;
S306:结合动态模型预测阶段构成的运行环境代理模型,实时调整待调控耦合系统动作空间参数而得到新的状态空间参数后,将其与环境信息进行交互;运行环境信息代理模型以奖惩函数的形式对当前耦合系统运行状态进行评估反馈,并将一系列的状态空间参数、动作空间参数和奖惩信息存放到回放经验池;利用经验回放池的批量数据对学习优化控制模型的策略网络和价值网络训练更新,返回S305过程依次更新对当前运行状态参数提供优化动作空间参数的调控策略;通过迭代步骤完成耦合系统在线自学习优化控制模型的构建。
6.一种烟气再循环与锅炉耦合系统的优化控制系统,其特征在于,包括第一模块、第二模块和第三模块;
所述第一模块配置为获取现有耦合系统的历史数据,对历史数据集中的数据进行预处理后,进行归一化处理后作为第二模块的基础参数;
所述第二模块配置为利用Transformer模型建立第一模块中各参数之间的动态预测模型,并作为实时待调控的耦合系统运行环境的代理模型,对所述模型进行训练后进行验证,直至预测值和真实值的拟合的误差值在预设范围内后,用于第三模块的自学习优化控制;
其中,所述动态预测模型中的输入项与输出项之间构建动态映射关系网络,通过历史时刻内数据的相关性分析确定动态监测时间窗口;
所述第三模块将第一模块中获取的基础参数中的关键可调控运行参数视为基于强化学习算法的自学习调控机制,并将其与第二模块中多目标动态预测模型构建出以动态数字网表征的耦合系统运行环境进行交互,将交互反馈的指标参数信号作为自学习调控机制调节后系统运行状态的奖惩评估依据,最终根据奖励最大化原则确定最优调控策略,从而完成耦合系统在线自学习优化控制模型的构建,并将训练好的模型用于耦合系统现场运行的过程控制;其中所述关键可调控运行参数包括锅炉系统中的风量、煤量、减温水量。
7.根据权利要求6所述的烟气再循环与锅炉耦合系统的优化控制系统,其特征在于,所述关键可调控运行参数为一次风量va、二次风量vb和再循环烟气量vg。
8.一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;其特征在于,所述程序适于由处理器加载并执行以实现权利要求1所述的烟气再循环与锅炉耦合系统的优化控制方法。

说明书全文

烟气再循环与锅炉耦合系统的优化控制方法及控制系统

技术领域

[0001] 本发明涉及锅炉技术领域,具体涉及一种烟气再循环与锅炉耦合系统的优化控制方法及控制系统。

背景技术

[0002] 循环流化床锅炉具备燃料适应性好、负荷调节范围大、热效率高以及低硫排放等优点,广泛应用于国内的电站锅炉和工业锅炉机组。当下正是推动经济社会发展绿色化、低化以实现社会高质量发展的关键环节,因此,在绿色发展战略的引领下,一系列环保技术向新而生,其中就有针对灵活性调峰需求和降低氮化物燃烧控制的烟气再循环技术。
[0003] 烟气再循环技术已成为循环流化床锅炉在调峰运行工况下低NOx燃烧的主要技术手段,其进入炉膛的再循环烟气流量、流速、压等参数都与炉内物料流化,燃烧状况息息相关。烟气再循环系统与锅炉系统整体耦合系统是一个复杂的多标准系统,运行变量之间呈现多变耦合性、强依赖性和非线性相关。利用烟气再循环系统配合锅炉运行灵活性负荷进行实时调控时,不仅需要保证整体系统的长周期安全与稳定运行,同时应综合考虑锅炉床层流化质量、燃烧效率以及脱硝效果等关键性能指标。
[0004] 目前针对循环流化床锅炉与烟气再循环耦合系统的运行调控,主要是依据量配比量的计算数据,再结合人工调试经验等方式给出大致区间内的调试指示参数。并且在系统每次投运初期,都需要运行人员进行测试调试运行,以满足烟气再循环系统与锅炉主体系统之间的配合运行。上述一系列工作虽能初步满足锅炉变负荷运行的需求,但存在强依赖于运行人员的调试经验,且存在参考变量相对单一的问题,会逐步积累较大的经验判断误差。从而导致锅炉污染物排放指数偏高、锅炉效率低下、产生额外的风压损失以及调节实时性差等问题。为避免频繁的操作参数调整对锅炉系统造成的负面影响,一套响应快速、调节精准、切实可行的自动控制策略至关重要。

发明内容

[0005] 本发明的目的在于克服现有技术缺陷,提供一种烟气再循环与锅炉耦合系统的优化控制方法及控制系统。烟气再循环与锅炉耦合系统是锅炉系统与烟气再循环系统耦合工作的系统,以下均简称为耦合系统。所述方法在离线历史数据信息的基础上利用Transformer模型构建耦合系统的动态预测模型,随后将动态预测模型作为耦合系统在线优化调控阶段系统运行环境的代理模型,进行耦合系统自学习模式的优化调控模型构建。
通过在锅炉宽负荷段工况运行时对耦合系统运行参数的精准调控,不仅可以提供炉内配风系统的稳燃适应性调节机制,以适应炉内燃烧反应区的特性,从而改善炉内燃烧的气氛;同时确保炉内沿程的温度分布满足了炉内脱销和脱硫机制的温度反应窗口,保证了锅炉宽负荷运行过程的污染物排放指标。最终实现锅炉系统安全、清洁、高效的运行。
[0006] 本发明的目的是通过以下技术方案实现的:
[0007] 一种烟气再循环与锅炉耦合系统的优化控制方法,适用于锅炉系统与烟气再循环系统耦合工作的耦合系统;具体包括:
[0008] 步骤一:获取现有耦合系统的历史数据,对历史数据集中的数据进行预处理后,进行归一化处理后建立基础数据集,作为多目标动态预测模型的基础参数;其中,所述预测模型中的输入项与输出项之间构建动态映射关系网络;
[0009] 步骤二:利用Transformer模型建立耦合系统的多目标动态预测模型,通过历史时刻内数据的相关性分析确定动态监测时间窗口,训练模型后进行验证,直至预测值和真实值的拟合的误差值在预设范围内时进行下一步;
[0010] 步骤三:将当前待调控的耦合系统中关键可调控运行参数视为基于强化学习算法的自学习调控机制,并将其与步骤二中多目标动态预测模型构建出以动态数字网表征的耦合系统运行环境进行交互,将交互反馈的指标参数信号作为自学习调控机制调节后系统运行状态的奖惩评估依据,最终根据奖励最大化原则确定最优调控策略,从而完成耦合系统在线自学习优化控制模型的构建,并将训练好的模型用于耦合系统现场运行的过程控制。
[0011] 进一步的,预处理包括:遍历数据集参数,查找缺失项和异常值,使用插值法对缺失项和异常值进行填充/替换。
[0012] 进一步的,关键可调控运行参数包括锅炉系统中的风量、煤量、减温量,特别优选的可调控运行参数为一次风量va、二次风量vb和再循环烟气量vg。
[0013] 进一步的,步骤二具体包括:
[0014] S201:依据步骤一对于耦合系统运行特性的分析,确定多目标动态预测模型输出项和不同时刻下系统输入项之间历史数据的相关性,并通过历史时刻内数据的相关性分析确定动态预测模型的动态监测时间窗口;
[0015] S202:采用Transformer模型搭建耦合系统动态预测模型,从而建立起各参数之间的复杂非线性映射关系;将S201选定的动态监测时间窗口内的历史数据作为动态预测模型的输入数据集,并利用动态映射关系网络中的多目标注意力模,将不同时刻内锅炉系统的输入运行参数对输出运行参数的影响、不同时刻下不同的输入运行参数对输出运行参数的影响强度考虑到动态预测模型的构建过程中,以实现对锅炉运行状态更加精准的评估;其中锅炉系统的输入运行参数和输出运行参数作为动态预测模型的输入项和输出项;
[0016] S203:利用步骤一获得的基础数据集对步骤202搭建的动态预测模型进行训练,并对训练后的模型进行验证,调整模型的参数和超参数,提高模型的性能,完成所述耦合系统动态预测模型的搭建;
[0017] S204:将测试集数据带入构建的动态预测模型进行交叉验证分析,引入均方根误差作为评价指标,当预测值和真实值的拟合的误差值在预设范围内时,进入下一步,否则返回S202进行迭代
[0018] 进一步的,步骤三具体包括:
[0019] S301:将步骤一中耦合系统的历史数据集中的参数作为观测数据集,并结合当前待调控耦合系统的运行过程,提取步骤一的动态预测模型输入项作为自学习优化模型状态空间参数,其中影响系统运行的关键可调控运行参数作为自学习优化控制模型动作空间参数,其余输入项作为参考空间参数;提取步骤一的动态预测模型输出项作为自学习优化控制模型的性能空间参数;由上述空间参数统一组成观测空间参数,为耦合系统提供调控决策和预测未来状态所需的信息;
[0020] S302:将步骤一所搭建的动态预测模型作为耦合系统优化运行阶段的在线环境信息代理模型,实时提供当前系统运行状态下反馈的性能参数信息作为奖惩机制的评估依据;
[0021] S303:通过历史工况的数据分析,确定S301确定的动作空间参数的可调控范围,在调控范围内逐步调整动作空间参数,实现耦合系统优化运行的控制过程;
[0022] S304:将能评估系统运行状态的指标参数,依据系统安全清洁高效的运行原则,构造相应的奖惩函数组成自学习优化控制模型的奖惩机制;
[0023] S305:自学习优化控制模型中的价值网络依据S304构造的奖惩机制对S301执行的动作空间参数反馈未来时刻的奖励回报去指导策略网络的输出;
[0024] S306:结合动态模型预测阶段构成的运行环境代理模型,实时调整待调控耦合系统动作空间参数而得到新的状态空间参数后,将其与环境信息进行交互;运行环境信息代理模型以奖惩函数的形式对当前耦合系统运行状态进行评估反馈,并将一系列的状态空间参数、动作空间参数和奖惩信息存放到回放经验池;利用经验回放池的批量数据对学习优化控制模型的策略网络和价值网络训练更新,返回S305过程依次更新对当前运行状态参数提供优化动作空间参数的调控策略。通过一定的迭代步骤完成耦合系统在线自学习优化控制模型的构建,以探究耦合系统潜在的优化控制策略。
[0025] 一种烟气再循环系统的在线自学习优化控制系统,包括第一模块、第二模块和第三模块。
[0026] 所述第一模块配置为获取现有耦合系统的历史数据,对历史数据集中的数据进行预处理后,进行归一化处理后作为第二模块的基础参数;
[0027] 所述第二模块配置为利用Transformer模型建立第一模块中各参数之间的动态预测模型,并作为实时待调控的耦合系统运行环境的代理模型,对所述模型进行训练后进行验证,直至预测值和真实值的拟合的误差值在预设范围内后,用于第三模块的自学习优化控制;其中,所述动态预测模型中的输入项与输出项之间构建动态映射关系网络,通过历史时刻内数据的相关性分析确定动态监测时间窗口;
[0028] 所述第三模块将第一模块中获取的基础参数中的关键可调控运行参数视为基于强化学习算法的自学习调控机制,并将其与第二模块中多目标动态预测模型构建出以动态数字网表征的耦合系统运行环境进行交互,将交互反馈的性能指标参数信号作为自学习调控机制调节后系统运行状态的奖惩评估依据,最终根据奖励最大化原则确定最优调控策
略,从而完成耦合系统在线自学习优化控制模型的构建,并将训练好的模型用于耦合系统现场运行的过程控制。
[0029] 一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;其特征在于,所述程序适于由处理器加载并执行以实现烟气再循环与锅炉耦合系统的优化控制方法。
[0030] 与现有技术相比,本发明的技术方案所带来的有益效果是:
[0031] 本发明首先建立一套真实反映系统中各数据间复杂规律的烟气再循环与锅炉耦合系统的动态预测模型,循环流化床锅炉的烟气再循环系统设计是保证锅炉在宽负荷状态下安全运行的必备调节手段;而耦合系统的运行主要依靠整体的烟风系统进行调控。以往烟风系统的设计往往依赖一些简单的热力计算和运行人员的经验,对锅炉在不同负荷段运行工况设定固定的粗范围阈值区间进行烟风量比的配置,可能会导致锅炉床层温度偏高、过热器管屏超温、排烟温度上升和风机腐蚀等一系列问题。
[0032] 本发明提出实时在线的自学习优化控制模型能够适用于宽负荷调节工况下耦合系统运行参数的优化控制,在提升锅炉运行品质的同时,降低了环保设备运行费用,解决了现阶段在锅炉各种复杂运行的工况下,因缺少实时性动态优化的调控策略而导致的锅炉效率降低、运行成本和设备维护成本逐年攀升等问题。
附图说明
[0033] 图1是步骤二建立的动态预测模型示意图;
[0034] 图2为动态预测模型时间序列窗口示意图,左侧图为训练阶段,右侧图为预测阶段;
[0035] 图3为步骤三中的耦合系统自学习优化控制模型示意;
[0036] 图4a‑4c为动态预测模型预测性能示意图;其中,图4a示出预测模型对锅炉污染物排放值的预测结果与对应实测值的散点分布,图4b示出预测模型对锅炉床层温度值的预测结果与对应实测值的散点分布,图4c示出预测模型对锅炉排烟温度值的预测结果与对应实测值的散点分布;
[0037] 图5a‑5c为不同负荷工况下使用所述自学习优化控制模型的优化控制结果示意图,图5a为在不同负荷工况下原观测值和使用所述自学习优化控制模型的优化控制后的氮氧化物排放值的对比图;图5b为优化控制后锅炉的排烟温度的示意图,图5c为优化控制后锅炉的床层温度的示意图。

具体实施方式

[0038] 为使本发明实施例的目的、技术方案、有益效果及显著进步更加清楚,下面结合本发明实施例中所提供的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所有描述的这些实施例仅是本发明的部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039] 本实施例将本发明所述的一种烟气再循环与锅炉耦合系统的优化控制方法应用在某电厂一台350MW超临界循环流化床锅炉机组上,目的是使烟气再循环系统与锅炉系统耦合运行的作用下,保证整体系统的安全、清洁、高效运行。具体实施方案包括如下步骤。
[0040] 步骤一:获取现有耦合系统的历史数据,对历史数据集中的数据进行预处理后,进行归一化处理后建立基础数据集,作为多目标动态预测模型的基础参数;其中,所述预测模型中的输入项与输出项之间构建动态映射关系网络。
[0041] S101:获取负荷调峰较为频繁的3个月内的电厂DCS系统中锅炉系统的数据参数,包括温度、压力、流量、液位、浓度等,采样间隔为1分钟,共计10000组运行参数形成基础数据集。所述基础数据集中包括如下参数:锅炉负荷Qb,入炉煤量Bj,一二次风量va、vb,一二次风风温Ta、Tb,主蒸汽压力Pj、主蒸汽温度Tj、炉膛出口氧量Oa,再循环烟气量vg、排烟温度Tpy,氮氧化物排放浓度NOx,平均床层温度Tav。
[0042] S102:为提升数据的准确度和适用性,将所述基础数据集进行缺失项和异常项数据的检验,并将检验出空白或异常数据的位置利用同维度中与其相邻的两数据的均值对缺项数据进行填充替换;为方便后续模型的训练和验证过程,将数据按照均值为0方差为1的正态分布进行标准化预处理。分别将上述参数项标准化处理后的数据按照8:1:1比例划分,分别作为训练集、验证集和测试集。
[0043] S103:选定基础数据集中排烟温度Tpy,平均床温Tav、污染物排放浓度NOx作为动态预测模型的输出项,其余参数作为动态预测模型的输入项。
[0044] 步骤二:如图1所示,构建耦合系统动态预测模型。
[0045] 通过对循环流化床锅炉内燃烧机理和化学反应特性分析耦合系统的气动特性研究,可知所述耦合系统的运行参数表现出大惯性的滞后特性,锅炉内部燃料燃烧和传热过程存在延迟特性,滞后时间可用分钟计。结合步骤一对耦合系统运行特性的分析,整体系统运行参数呈现出滞后性和强依赖性等特点。因此利用皮尔逊相关系数计算当前时刻和一定时间区域内历史数据中输出与输出项之间的相关程度,可知:所述多目标动态预测模型的输出项与输入项在不同时刻存在不同的相关特性,其输入向量的某一历史时刻值会对未来时刻的输出值造成影响。
[0046] 因此本实施例采用Transformer模型构建出系统输入数据与输出数据的动态映射关系网络。
[0047] 为实现Transformer架构,将输入数据集样本重塑为矩阵分布形式:
[0048]
[0049] 其中Xi,Yi表示第i个数据样本的输入、输出数据向量组,m,n分别表示各自的维度。根据Transformer模型的设定的时间步长作为数据采集窗口,即选取前t时刻的X样本数据作为模型的输入,第t+1时刻的Y样本数据作为模型的输出。构成数据矩阵形式:
[0050]
[0051] 使用Tensorflow框架下的Transformer模型构造如图1所示的烟气再循环系统的多目标动态预测模型,Transformer遵循编码器解码器这一总体框架,使用堆叠式的自注意力机制和全连接层的编码器‑解码器层组成,具体构造过程如下:
[0052] 首先是对Transformer编码器部分的设计,将训练集数据以向量的形式输入到编码模块的输入端。由于Transformer架构本身是将序列输入项同时输入再合并处理,不能体现出输入项的时序特征。因此本案例使用Transformer‑XL相对位置编码的形式,使用片段递归机制对输入序列按时间步长大小进行窗口划分。Transformer模型训练时,将接受上一个时间窗口的输出和当前时间窗口的输入,从而将锅炉系统参数之间的时序关系嵌入到动态预测模型的模块计算过程中。其中模型采用时间窗口大小为L=5的序列数据作为时间序列编码的依据,输入为前5个时刻的参数数据集。图2左侧示出模型各参数训练阶段时间序列窗口示意图,右侧图为预测阶段的时间序列窗口示意图,通过窗口与窗口之间的信息递归机制(即窗口与窗口之间数据的信息传递线),实现系统运行参数长时序的依赖性。
[0053] 将经时间序列编码的输入向量输入到编码器模块后,会经过注意力机制层和全连接神经网络层运算,两个子层通过残差网络结构进行连接;从而提取到输入项参数之间的隐藏层特征并输入到解码器模块中,具体运算方式如下:
[0054]
[0055]
[0056]
[0057]
[0058]
[0059]
[0060] 其中,前后两个时间片段分别为:sτ=[xτ,1,xτ,2,xτ,3,xτ,4,xτ,5]和sτ+1=[xτ+1,1,xτ+1,2,xτ+1,3,xτ+1,4,xτ+1,5], 是由sτ计算出的第n层状态向量,SG表示不进行梯度更新操作,式①表示将前后两个片段的输出向量在时间序列维度上进行连接。式②是由注意力机制计算得到的关联度矩阵,用以计算输入参数之间的相关性系数。式③表示注意力机制计算过程中对相对时间序列的信息计算。式④‑⑥表示前连接前馈神经网络层的计算过程,最后将编码器模块计算层的输出传输给解码器的注意力机制模块。
[0061] 解码器主要有3个子层,包括两个注意力机制层,其中下层注意力层用以学习输出目标值参数之间的相关性,之后与编码器的输出一起输入到上层的注意力层,上层的注意力层用来计算输入项和目标输出项之间的相关性;再通过全连接层得到解码器的输出,也就是Transformer模型的排烟温度Tpy,氮氧化物排放浓度NOx,平均床层温度Tav等关键性能运行参数的预测值输出。
[0062] 配置超参数对模型进行训练:本案例Transformer模型中编码器层数设置为4,前馈全连接层的维度设置为512,多目标注意力目标数设置为8,并使用Adam优化器去自适应调节学习率。将训练数据集带入模型进行训练,每个训练样本经过前向传播计算损失,并进行反向传播更新模型参数。训练过程使用迭代的方式进行多个周期的迭代,直至模型收敛。随后将验证集带入模型对超参数进行微调优化。
[0063] 动态预测模型构建完成后,对模型进行交叉验证分析:带入测试集数据对预测模型的性能进行评估,引入均方根误差作为评价指标。图4a,4b,4c分别显示了动态预测模型对锅炉污染物排放NOx浓度值、床层温度值和排烟温度值的预测结果与对应实测值的散点分布对比。可见:预测值和真实值的拟合程度情况较好,误差值保持在合理范围之内。因此步骤二建立的动态预测模型已具备较高精度的预测性能和良好的泛化性能。
[0064] 步骤三:如图3所示,基于步骤二已建立并验证的动态预测模型基础上,将宽负荷段、宽时序区间内各变量复杂的关系映射网进行关键信息提取,将当前待调控的耦合系统中关键可调控运行参数视为基于强化学习算法的自学习调控机制,并将其与步骤二中多目标动态预测模型构建出以动态数字网表征的耦合系统运行环境进行交互,将交互反馈的指标参数信号作为自学习调控机制调节后系统运行状态的奖惩评估依据,最终根据奖励最大化原则确定最优调控策略,从而完成耦合系统在线自学习优化控制模型的构建,并将训练好的模型用于耦合系统现场运行的过程控制,实现锅炉效率和氮氧化物排放协调控制的最终目标。
[0065] (1)状态参数是表征锅炉运行环境特征重要的数据。根据运行经验,将与烟气再循环与锅炉耦合系统运行直接相关的预测模型输入参数:一次风量va、二次风量vb、再循环烟气量vg作为动作空间参数Cont,其余指示性参数设定为参考空间参数Rest。将动作空间参数和参考空间参数组成自学习优化控制模型的状态空间参数Stat。将步骤一的动态预测模型输出项设定为性能空间参数Pret,其中,氮氧化物排放浓度NOx决定电厂的环保排放指标,排烟温度Tpy、平均床层温度Tav是衡量锅炉效率有效指标参数。将上述类型变量包含的信息统一到一个观测参数空间Obst,包含了耦合系统进行调控决策和预测未来状态所需的信息。
[0066]
[0067]
[0068]
[0069]
[0070] (2)动作空间参数可用于控制系统状态。烟气再循环系统与锅炉耦合运行过程中,烟风量配比系数决定了整体系统运行的状态,风量配比超过合理阈值区间将会给系统造成恶劣的影响。因此通过历史工况的数据分析,确定各风量调整变化的区间。本实施例的自学3
习优化控制算法中动作空间的动作参数α∈R ,动作空间参数Act={a1,a2,a3}设置为一次风、二次风、再循环烟气量的变化比例(‑25%~25%),每个控制变量可以在两个方向上进行调节。由强化模型的策略网络选取变化范围内的一个确定值。
[0071] (3)奖励函数设计用来量化优化控制动作与环境的交互过程,针对t时刻到t+1时刻状态转移过程中,耦合系统将动作参数执行后的状态空间参数带入到系统运行环境的代理模型中进行交互,得到对应的性能空间参数。依照性能空间参数对耦合系统性能的影响制定奖励函数rtn,将锅炉能耗和污染物浓度排放以及对平均床层温度超限的惩罚项作为关键项设定为奖励最大化任务机制:
[0072]r+1
[0073] 上式中 和N 分别为状态st+1时刻排烟温度和污染物排放浓度,ωr作为超参数给定权重系数,Tstd、Nstd、Lstd是统一数量级的乘积系数。
为锅炉床层温度值 变化量超限惩罚项,λ作为对应惩罚
项的权重系数, 为状态st+1时刻锅炉床层温度值。
[0074] (4)自学习优化控制模型的训练过程主要包括初始化、交互、参数更新三个部分。Q π Q π
首先是初始化过程:分别初始化策略网络Q(s,a|θ)和价值网络π(s|θ)的参数θ和θ ,以及Q π Q Q π π
目标策略网络Q′(s,a|θ)和目标价值网络π′(s|θ)的参数θ ←θ 、θ ←θ,初始化随机噪声初始化大小为5000的经验回放池。随后进入到交互过程:本实施案例交互过程共进行10000次迭代,对于每个迭代步骤,待调控耦合系统获取在一个时间窗口序列的状态参数集Stat=[st‑4,st‑3,st‑2,st‑1,st],并初始化一个随机噪声Nt添加到策略网络的输出上。策略网络根据st时刻状态参数给出一个确定性执行动作at=π(st|θπ)+Nt,执行上述动作at后,转移到新时刻的状态集参数st+1与环境代理模型交互之后预测生成当前的性能指标Pre′t,并反馈实时奖励rth及新时刻状态值st+1,并将得到的数据元组(st,at,rtn,st+1)。作为经验数据存储到经验回放池,直到元组数达到经验回放池大小的设定阈值,进入参数更新阶段:从回放经验池中随机抽取小批量数据元组传输到当前价值网络π和目标价值网络π′。当前价值网络π计Q
算动作参数Acti的价值Q(si,ai|θ),目标价值网络计算下一个时刻状态动作参数Act′i的价π′ Q′
值yj=tj+1+γQ′(sj+1,π′(sj+1|θ )|θ ),使用梯度下降法最小化损失函数
Q
更新参数θ,同时使用批量样本的训练方式
π
去更新参数θ,并同时更新目标网络参数:θQ′=τ
θQ+(1‑τ)θQ′,θπ′=τθπ+(1‑τ)θπ′。然后依次更新策略网络和价值网络以及他们对应的目标网络,循环交互上述阶段的每一个迭代步骤,直至完成整个优化控制过程。
[0075] (5)通过上述步骤的模型迭代训练过程后,完成了耦合系统的在线自学习优化控制模型。图5a‑5c给出了不同负荷工况下使用所述自学习优化控制模型对于锅炉运行的优化情况,其中对于降低氮氧化物排放值的效果显著,并保证了锅炉的床层温度以及排烟温度保持在合理范围。虽在相对低负荷段工况下,为了平衡锅炉内流化质量和燃烧效果,氮氧化物排放值会出现相对增长的情况,但总体上提升了锅炉整体系统的运行品质。
[0076] 综上所述,本发明通过开发一种烟气再循环系统的在线自学习优化控制方法,通过实时在线的为系统提供优化调整方案,很大程度上提高了锅炉灵活性调峰状态下系统运行的综合能效。
[0077] 以上实施例仅用以说明本发明的技术方案,而非是对其的限制,尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换,而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,本领域技术人员根据本说明书内容所做出的非本质改进和调整或者替换,均属本发明所要求保护的范围。
QQ群二维码
意见反馈