首页 / 专利分类库 / 控制;调节 / 列车控制模型的训练方法和装置

列车控制模型的训练方法和装置

申请号 CN202311604309.7 申请日 2023-11-28 公开(公告)号 CN117744471A 公开(公告)日 2024-03-22
申请人 通号城市轨道交通技术有限公司; 发明人 周丽华; 吴亮; 柴荣阳; 彭朝阳; 李涛涛; 张晨; 徐之栋; 马新成; 高泰; 秦亚芬;
摘要 本 发明 提供一种列车控 制模 型的训练方法和装置,该训练方法包括:采集列车以最高运行效率运行的历史运行数据;基于历史运行数据,利用 机器学习 回归 算法 ,建立列车运行仿真模型;基于初始序列,生成多个修正序列;将多个修正序列分别输入列车运行仿真模型,得到多个修正序列分别对应的运行参数;基于多个修正序列分别对应的运行参数,得到多个修正序列中的目标修正序列;基于多个修正序列中的目标修正序列,训练得到列车控制模型。
权利要求

1.一种列车控制模型的训练方法,其特征在于,包括:
采集列车以最高运行效率运行的历史运行数据;
基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
其中,所述运行参数包括以下一项或多项:
总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置
2.根据权利要求1所述的列车控制模型的训练方法,其特征在于,所述基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,包括:
将所述历史运行数据作为输入,采用梯度下降法求解速度级位子模型、位置速度子模型和能耗级位速度子模型的参数,构建所述列车运行仿真模型;
其中,所述速度级位子模型表示为: 所述速度
级位子模型的输入包括上一控制周期对应的仿真瞬时速度 和从m个控制周期之前开始到当前控制周期为止的控制周期分别对应的级位所组成的级位序列 所述速度级位子模型的输出为当前控制周期对应的仿真瞬时速度 所述速度级位子模型的模型参数为a‑m,...,a‑1,a0,b,ttick表示一个控制周期的时长;
所述位置速度子模型表示为:
其中,所述位置速度子模型的输入包括上一控制周期对应的仿真瞬时位置 从m个控制周期之前开始到当前控制周期为止的控制周期分别对应的速度所组成的速度序列和从m个控制周期之前开始到当前控制周期为止的控制周期分别对应的
级位所组成的级位序列 所述位置速度子模型的输出为当前控制周期对应的仿真瞬时位置 所述位置速度子模型的模型参数为c‑m,...,c‑1,c0,d‑m,...,d‑1,d0,e,ttiak表示一个控制周期的时长;
所述能耗级位速度子模型表示为:
其中,所述能耗级位速度子模型的输入包括当前控制周期对应的速度 当前控制周期对应的级位 所述能耗级位速度子模型的输出为当前控制周期对应的能耗 所述能耗级位速度子模型的模型参数为f1,f2,f3,g0,g1,g2,h0,h1,h2。
3.根据权利要求1所述的列车控制模型的训练方法,其特征在于,所述基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列,包括:
基于所述多个修正序列分别对应的运行参数,从所述多个修正序列中剔除满足第一条件的修正序列;
基于剩余的修正序列的总能耗,从剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列;
所述第一条件包括以下至少一项:
所述修正序列对应的总运行时长超过预设运行时长阈值
在所述修正序列对应的多个连续的控制周期中,存在至少一个控制周期对应的速度低于预设速度阈值。
4.根据权利要求1所述的列车控制模型的训练方法,其特征在于,所述基于剩余的修正序列的总能耗,从剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列,包括:
基于剩余的修正序列分别对应的运行时间,对所述剩余的修正序列进行从大到小排序,得到第一顺序的修正序列;
基于第一顺序的修正序列分别对应的能耗的排列顺序,确定能耗异常的修正序列;
从所述剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列。
5.根据权利要求1所述的列车控制模型的训练方法,其特征在于,所述基于所述多个修正序列中的目标修正序列,训练得到列车控制模型,包括:
以所述目标修正序列中对应牵引级位的控制周期的相关参数为训练样本,是否从牵引级位修正为惰性级位为标签,训练得到列车控制模型;
其中,所述控制周期的相关参数包括以下至少一项:剩余运行时间、剩余距离、前方N个坡度段的坡度、前方N个坡度段的长度、当前目标限速、当前顶棚限速、制动减速度、牵引加速度、容忍冲击率,N为大于2的整数。
6.一种列车控制方法,其特征在于,包括:
获取列车实时的相关参数;
将所述列车实时的相关参数输入至列车控制模型,得到所述列车控制模型输出的目标级位;
基于所述目标级位,控制所述列车运行;
其中,所述列车控制模型的训练方法包括:
采集列车以最高运行效率运行的历史运行数据;
基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
其中,所述运行参数包括以下一项或多项:
总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
7.一种列车控制模型的训练装置,其特征在于,包括:
采集模,用于采集列车以最高运行效率运行的历史运行数据;
模型建立模块,用于基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
序列生成模块,用于基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;
所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
参数获取模块,用于将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
目标修正序列获取模块,用于基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
训练模块,用于基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
其中,所述运行参数包括以下一项或多项:
总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的列车控制模型的训练方法,或实现如权利要求6所述的列车控制方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的列车控制模型的训练方法,或实现如权利要求6所述的列车控制方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的列车控制模型的训练方法,或实现如权利要求6所述的列车控制方法。

说明书全文

列车控制模型的训练方法和装置

技术领域

[0001] 本发明涉及轨道交通技术领域,尤其涉及一种列车控制模型的训练方法和装置。

背景技术

[0002] 目前在轨道交通领域实际应用的列车控制方法大多追求最高效率,缺少对节能的关注,在实施时对人的经验依赖性较强,不能确保应用兼顾运行效率与节能的列车控制方法。

发明内容

[0003] 本发明提供一种列车控制模型的训练方法和装置,用以解决现有技术中实际应用的列车控制方法不能兼顾运行效率与节能的缺陷,通过智能化算法实现在降低列车能耗的同时兼顾运行效率。
[0004] 本发明提供一种列车控制模型的训练方法,包括:
[0005] 采集列车以最高运行效率运行的历史运行数据;
[0006] 基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
[0007] 基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0008] 将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0009] 基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0010] 基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
[0011] 其中,所述运行参数包括以下一项或多项:
[0012] 总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置
[0013] 根据本发明提供的一种列车控制模型的训练方法,所述基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,包括:
[0014] 将所述历史运行数据作为输入,采用梯度下降法求解速度级位子模型、位置速度子模型和能耗级位速度子模型的参数,构建所述列车运行仿真模型;
[0015] 其中,所述速度级位子模型表示为: 所述速度级位子模型的输入包括上一控制周期对应的仿真瞬时速度 和从m个控制周期之前开始到当前控制周期为止的控制周期分别对应的级位所组成的级位序列 所
述速度级位子模型的输出为当前控制周期对应的仿真瞬时速度 所述速度级位子模型的模型参数为a‑m,...,a‑1,a0,b,ttick表示一个控制周期的时长;
[0016] 所述位置 速度子模型表 示为:其中,所述位置速度子模型的输入包括上一控制周期对应的仿真瞬时位置
从m个控制周期之前开始到当前控制周期为止的控制周期分别对应的速度所组成的速度序列 和从m个控制周期之前开始到当前控制周期为止的控制周期分别
对应的级位所组成的级位序列 所述位置速度子模型的输出为当前控制周
期对应的仿真瞬时位置 所述位置速度子模型的模型参数为c‑m,...,c‑1,c0,d‑m,...,d‑1,d0,e,ttiak表示一个控制周期的时长;
[0017] 所述能耗级位速度子模型表示为:
[0018]
[0019] 其中,所述能耗级位速度子模型的输入包括当前控制周期对应的速度 当前控制周期对应的级位 所述能耗级位速度子模型的输出为当前控制周期对应的能耗 所述能耗级位速度子模型的模型参数为f1,f2,f3,g0,g1,g2,h0,h1,h2。
[0020] 根据本发明提供的一种列车控制模型的训练方法,所述基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列,包括:
[0021] 基于所述多个修正序列分别对应的运行参数,从所述多个修正序列中剔除满足第一条件的修正序列;
[0022] 基于剩余的修正序列的总能耗,从剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列;
[0023] 所述第一条件包括以下至少一项:
[0024] 所述修正序列对应的总运行时长超过预设运行时长阈值
[0025] 在所述修正序列对应的多个连续的控制周期中,存在至少一个控制周期对应的速度低于预设速度阈值。
[0026] 根据本发明提供的一种列车控制模型的训练方法,所述基于剩余的修正序列的总能耗,从剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列,包括:
[0027] 基于剩余的修正序列分别对应的运行时间,对所述剩余的修正序列进行从大到小排序,得到第一顺序的修正序列;
[0028] 基于第一顺序的修正序列分别对应的能耗的排列顺序,确定能耗异常的修正序列;
[0029] 从所述剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列。
[0030] 根据本发明提供的一种列车控制模型的训练方法,所述基于所述多个修正序列中的目标修正序列,训练得到列车控制模型,包括:
[0031] 以所述目标修正序列中对应牵引级位的控制周期的相关参数为训练样本,是否从牵引级位修正为惰性级位为标签,训练得到列车控制模型;
[0032] 其中,所述控制周期的相关参数包括以下至少一项:剩余运行时间、剩余距离、前方N个坡度段的坡度、前方N个坡度段的长度、当前目标限速、当前顶棚限速、制动减速度、牵引加速度、容忍冲击率,N为大于2的整数。
[0033] 本发明还提供一种列车控制方法,包括:
[0034] 获取列车实时的相关参数;
[0035] 将所述列车实时的相关参数输入至列车控制模型,得到所述列车控制模型输出的目标级位;
[0036] 基于所述目标级位,控制所述列车运行;
[0037] 其中,所述列车控制模型的训练方法包括:
[0038] 采集列车以最高运行效率运行的历史运行数据;
[0039] 基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
[0040] 基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0041] 将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0042] 基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0043] 基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
[0044] 其中,所述运行参数包括以下一项或多项:
[0045] 总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
[0046] 本发明还提供一种列车控制模型的训练装置,包括:
[0047] 采集模,用于采集列车以最高运行效率运行的历史运行数据;
[0048] 模型建立模块,用于基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
[0049] 序列生成模块,用于基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0050] 参数获取模块,用于将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0051] 目标修正序列获取模块,用于基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0052] 训练模块,用于基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
[0053] 其中,所述运行参数包括以下一项或多项:
[0054] 总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
[0055] 本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述的列车控制模型的训练方法,或实现上述列车控制方法。
[0056] 本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的列车控制模型的训练方法,或实现上述列车控制方法。
[0057] 本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的列车控制模型的训练方法,或实现上述的列车控制方法。
[0058] 本发明提供的列车控制模型的训练方法和装置,由于仅对运行数据中的牵引级位进行了修正,因此其易于移植,鲁棒性高;利用列车在最高运行效率下运行的历史运行数据,能够自动生成大量列车控制模型的输入;得到的目标修正序列与最高运行效率运行时的初始序列相比,能够兼顾效率和节能;能够随着输入的更新而实现模型的优化迭代;由于不依靠人的经验判断,可以识别人可能错过的某种兼顾效率和节能的运行方式,可以降低列车能耗的同时兼顾运行效率。附图说明
[0059] 为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0060] 图1是本发明提供的列车控制模型的训练方法的流程示意图;
[0061] 图2是本发明提供的列车控制方法的流程示意图;
[0062] 图3是本发明提供的列车控制模型的训练装置的结构示意图;
[0063] 图4是本发明提供的电子设备的结构示意图。

具体实施方式

[0064] 为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0065] 首先对以下内容进行介绍:
[0066] 为了满足人们对节能环保的需求,在城市轨道交通中节能也成为了重要目标。然而目前实际应用的列车自动控制方法大多追求最高效率,运行时间误差较大,缺少对节能的关注,此外,其无法随着时间的推移和运行数据的累积实现优化迭代,而且对人的经验的依赖性较强,容易陷入某个局部最优解,无法从海量的运行数据中,识别人可能错过的某种兼顾效率和节能的运行方式。因此,研究如何优化当前的列车运行方法,进一步地,研究如何通过智能化算法实现在降低列车能耗的同时兼顾运行效率是亟待解决的课题。
[0067] 在列车运行过程中主要存在以下三种控制模式:牵引、制动与惰行。由于惰行模式比牵引模式更加节能,在能够达到运行目标的情况下,尽量使列车惰行能够使能耗更低。
[0068] 为了克服上述缺陷,本发明提供一种列车控制模型的训练方法及装置,实现以下优点:
[0069] 1、兼顾运行时间和节能;
[0070] 2、可以识别人可能错过的某种兼顾效率和节能的运行方式;
[0071] 3、由于仅修正牵引级位,因此,易于移植,能够与不同类型的控制方法兼容;
[0072] 4、能够随着运行数据的更新而实现优化迭代;
[0073] 5、利用所收集的运行数据,能够自动生成大量训练输入。
[0074] 下面结合附图描述本发明的列车控制模型的训练方法及装置。
[0075] 图1是本发明提供的列车控制模型的训练方法的流程示意图,如图1所示,该方法包括如下步骤:
[0076] 步骤100,采集列车以最高运行效率运行的历史运行数据;
[0077] 在真实线路的一个或多个列车上,使用现有的列车控制方法使列车以最高运行效率运行多日,采集列车的运行日志,即列车在运行过程中的历史运行数据。需要指出的是,本发明中的以最高运行效率运行指的是保证列车在运行过程中不超速的条件下达到的最高运行效率运行的情况。其中,列车牵引、制动转换的最大延时共m个控制周期,每个控制周期对应的时间为t00ck,该采集的历史运行数据包括列车在连续的多个控制周期的每个控制周期内的瞬时位置s0、瞬时速度v0、级位l0、瞬时功率p0等数据信息。级位也可以称为控制级位、输出级位等。
[0078] 其中,列车在一个控制周期内对应一个级位,因此,列车在这个控制周期内的级位l0也可称为当前级位l0,而在采集列车在一个控制周期内的位置、速度和功率时,只需要选取列车在这个控制周期内的一个时间点进行采集即可,可选地,可以在这个周期的开始时间点对列车的瞬时位置s0、瞬时速度v0、级位l0、瞬时功率p0等数据信息进行采集,也可以是其他时间点,本发明不对此进行限制。也可以将瞬时位置s0、瞬时速度v0、级位l0、瞬时功率p0称为当前位置s0、当前速度v0、当前级位l0、当前功率p0。
[0079] 步骤110,基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;其中,所述运行参数包括以下一项或多项:总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
[0080] 在一些实施例中,基于上述步骤100中采集的历史运行数据,即列车在连续的多个控制周期的每个周期内的瞬时位置s0、瞬时速度v0、级位l0、瞬时功率p0等数据信息,通过机器学习回归算法处理上述历史运行数据,定义以下子模型并建立列车运行仿真模型,其中代价函数采用均方值,利用梯度下降法将模型最优化,最终得到以下列车运行仿真模型中的各模型参数,其中列车在多个连续的控制周期的每个周期分别对应的级位组成的级位序列组成初始序列,列车的瞬时位置s0、瞬时速度v0、级位l0、瞬时功率p0等为列车的运行参数。
[0081] 其中,速度级位子模型定义如下:
[0082] 其中,该速度级位子模型的输入为上一控制周期的仿真瞬时速度 和从m个周期前的输出级位至当前控制周期的级位
该速度级位子模型的输出为当前控制周期的仿真瞬时速度 a‑m,...,
a‑1,a0,b为模型参数,ttick表示一个控制周期的时长。
[0083] 位置速度子模型定义如下:
[0084]
[0085] 其中,该位置速度子模型的输入为上一控制周期的仿真瞬时位置 从m个周期前的仿真瞬时速度至当前控制周期的仿真瞬时速度 和从m个周期前的级位至当前控制周期的级位 ttick表示一个控制周期的时长,该位置速度子模
型的输出为当前控制周期的仿真瞬时位置 c‑m,...,c‑1,c0,d‑m,...,d‑1,d0,e为模型参数。
[0086] 能耗级位速度子模型定义如下,以下的第一个公式结果代入第二个公式,第二个公式结果代入第三个公式,得到最终能耗结果:
[0087]
[0088]
[0089]
[0090] 其中,根据实测数据建模的结果简化,采用分段描述方法,得到能耗级位速度子模型,其输入为当前控制周期的仿真瞬时速度 当前控制周期的仿真级位 该能耗级位速度子模型的输出为当前控制周期的仿真瞬时功率 模型参数为f1,f2,f3,g0,g1,g2,h0,h1,h2。如上所述,根据上述列车运行仿真模型,即速度级位子模型、位置速度子模型和能耗级位速度子模型,能够建立列车运行仿真模型,能够模拟列车的真实运行情况。
[0091] 步骤120,基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到的;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0092] 将步骤100中得到的列车在多个连续的控制周期中以最高运行效率运行的情况下各个控制周期对应的级位所组成的级位序列定义为初始序列,对该初始序列进行以下处理。由于该多个控制周期是基于列车牵引、制动转换的最大延时定义的,所以其中至少存在一个牵引控制周期。对该初始序列中的至少一个非惰行的控制周期的级位以使其转换为惰行的方式进行修正,能够生成一个新的序列,可以将这个新的序列称为修正序列。通过重复以上修正的操作,可以不断生成新的修正序列,最终可以得到一系列修正序列。
[0093] 具体来说,例如列车在牵引、制动转换的最大延时共3个控制周期,初始序列为牵引‑惰行‑牵引‑制动。对该初始序列重复进行级位的修正操作后得到:惰行‑惰行‑牵引‑制动;惰行‑惰行‑惰行‑制动;牵引‑惰行‑惰行‑制动共3个修正序列。
[0094] 可选地,可以以二叉树生成序列的方式根据初始序列生成多个修正序列。
[0095] 步骤130,将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0096] 将上述多个修正序列分别输入上述列车运行仿真模型中,能够得到多个修正序列分别对应的仿真运行参数。
[0097] 记录每个修正序列在每个控制周期的瞬时位置、瞬时速度、级位。由于列车的信号系统自身会存储线路地图,根据瞬时位置可以从地图中获取所处坡度、前方坡度的长度和坡度值,当前顶棚限速、信号系统自身包含控制所需的制动减速度、牵引加速度、容忍冲击率、此外,根据运行计划可以获取目标限速。这些值都是确定的,进一步能够得到前方N个坡度段的坡度值、前方N个坡度段的坡度长度、当前坡度值、当前剩余坡度长度以及修正序列在所有控制周期的总能耗和总运行时间,N为大于2的整数。
[0098] 步骤140,基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0099] 在一些实施例中,基于所述多个修正序列分别对应的运行参数,从所述多个修正序列中剔除满足第一条件的修正序列;
[0100] 基于剩余的修正序列的总能耗,从剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列;
[0101] 所述第一条件包括以下至少一项:
[0102] 所述修正序列对应的总运行时长超过预设运行时长阈值;
[0103] 在所述修正序列对应的多个连续的控制周期中,存在至少一个控制周期对应的速度低于预设速度阈值。
[0104] 基于步骤130中得到的多个修正序列,剔除其中符合下列至少一项条件的修正序列:运行时间超过预设运行时长阈值的修正序列;在所述修正序列对应的多个连续的控制周期中,存在至少一个控制周期对应的速度低于预设速度阈值的修正序列,此外,基于剩余的修正序列的总能耗,从剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列。其中,剔除运行时间超过预设运行时长阈值的修正序列是为了保证列车的运行效率在合理范围内;剔除在所述修正序列对应的多个连续的控制周期中,存在至少一个控制周期对应的速度低于预设速度阈值的修正序列是为了保证列车的正常运行,不会出现例如速度过低导致中途停车等的情况;剔除剩余的修正序列中的总能耗异常的修正序列,是指例如剔除在运行时间较短的情况下总能耗较高的、或者总能耗高于列车以最高运行效率运行情况下的总能耗的修正序列等,这样是为了优选出能够保证列车兼顾高效与节能的目标修正序列。
[0105] 具体来说,例如设计如下评价指标对修正序列进行评价。
[0106]
[0107] 其中,T和E表示列车在以最高运行效率、即在初始序列的级位的控制下运行的运行时间和能耗,运行时间Tr和能耗Er表示修正序列根据步骤130得到的运行时间和能耗。对α
[0108] 在一些实施例中,基于剩余的修正序列分别对应的运行时间,对所述剩余的修正序列进行从大到小排序,得到第一顺序的修正序列;
[0109] 基于第一顺序的修正序列分别对应的能耗的排列顺序,确定能耗异常的修正序列;
[0110] 从所述剩余的修正序列中剔除总能耗异常的修正序列,得到目标修正序列。
[0111] 具体来说,在将步骤130中得到的修正序列以运行时间从大到小排列时,列车的总能耗按照常理推测应该是从大到小,但是存在列车运行时间较小但是能耗较高的异常情况,此外,还可能出现总能耗高于列车以最高运行效率运行情况下的总能耗的异常修正序列等,在这些情况下需要剔除出现异常能耗情况的修正序列,由此得到的剩余的修正序列为目标修正序列。如上所述可知,目标修正序列为运行效率和能耗比较平衡且优良的控制级位的组合,也即,列车在多个运行周期中采用目标修正序列中的级位进行控制,运行所产生的能耗低于列车以最高运行效率运行所产生的能耗,且运行效率在合理范围内。
[0112] 具体来说,将剔除后剩余的修正序列按照运行时间从小到大排序,判定各个修正序列的能耗顺序是否为从小到大,剔除其中能耗不符合排序的样本,形成最优训练集,作为步骤150中的列车控制模型的输入。例如,剔除下列表1中的修正序列2,剩余的修正序列1、修正序列3和修正序列4为目标修正序列。
[0113]
[0114]
[0115] 步骤150,基于所述多个修正序列中的目标修正序列,训练得到列车控制模型。
[0116] 在一些实施例中,以所述目标修正序列中对应牵引级位的控制周期的相关参数为训练样本,是否从牵引级位修正为惰性级位为标签,训练得到列车控制模型;
[0117] 其中,所述控制周期的相关参数包括以下至少一项:剩余运行时间、剩余距离、前方N个坡度段的坡度、前方N个坡度段的长度、当前目标限速、当前顶棚限速、制动减速度、牵引加速度、容忍冲击率,N为大于2的整数。
[0118] 具体来说,以所述目标修正序列中对应牵引级位的控制周期的相关参数为训练样本,是否从牵引级位修正为惰性级位为标签,训练得到列车控制模型,其中,所述控制周期的相关参数包括以下至少一项:剩余运行时间、剩余距离、前方N个坡度段的坡度、前方N个坡度段的长度、当前目标限速、当前顶棚限速、制动减速度、牵引加速度、容忍冲击率,N为大于2的整数。具体地,根据步骤130能够收集目标修正序列在每个控制周期的瞬时位置、瞬时速度、级位、前方N个坡度段的坡度值、前方N个坡度段的坡度长度、当前坡度值、当前剩余坡度长度、目标限速、顶棚限速、制动减速度、牵引加速度、容忍冲击率、能耗、运行时间,N为大于2的整数。根据目标修正序列所处的工况转换点情况,通过计算,能够得出其在每个牵引控制周期的剩余的运行时间和剩余距离。将目标修正序列的剩余的运行时间、剩余距离、前方N个坡度段的坡度值、前方N个坡度段的坡度长度、目标限速、顶棚限速、制动减速度、牵引加速度、容忍冲击率作为训练样本,N为大于2的整数。此外,为每个样本的级位修正情况进行标注。例如,在一个实施方式中,(0)表示将牵引级位修正为惰行,(1)表示维持牵引级位。
[0119] 根据上述列车控制模型的训练方法,由于仅对运行数据中的牵引级位进行了修正,因此其易于移植,鲁棒性高;利用列车在最高运行效率下运行的历史运行数据,能够自动生成大量列车控制模型的输入;得到的目标修正序列与最高运行效率运行时的初始序列相比,能够兼顾效率和节能;能够随着输入的更新而实现模型的优化迭代;由于不依靠人的经验判断,可以识别人可能错过的某种兼顾效率和节能的运行方式。
[0120] 可选地,基于所述多个修正序列中的目标修正序列,训练得到列车控制模型还包括选择适当的神经网络结构,其包括输入层隐藏层输出层的神经元。可选地,输入层和隐藏层神经元选择ReLU激活函数,输出层神经元选择Sigmoid激活函数。深度学习模型输出为0/1。此外,根据实际需要选择适当的损失函数来度量模型预测结果与真实标签之间的差异。
[0121] 可选地,基于所述多个修正序列中的目标修正序列,训练得到列车控制模型还包括通过反向传播算法和优化算法(如随机梯度下降)来更新网络参数,以最小化损失函数。
[0122] 可选地,还可以使用验证数据集对训练过程中的列车控制模型进行评估。根据验证集的性能指标,如准确率、精确率、召回率等,对列车控制模型进行调优,如调整网络结构、调整超参数等。
[0123] 可选地,在列车车况、行驶路况发生改变或者出现控车技术更新等影响列车运行数据的情况下,能够重新采集列车以最高运行效率运行的历史运行数据,从而简便地对本发明中的列车运行仿真模型和列车控制模型进行更新和迭代。
[0124] 可选地,通过采集更多列车以最高运行效率运行的历史运行数据作为步骤100的输入能够不断优化本发明中的列车运行仿真模型和列车控制模型。
[0125] 下面参照图2对本发明提供的列车控制方法进行描述,下文描述的列车控制方法与上文描述的列车控制模型的训练方法可相互对应参照。
[0126] 另一方面,本发明还提供一种列车控制方法,如图2所示,包括:
[0127] 步骤200,获取列车实时的相关参数;
[0128] 步骤210,将所述列车实时的相关参数输入至列车控制模型,得到所述列车控制模型输出的目标级位;
[0129] 步骤220,基于所述目标级位,控制所述列车运行;
[0130] 其中,所述列车控制模型的训练方法包括:
[0131] 采集列车以最高运行效率运行的历史运行数据;
[0132] 基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
[0133] 基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0134] 将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0135] 基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0136] 基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
[0137] 其中,所述运行参数包括以下一项或多项:
[0138] 总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
[0139] 具体来说,在将上述列车控制方法应用实际运行的列车中时,需要先对该列车利用列车控制模型的训练方法训练得到该列车的列车控制模型,详细情况可参照上文,此处不再赘述。在训练得到了该列车的列车控制模型的情况下,列车控制方法具体包括如下步骤:在正在运行的列车上采集并获取该列车实时的相关参数,具体地,列车的相关参数包括:剩余运行时间、剩余距离、前方N个坡度段的坡度、前方N个坡度段的长度、当前目标限速、当前顶棚限速、制动减速度、牵引加速度、容忍冲击率,N为大于2的整数;将该列车实时的相关参数输入至列车控制模型,得到所述列车控制模型输出的目标级位;基于所述目标级位,控制所述列车运行。
[0140] 本发明还提供一种列车控制模型的训练装置300,如图3所示,包括:
[0141] 采集模块310,用于采集列车以最高运行效率运行的历史运行数据;
[0142] 模型建立模块320,用于基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
[0143] 序列生成模块330,用于基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0144] 参数获取模块340,用于将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0145] 目标修正序列获取模块350,用于基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0146] 训练模块360,用于基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
[0147] 其中,所述运行参数包括以下一项或多项:
[0148] 总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
[0149] 图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行列车控制方法,该方法包括:
[0150] 获取列车实时的相关参数;
[0151] 将所述列车实时的相关参数输入至列车控制模型,得到所述列车控制模型输出的目标级位;
[0152] 基于所述目标级位,控制所述列车运行;
[0153] 其中,所述列车控制模型的训练方法包括:
[0154] 采集列车以最高运行效率运行的历史运行数据;
[0155] 基于所述历史运行数据,利用机器学习回归算法,建立列车运行仿真模型,其中,所述列车运行仿真模型的输入包括所述列车在多个连续的控制周期分别对应的级位所组成的级位序列,所述列车运行仿真模型的输出包括所述列车在所述多个连续的控制周期中运行的运行参数;
[0156] 基于初始序列,生成多个修正序列,其中,所述多个修正序列互不相同,且所述修正序列是将所述初始序列中的至少一个牵引级位修正为惰行级位后得到;所述初始序列为列车在多个连续的控制周期中以最高运行效率运行的情况下分别对应的级位所组成的级位序列;
[0157] 将所述多个修正序列分别输入所述列车运行仿真模型,得到所述多个修正序列分别对应的运行参数;
[0158] 基于所述多个修正序列分别对应的运行参数,得到所述多个修正序列中的目标修正序列;
[0159] 基于所述多个修正序列中的目标修正序列,训练得到列车控制模型;
[0160] 其中,所述运行参数包括以下一项或多项:
[0161] 总运行时长、总能耗、各控制周期对应的速度、各控制周期对应的位置。
[0162] 此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0163] 另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述列车控制模型的训练方法,或实现上述列车控制方法。
[0164] 另一方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述列车控制模型的训练方法,或实现上述的列车控制方法。
[0165] 以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0166] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0167] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
QQ群二维码
意见反馈