首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 人工神经网络 / 前馈神经网络 / 一种舰载机导引路径规划方法

一种舰载机导引路径规划方法

阅读:738发布:2020-05-12

专利汇可以提供一种舰载机导引路径规划方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种舰载机导引路径规划方法。该方法包括步骤有预测碍障物,获取舰载机和周围相邻的障碍物的历史轨迹,利用LSTM 编码预测 障碍物的运动轨迹;更新导向,根据舰载机 位置 与目标点位置之间的关系更新舰载机导向目标点的定向关系; 碰撞检测 ,对舰载机和障碍物进行建模,检测舰载机运动过程中与相邻障碍物是否发生碰撞。通过该方法,可以在路径规划的同时有效的实现动态障碍物的碰撞避免,还加入了多种控制选择动作的限制,实现动态避障以及DQN的快速收敛,该方法使训练的时间大大缩短,提高了效率。,下面是一种舰载机导引路径规划方法专利的具体信息内容。

1.一种舰载机导引路径规划方法,其特征在于,包括以下步骤:
预测碍障物,获取舰载机和周围相邻的障碍物的历史轨迹,利用LSTM编码预测障碍物的运动轨迹;
更新导向,根据舰载机位置与目标点位置之间的关系更新舰载机导向目标点的定向关系;
碰撞检测,对舰载机和障碍物进行建模,检测舰载机运动过程中与相邻障碍物是否发生碰撞。
2.根据权利要求1所述的舰载机导引路径规划方法,其特征在于,在预测碍障物步骤中,利用LSTM编码预测障碍物的运动轨迹包括:
第一步,被预测的障碍物i从T1至Tobs的历史轨迹为 被
预测的障碍物的周围障碍物的历史轨迹包括
第二步,经过LSTM框架的遗忘输入t-1时刻的状态值ht-1、xt,输出为
其中σ1代表遗忘门sigmod函数,表达式为 表示遗忘门的神经元的权值,
表示遗忘门的神经元的偏置值;
第三步,进一步经过LSTM框架的更新门,先通过输入门sigmod函数σ2,输出为
表示输入门的神经元的权值, 表示输入门的神经元的偏置值,
然后通过tanh层,创建一个新的候选值向量,表达式为 表示
计算候选值向量的神经元的权值, 表示计算候选值向量的神经元的偏置值;
第四步,将第二步和第三步确定好的更新内容添加到记忆当中,得到新的记忆Ct=ft*Ct-1+it*Ct;
第五步,计算当前隐藏层的状态ht=ot*tanh(Ct),表示输出已确定的输出部分,Ot=σ(Wo[ht-1,xt]+bo)为输出部分,Wo表示输出部分的神经元的权值,bo表示输出部分的神经元的偏置值;
第六步,按照以上方法将被预测障碍物以及被预测障碍物周围障碍物编码成为:
3.根据权利要求2所述的舰载机导引路径规划方法,其特征在于,在预测碍障物步骤中进一步包括:
用soft  attention计算被预测障碍物的向量 其中权值αtj为
etj=a(st-1,hj),其中a表示前馈神经网络
用hard attention计算被预测障碍物周围邻居障碍物的向量
其中 dis(n,j)表示在j时间点,第n个邻居障碍到被预测障碍物的距离;
将上述计算出来的两个向量结合,得到合并向量 权值Wc通过反向
传播学习得到;
利用LSTM框架计算预测位置, 其中st-1表示解码器在t-1时刻的
隐藏状态,yt-1表示解码器在t-1时刻的输出值。
4.根据权利要求1所述的舰载机导引路径规划方法,其特征在于,在更新导向步骤中包括:首先初始化i=0,然后判断i%T是否为0,T表示间隔决策次数,如果为0,表示重新定向,否则直接按照原来的定向选择动作;如果重新定向,表示按照当前位置P和目的位置S设置向量 根据 的大小确定变量值:
选择完舰载机位置后,执行i=i+1;判断是否到达终点,若未到达终点,则返回到判断i%T是否为0处重复执行,一直到达终点结束。
5.根据权利要求1所述的舰载机导引路径规划方法,其特征在于,在所述碰撞检测步骤中,获得障碍物的预测位置坐标(x1,y1),对舰载机在展翼状态下建模为五边形:
中心坐标为o=(x1,y1);
前方坐标为p1=(x1+cosθ×L,y1+sinθ×L),其中θ为 和x轴之间的夹,L为 的模;
左前方坐标为p2=(x1+cos(θ+ψ)×h,y1+sin(θ+ψ)×h),其中ψ为 和 之间的夹角,h为 的模;
右前方坐标为p3=(x1+cos(θ-ψ)×h,y1+sin(θ-ψ)×h);
左后方坐标为p4=(x1+cos(θ+β)×d,y1+sin(θ+β)×d),其中β为 和 之间的夹角,d为 的模;
右后方坐标为p5=(x1+cos(θ-β)×d,y1+sin(θ-β)×d)。
6.根据权利要求5所述的舰载机导引路径规划方法,其特征在于,对舰载机在合翼状态下建模为:
中心坐标为o=(x1,y1);
前方坐标为p1=(x1+cosθ×L,y1+sinθ×L),其中θ为 和x轴之间的夹角,L为 的模;
左前方坐标为p'2=(x1+cos(θ+ψ)×h',y1+sin(θ+ψ)×h'),其中ψ为 和 之间的夹角;h'为 的模;
右前方坐标为p'3=(x1+cos(θ-ψ)×h',y1+sin(θ-ψ)×h');
左后方坐标为p4=(x1+cos(θ+β)×d,y1+sin(θ+β)×d),其中β为 和 之间的夹角,d为 的模;
右后方坐标为p5=(x1+cos(θ-β)×d,y1+sin(θ-β)×d)。
7.根据权利要求6所述的舰载机导引路径规划方法,其特征在于,对加油车建模为:
中心坐标为o=(x1,y1);
左前方坐标:q1=(x1+cos(θ+ω)×m,y1+sin(θ+ω)×m),其中θ为加油车运动方向和x轴之间的夹角,ω为加油车运动方向和 之间的夹角;m是 的模;
右前方坐标:q2=(x1+cos(θ-ω)×m,y1+sin(θ-ω)×m);
左后方坐标:q3=(x1-sin(θ-ω)×m,y1+cos(θ-ω)×m);
右后方坐标:q4=(x1-sin(ω-θ)×m,y1-cos(ω-θ)×m)。
8.根据权利要求7所述的舰载机导引路径规划方法,其特征在于,对人建模为:半径为r,圆心坐标为o=(x1,y1)的圆。
9.根据权利要求8所述的舰载机导引路径规划方法,其特征在于,舰载机在展翼状态下五条边分别列方程为:
线段p1p2:
线段p1p3:
线段p2p4:
线段p3p5:
线段p4p5:
人的函数表达式:(x-x1)2+(y-y1)2=r2;
通过上述五个表达式建立方程组,若方程组有解,则表明有交点,若方程组无解,则表明没有交点。
10.根据权利要求1所述的舰载机导引路径规划方法,其特征在于,进一步给出了基于DQN算法的自主学习导引路径规划方法,环境将四元组(s,a,r,s’)传回给回放记忆单元,回放记忆单元将其传递给当前值网络和目标值网络,两个网络各自计算得到Q值,进行误差函数计算,将计算得到的loss函数更新当前值网络,而目标值网络则是根据一定的时间间隔将当前值网络的参数复制给目标值网络,其中包括步骤:
第一步,环境将当前状态传递给当前的值网络,该网络经过计算分别得到四个动作的值函数Q1=(s,a1;θ),Q2=(s,a2;θ),Q3=(s,a3;θ),Q4=(s,a4;θ)。其中s表示当前状态;a表示下一步所采取的动作,有a1至a4四个方向的动作,θ表示参数;
第二步,根据周围障碍物预测位置,对当前Q网络进行修正:
F(Qi)=Qi×β,
其中
第三步,根据指导向量将上述F(Qi)做进一步修正:
第四步,将max(G(F(Qi)))作为选出的动作返回给环境。

说明书全文

一种舰载机导引路径规划方法

技术领域

[0001] 本发明涉及计算机技术领域,尤其涉及一种舰载机导引路径规划方法。

背景技术

[0002] 舰载机在甲板上的有限空间内移动,需要对导引路径进行规划,以此实现有效避障、高效移动,确保舰载机的安全和各种设施、人员安全。现有技术中缺乏针对舰载机路径导引的计算机仿真规划方法,难以实现动态避障、自动导引、模型简化的计算机仿真。

发明内容

[0003] 本发明主要解决的技术问题是提供一种舰载机导引路径规划方法,解决现有技术中缺乏有效实现动态避障、自动导引和复杂度低的计算机仿真的舰载机导引路径规划方法。
[0004] 为解决上述技术问题,本发明采用的一个技术方案是提供一种舰载机导引路径规划方法,包括以下步骤:预测碍障物,获取舰载机和周围相邻的障碍物的历史轨迹,利用LSTM编码预测障碍物的运动轨迹;更新导向,根据舰载机位置与目标点位置之间的关系更新舰载机导向目标点的定向关系;碰撞检测,对舰载机和障碍物进行建模,检测舰载机运动过程中与相邻障碍物是否发生碰撞。
[0005] 在本发明舰载机导引路径规划方法另一实施例中,在预测碍障物步骤中,利用LSTM编码预测障碍物的运动轨迹包括:
[0006] 第一步,被预测的障碍物i从T1至Tobs的历史轨迹为被预测的障碍物的周围障碍物的历史轨迹包括
[0007] 第二步,经过LSTM框架的遗忘输入t-1时刻的状态值ht-1、xt,输出为其中σ1代表遗忘门sigmod函数,表达式为 表
示遗忘门的神经元的权值, 表示遗忘门的神经元的偏置值;
[0008] 第三步,进一步经过LSTM框架的更新门,先通过输入门sigmod函数σ2,输出为表示输入门的神经元的权值, 表示输入门的神经元的偏置值,然后通过tanh层,创建一个新的候选值向量,表达式为 表示
计算候选值向量的神经元的权值, 表示计算候选值向量的神经元的偏置值;
[0009] 第四步,将第二步和第三步确定好的更新内容添加到记忆当中,得到新的记忆Ct=ft*Ct-1+it*Ct;
[0010] 第五步,计算当前隐藏层的状态ht=ot*tanh(Ct),表示输出已确定的输出部分,Ot=σ(Wo[ht-1,xt]+bo)为输出部分,Wo表示输出部分的神经元的权值,bo表示输出部分的神经元的偏置值;
[0011] 第六步,按照以上方法将被预测障碍物以及被预测障碍物周围障碍物编码成为:
[0012]
[0013] 在本发明舰载机导引路径规划方法另一实施例中,在预测碍障物步骤中进一步包括:
[0014] 用soft attention计算被预测障碍物的向量 其中权值αtj为其中a表示前馈神经网络
[0015] 用hard attention计算被预测障碍物周围邻居障碍物的向量其中 dis(n,j)表示在j时间点,第n个邻居障碍到被预测障碍物的距离;
[0016] 将上述计算出来的两个向量结合,得到合并向量 权值Wc通过反向传播学习得到;
[0017] 利用LSTM框架计算预测位置, 其中st-1表示解码器在t-1时刻的隐藏状态,yt-1表示解码器在t-1时刻的输出值。
[0018] 在本发明舰载机导引路径规划方法另一实施例中,在更新导向步骤中包括:首先初始化i=0,然后判断i%T是否为0,如果为0,表示重新定向,否则直接按照原来的定向选择动作;如果重新定向,表示按照当前位置P和目的位置S设置向量 根据 的大小确定变量值:
[0019]
[0020] 选择完舰载机位置后,执行i=i+1;判断是否到达终点,若未到达终点,则返回到判断i%T是否为0处重复执行,一直到达终点结束。
[0021] 在本发明舰载机导引路径规划方法另一实施例中,在所述碰撞检测步骤中,获得障碍物的预测位置坐标(x1,y1),对舰载机在展翼状态下建模为五边形:中心坐标为o=(x1,y1);前方坐标为p1=(x1+cosθ×L,y1+sinθ×L),其中θ为 和x轴之间的夹,L为 的模;左前方坐标为p2=(x1+cos(θ+ψ)×h,y1+sin(θ+ψ)×h),其中ψ为 和 之间的夹角,h为的模;右前方坐标为p3=(x1+cos(θ-ψ)×h,y1+sin(θ-ψ)×h);左后方坐标为p4=(x1+cos(θ+β)×d,y1+sin(θ+β)×d),其中β为 和 之间的夹角,d为 的模;右后方坐标为p5=(x1+cos(θ-β)×d,y1+sin(θ-β)×d)。
[0022] 在本发明舰载机导引路径规划方法另一实施例中,对舰载机在合翼状态下建模为:中心坐标为o=(x1,y1);前方坐标为p1=(x1+cosθ×L,y1+sinθ×L),其中θ为 和x轴之间的夹角,L为 的模;左前方坐标为p'2=(x1+cos(θ+ψ)×h',y1+sin(θ+ψ)×h'),其中ψ为和 之间的夹角;h'为 的模;右前方坐标为p'3=(x1+cos(θ-ψ)×h',y1+sin(θ-ψ)×h');左后方坐标为p4=(x1+cos(θ+β)×d,y1+sin(θ+β)×d),其中β为 和 之间的夹角,d为 的模;右后方坐标为p5=(x1+cos(θ-β)×d,y1+sin(θ-β)×d)。
[0023] 在本发明舰载机导引路径规划方法另一实施例中,对加油车建模为:中心坐标为o=(x1,y1);左前方坐标:q1=(x1+cos(θ+ω)×m,y1+sin(θ+ω)×m),其中θ为加油车运动方向和x轴之间的夹角,ω为加油车运动方向和 之间的夹角;m是 的模;右前方坐标:q2=(x1+cos(θ-ω)×m,y1+sin(θ-ω)×m);左后方坐标:q3=(x1-sin(θ-ω)×m,y1+cos(θ-ω)×m);右后方坐标:q4=(x1-sin(ω-θ)×m,y1-cos(ω-θ)×m)。
[0024] 在本发明舰载机导引路径规划方法另一实施例中,对人建模为:半径为r,圆心坐标为o=(x1,y1)的圆。
[0025] 在本发明舰载机导引路径规划方法另一实施例中,舰载机在展翼状态下五条边分别列方程为:
[0026] 线段p1p2:
[0027] 线段p1p3:
[0028] 线段p2p4:
[0029]
[0030] 线段p3p5:
[0031] 线段p4p5:
[0032] 人的函数表达式:(x-x1)2+(y-y1)2=r2;
[0033] 通过上述五个表达式建立方程组,若方程组有解,则表明有交点,若方程组无解,则表明没有交点。
[0034] 在本发明舰载机导引路径规划方法另一实施例中,进一步给出了基于DQN算法的自主学习导引路径规划方法,环境将四元组(s,a,r,s,)传回给回放记忆单元,回放记忆单元将其传递给当前值网络和目标值网络,两个网络各自计算得到Q值,进行误差函数计算,将计算得到的loss函数更新当前值网络,而目标值网络则是根据一定的时间间隔将当前值网络的参数复制给目标值网络,其中包括步骤:
[0035] 第一步,环境将当前状态传递给当前的值网络,该网络经过计算分别得到四个动作的值函数Q1=(s,a1;θ),Q2=(s,a2;θ),Q3=(s,a3;θ),Q4=(s,a4;θ)。其中s表示当前状态;a表示下一步所采取的动作,有a1至a4四个方向的动作,θ表示参数;
[0036] 第二步,根据周围障碍物预测位置,对当前Q网络进行修正:
[0037] F(Qi)=Qi×β,
[0038] 其中
[0039] 第三步,根据指导向量将上述F(Qi)做进一步修正:
[0040]
[0041] 第四步,将max(G(F(Qi)))作为选出的动作返回给环境。
[0042] 本发明的有益效果是:本发明公开了一种舰载机导引路径规划方法。该方法包括步骤有预测碍障物,获取舰载机和周围相邻的障碍物的历史轨迹,利用LSTM编码预测障碍物的运动轨迹;更新导向,根据舰载机位置与目标点位置之间的关系更新舰载机导向目标点的定向关系;碰撞检测,对舰载机和障碍物进行建模,检测舰载机运动过程中与相邻障碍物是否发生碰撞。通过该方法,可以在路径规划的同时有效的实现动态障碍物的碰撞避免,还加入了多种控制选择动作的限制,实现动态避障以及DQN的快速收敛,该方法使训练的时间大大缩短,提高了效率。附图说明
[0043] 图1是根据本发明舰载机导引路径规划方法一实施例的流程图
[0044] 图2是根据本发明舰载机导引路径规划方法另一实施例中的障碍物位置预测方法流程图;
[0045] 图3-图6是根据本发明舰载机导引路径规划方法另一实施例中的LSTM框架中各阶段流程图;
[0046] 图7是根据本发明舰载机导引路径规划方法另一实施例中更新导向流程图;
[0047] 图8是根据本发明舰载机导引路径规划方法另一实施例中碰撞检测流程图;
[0048] 图9是根据本发明舰载机导引路径规划方法另一实施例中舰载机的展翼状态下建模示意图;
[0049] 图10是根据本发明舰载机导引路径规划方法另一实施例中舰载机的合翼状态下建模示意图;
[0050] 图11是根据本发明舰载机导引路径规划方法另一实施例中加油车建模示意图;
[0051] 图12是根据本发明舰载机导引路径规划方法另一实施例中人建模示意图;
[0052] 图13是根据本发明舰载机导引路径规划方法另一实施例中基于DQN算法的舰载机导引路径规划流程图。

具体实施方式

[0053] 为了便于理解本发明,下面结合附图和具体实施例,对本发明进行更详细的说明。附图中给出了本发明的较佳的实施例。但是,本发明可以以许多不同的形式来实现,并不限于本说明书所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
[0054] 需要说明的是,除非另有定义,本说明书所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是用于限制本发明。本说明书所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0055] 图1显示了本发明舰载机导引路径规划方法一实施例的流程图。
[0056] 在图1中,包括以下步骤:
[0057] 步骤S101:预测障碍物,获取舰载机和周围相邻的障碍物的历史轨迹,利用LSTM编码预测障碍物的运动轨迹;
[0058] 步骤S102:更新导向,根据舰载机位置与目标点位置之间的关系更新舰载机导向目标点的定向关系;
[0059] 步骤S103:碰撞检测,对舰载机和障碍物进行建模,检测舰载机运动过程中与相邻障碍物是否发生碰撞。
[0060] 对于步骤S101,优选的,根据障碍物的历史轨迹,利用LSTM框架将它们的历史轨迹编码成一系列序列值,结合图2至图6所示,编码过程如下所示:
[0061] 在预测碍障物步骤中,利用LSTM编码预测障碍物的运动轨迹包括:
[0062] 第一步,被预测的障碍物i从T1至Tobs的历史轨迹为被预测的障碍物的周围障碍物的历史轨迹包括
[0063] 第二步,如图3的左侧区域所示,经过LSTM框架的遗忘门输入t-1时刻的状态值ht-1、xt,输出为 其中σ1代表遗忘门sigmod函数,表达式为表示遗忘门的神经元的权值, 表示遗忘门的神经元的偏置值;
[0064] 第三步,如图4的中间区域,进一步经过LSTM框架的更新门,先通过输入门sigmod函数σ2,输出为 表示输入门的神经元的权值, 表示输入门的神经元的偏置值,然后通过tanh层,创建一个新的候选值向量,表达式为
表示计算候选值向量的神经元的权值, 表示计算候选值向量的神经元的偏置值;
[0065] 第四步,将第二步和第三步确定好的更新内容添加到记忆当中,得到新的记忆Ct=ft*Ct-1+it*Ct,如图5的上部区域所示;
[0066] 第五步,计算当前隐藏层的状态ht=ot*tanh(Ct),表示输出已确定的输出部分,Ot=σ(Wo[ht-1,xt]+bo)为输出部分,Wo表示输出部分的神经元的权值,bo表示输出部分的神经元的偏置值,如图6的右侧区域所示;
[0067] 第六步,按照以上方法将被预测障碍物以及被预测障碍物周围障碍物编码成为:
[0068]
[0069] 进一步的,包括用soft attention计算被预测障碍物的向量 其中权值αtj为 其中a表示前馈神经网络;
[0070] 进一步的,包括用hard attention计算被预测障碍物周围邻居障碍物的向量其中 dis(n,j)表示在j时间点,第n个邻居障碍到被预测障碍物的距离;
[0071] 进一步的,将上述计算出来的两个向量结合,得到合并向量权值Wc通过反向传播学习得到。
[0072] 进一步的,利用LSTM框架计算预测位置, 其中st-1表示解码器在t-1时刻的隐藏状态,yt-1表示解码器在t-1时刻的输出值, 表示合并向量。
[0073] 优选的,在步骤S102中,如图7所示,首先初始化i=0,然后判断i%T是否为0,T表示间隔决策次数,如果为0,表示重新定向,否则直接按照原来的定向选择动作;如果重新定向,包括四个方向,表示按照当前位置P和目的位置S设置向量 根据的大小确定变量值:
[0074]
[0075] 该变量值的作用是根据距离来动态改变奖励值,选择完舰载机位置后,执行i=i+1;判断是否到达终点,未到达则返回到判断i%T是否为0处重新执行,一直到到达终点结束。
[0076] 优选的,甲板上有舰载机、加油车、工作人员。首先将它们分别建模,舰载机建模成为五边形、加油车建模成为矩形、工作人员建模成为圆形。
[0077] 如图8所示,首先,初始化i=1,获得执行ai后舰载机的坐标位置,ai表示舰载机可选的四个动作之一;
[0078] 然后,计算舰载机各边的函数关系,优选的,展翼状态的舰载机是一个五边形,其五条边的分别方程为:
[0079] 线段p1p2:
[0080] 线段p1p3:
[0081] 线段p2p4:
[0082]
[0083] 线段p3p5:
[0084] 线段p4p5:
[0085] 人的函数表达式:(x-x1)2+(y-y1)2=r2;
[0086] 进一步检查p1p2、p1p3、p2p4、p3p5、p4p5和人是否有交点,即方程组是否有解。还可以进一步判断舰载机各边和障碍物各边之间是否有交点。
[0087] 在图8中,如果有交点,βi=0,否则无交点,βi=1,执行i=i+1,将所有动作所对应的βi都计算出来,如果i大于4则结束,这是由于是4个方向所决定的,如果i小于或等于4则返回到获得执行ai后舰载机的坐标位置,重新进行其他动作的执行。
[0088] 优选的,获得障碍物的预测位置坐标(x1,y1),根据障碍物的类型不同,他们的模型的各个顶点坐标个各条边的函数关系如下所示:
[0089] (1)舰载机的展翼状态下建模为:
[0090] 如图9所示,中心坐标为o=(x1,y1);前方坐标为p1=(x1+cosθL,y1+sinθ×L),其中θ为 和x轴之间的夹角,L为 的模;左前方坐标为p2=(x1+cos(θ+ψ)×h,y1+sin(θ+ψ)×h),其中ψ为 和 之间的夹角,h为 的模;右前方坐标为p3=(x1+cos(θ-ψ)×h,y1+sin(θ-ψ)×h);左后方坐标为p4=(x1+cos(θ+β)×d,y1+sin(θ+β)×d),其中β为 和 之间的夹角,d为 的模;右后方坐标为p5=(x1+cos(θ-β)×d,y1+sin(θ-β)×d)。
[0091] (2)舰载机在合翼状态建模为:
[0092] 如图10所示,左前方坐标为p'2=(x1+cos(θ+ψ)×h',y1+sin(θ+ψ)×h'),其中ψ为和 之间的夹角;h'为 的模;右前方坐标为p′3=(x1+cos(θ-ψ)×h′,y1+sin(θ-ψ)×h′),而p1、p4、p5计算方法与图9中所示的计算方法相同,p1=(x1+cosθ×L,y1+sinθ×L),p4=(x1+cos(θ+β)×d,y1+sin(θ+β)×d),p5=(x1+cos(θ-β)×d,y1+sin(θ-β)×d)[0093] 其中θ为 和x轴之间的夹角,β为 和 之间的夹角,d为 的模,L为 的模。
[0094] (3)加油车建模为:
[0095] 如图10所示,中心坐标为o=(x1,y1),左前方坐标:
[0096] q1=(x1+cos(θ+ω)×m,y1+sin(θ+ω)×m),其中θ为加油车运动方向和x轴之间的夹角,ω为加油车运动方向和 之间的夹角;m是 的模;右前方坐标:q2=(x1+cos(θ-ω)×m,y1+sin(θ-ω)×m);左后方坐标:q3=(x1-sin(θ-ω)×m,y1+cos(θ-ω)×m);右后方坐标:q4=(x1-sin(ω-θ)×m,y1-cos(ω-θ)×m)。
[0097] (4)人建模为:
[0098] 半径为r,圆心坐标为o=(x1,y1)的圆。按照圆和直线的公式分别计算出各模型中各边的函数关系式。
[0099] 优选的,结合图13,进一步给出了基于DQN算法的自主学习导引路径规划方法,在图13所示网络中,环境将四元组(s,a,r,s,)传回给回放记忆单元,回放记忆单元将其传递给当前值网络和目标值网络,两个网络各自计算得到Q值,进行误差函数计算,将计算得到的loss函数更新当前值网络,而目标值网络则是根据一定的时间间隔将当前值网络的参数复制给目标值网络。其中包括步骤:
[0100] 第一步,环境将当前状态传递给当前的值网络,该网络经过计算分别得到四个动作的值函数Q1=(s,a1;θ),Q2=(s,a2;θ),Q3=(s,a3;θ),Q4=(s,a4;θ)。其中s表示当前状态;a表示下一步所采取的动作,有a1至a4四个方向的动作,θ表示参数;
[0101] 第二步,根据周围障碍物预测位置,对当前Q网络进行一定的修正:
[0102] F(Qi)=Qi×β,
[0103] 其中
[0104] 第三步,根据指导向量将上述F(Qi)做进一步修正:
[0105]
[0106] 第四步,将max(G(F(Qi)))作为选出的动作返回给环境。
[0107] 由此可见,本发明公开了一种舰载机导引路径规划方法。该方法包括步骤有预测碍障物,获取舰载机和周围相邻的障碍物的历史轨迹,利用LSTM编码预测障碍物的运动轨迹;更新导向,根据舰载机位置与目标点位置之间的关系更新舰载机导向目标点的定向关系;碰撞检测,对舰载机和障碍物进行建模,检测舰载机运动过程中与相邻障碍物是否发生碰撞。通过该方法,可以在路径规划的同时有效的实现动态障碍物的碰撞避免,还加入了多种控制选择动作的限制,实现动态避障以及DQN的快速收敛,该方法使训练的时间大大缩短,提高了效率。
[0108] 以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈