专利汇可以提供一种分布式多机器人协同过未知随机迷宫的编队导航方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种分布式多 机器人 协同过未知随机迷宫的编队导航方法,包括以下步骤:步骤一:获取观察数据;步骤二:用特征提取层从输入的观察数据中提取特征;步骤三:将特征输入群体规划模 块 ,获得估计的机器人群体运动方向;步骤四:将特征提取层输出的特征和群体规划模块输出的运动方向输入运动控 制模 块,获得当前机器人的运动方向。通过在神经网络中引入记忆模块,使得神经网络具备解决复杂情况的能 力 ,如重复进入死胡同;神经网络利用输入的局部观察来估计整个机器人群的平均 位置 的移动方向而不是单个机器人的移动方向,保证方法的非中心化属性,降低运算量,提高鲁棒性。,下面是一种分布式多机器人协同过未知随机迷宫的编队导航方法专利的具体信息内容。
1.一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,包括以下步骤:
步骤一:获取观察数据;通过机器人上安装的测距器,得到t时刻,机器人的局部观测通过机器人的定位系统获得机器人各自的位置和朝向;
步骤二:用特征提取层从输入的观察数据中提取特征,即不同的全连接层神经网络分别从不同类型的观察数据中提取特征 其中fl为从局部观测提取
到的特征,fm为从其它机器人的状态中提取到的特征,得到的特征作为特征提取模块的输出;
步骤三:将特征输入群体规划模块,获得估计的机器人群体运动方向;所述群体规划模块主要由三个部分组成:可扩展特征合并层、记忆模块和值迭代网络;
具体的步骤为:
S3.1:将特征提取层得到的不定大小的特征输入可扩展特征合并层,将其合并为同样大小的特征;
S3.2:使用合并后的特征更新记忆模块;记忆模块将迷宫区域划分为n×n个子区域,每个子区域申请大小为m的记忆空间 从而构成大小为m×n×n的记忆空间
S3.3:将记忆空间输入值迭代网络获得导航路径,值迭代网络构建大小为n×n的值地图 值地图上的一个值代表着当机器人群的平均位置在该值对应的子区域内的得分,值的取值范围为[0,vmax],得分在终点区域中心对应的值 上恒定取最大,而其它的值则通过迭代获得。
步骤四:将特征提取层输出的特征和群体规划模块输出的运动方向输入运动控制模块,获得当前机器人的运动方向。
2.根据权利要求1所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,在所述步骤S3.1中,采用注意力机制合并特征,具体步骤为:
S3.1.1将各个特征分别输入全连接层得到关键值和查询值;
S3.1.2对每个查询值分别与所有的关键值求内积,得到一组权重;
S3.1.3利用每组权重对特征进行加权求和,得到特征数量个查询结果;
S3.1.4将此结果输入全连接层得到特征数量个权重值;
S3.1.5利用权重值对所有特征进行加权求和,得到合并后的特征。
3.根据权利要求1所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,所述记忆模块的更新步骤为:
S3.2.1获取更新前的记忆
S3.2.2将合并后的特征与更新前的记忆 拼接;
S3.2.3将拼接后的向量输入全连接层获得更新后的记忆
S3.2.4将更新后的记忆放回记忆空间 中。
4.根据权利要求1所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,在所述步骤S3.3中,具体的计算步骤如下:
S3.3.1:将值地图 初始化为零;
S3.3.2:将值地图中 设为最大值vmax;
S3.3.3:将当前记忆 与当前的值地图 拼接,并输入卷积层,得到动作得分S3.3.4:对同一位置不同动作取最大值,得到更新后的值地图
S3.3.5:回到步骤S3.3.2,重复l次;
S3.3.6:取出最后一次计算得到的在机器人群平均位置对应子区域的不同动作得分将取得的不同动作得分输入全连接层获得机器人群的二维移动方向dp。
5.根据权利要求1所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,在所述步骤一中,设定机器人的通信距离rc大于测距器的测量半径rl;通过机器人的通信系统,机器人i得到的观察数据为 oe为终点区域中心的
位置, 和 为在世界坐标系下的机器人i的位置和朝向, 为机器人坐标系下输入和输出。
6.根据权利要求1所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,在所述步骤四中,具体的计算步骤如下:
S4.1:将群体规划模块的输出量输入至全连接层中,处理为与其它特征同样大小的特征;
S4.2:使用与所述步骤S3.1相同的可扩展特征合并层将所述步骤S4.1的特征与来自步骤二的特征合并;
S4.3:将合并后的特征输入全连接层获得机器人当前的动作
7.根据权利要求1-6任一所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,对所述神经网络进行训练,并定义损失函数为:
Li=Lppo+Lplan
其中,Lppo表示PPO算法的损失函数;Lplan表示为提高群体规划模块的收敛速度设计的损失函数;dpi表示机器人i的群体规划模块输出的机器人群二维移动方向; 表示为机器人群移动目标子区域的中心; 表示为机器人群的平均位置。
8.根据权利要求1-6任一所述的一种分布式多机器人协同过未知随机迷宫的编队导航方法,其特征在于,对于机器人i使用的奖励函数如下:
其中,Rsi表示机器人群平均位置到达终点区域会给一个正奖励;Rfi表示机器人i发生碰撞时会给一个惩罚;Rci表示当机器人i与某个机器人间的距离超过了通信距离时会给一个惩罚。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种环境拓扑地图的构建方法 | 2020-05-14 | 450 |
一种AGV导航控制方法及系统 | 2020-05-16 | 359 |
一种分布式多机器人协同过未知随机迷宫的编队导航方法 | 2020-05-17 | 229 |
一种基于区域地图标识的机器人巡逻方法及机器人设备 | 2020-05-08 | 446 |
控制移动机器人、移动机器人实时建图的方法及装置 | 2020-05-16 | 755 |
机器人导航方法、系统、机器人及存储介质 | 2020-05-14 | 284 |
栅格地图的构建方法、避障的方法、设备及介质 | 2020-05-13 | 268 |
一种深部矿井环境监测机器人系统及监测方法 | 2020-05-14 | 68 |
一种语义地图构建方法、系统、装置、存储介质及机器人 | 2020-05-15 | 400 |
基于环境理解的语义ORB-SLAM感知方法及装置 | 2020-05-15 | 610 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。