专利汇可以提供一种基于动态系统模型的机器人模仿学习的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于动态系统模型的 机器人 模仿学习的方法,通过学习来实现机器人对于示教运动的模仿。具体地,通过高斯混合模型将示教运动建模为一非线性动态系统模型,另外通过附加 稳定性 约束条件的方法,来保证运动模型的稳定性。并将运动模型的参数学习问题转化为求解一个约束优化问题,以此来获得对于运动模型的完整描述。最后,将学习得到的运动模型作为控制策略来指导机器人对于示教运动的模仿。本发明对于目标点固定的示教运动,具有很好的稳定性,生成的所有运动轨迹均收敛到目标点,对于简单和较复杂的示教运动有很好的表达能 力 ,而且运动模型的泛化能力表现也较好,示教运动范围外也可以生成平滑的且收敛到目标的运动轨迹。,下面是一种基于动态系统模型的机器人模仿学习的方法专利的具体信息内容。
1.一种基于动态系统模型的机器人模仿学习的方法,其特征在于,具体步骤如下:
步骤1、示教者通过手把手的方式指导机器人手臂完成一次或多次的示教运动,机器人由其内部的关节传感器记录示教运动过程中的关节角度变化情况,通过机械臂的正向运动学计算得到机械臂末端执行器的位置和速度变化信息;
步骤2、通过高斯混合模型GMM将示教运动轨迹数据建模为一非线性动态系统模型;由GMM得到关于示教运动模型的参数化表示;
步骤3、考虑所建模的运动模型的稳定性问题,基于李雅普诺夫稳定性理论,构造满足要求的李雅普诺夫函数,结合动态系统稳定性的条件求解模型在示教运动目标点全局稳定的约束;
步骤4、在得到稳定性约束后,进行模型参数的学习;将所建模得到的参数化的运动模型的参数学习问题转化为求解一个约束优化问题,借助于非线性规划的方法求解约束优化问题,得到最优模型参数,进而得到对于运动模型的完整描述;
步骤5、结合所构建的机器人模仿学习系统,将学习得到的运动模型作为机器人的控制策略指导其完成对于示教运动的模仿。
2.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于:步骤1中通过示教者对机器人进行运动的示教,由其内部的关节传感器记录示教运动过程中的关节角度变化情况,通过机械臂的正向运动学计算得到机械臂末端执行器的位置和速度变化信息,记为示教运动轨迹数据集 其中ζ表示位置, 表示速度,t表示时间,N=1,2,3,......表示示教运动轨迹的条数。
3.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于,步骤2具体如下:
给定一组N条示教运动轨迹数据的集合 GMM由以下概率密度函数表示:
以上两式中GP(·)是高斯过程概率密度函数,K为GMM中混合模型的个数,ωk是第k个高斯过程的权重,且 μk为该密度函数的均值向量,Σk为对应的协方差矩阵;
对于给定ζ, 的条件概率分布是:
其中N(·)同样是服从高斯分布的概率密度函数,表示第k个高斯分布的情况, 为对应的均值向量, 为对应的方差矩阵,而且有
公式(4)(5)中 Σζζk分别是变量 和变量ζ的方差矩阵, 是变量 与ζ之间的协方差矩阵, 和μζk分别表示为对应于 和ζ的均值向量,而且以上均表示为第k个高斯分布时的情况;由公式(3),对应于ζ的条件概率可定义
而且有
其中变量i与k表示的含义相同;由公式(6)的条件期望求得高斯混合模型中 的总的期望为:
而且有
公式(8)即为参数化的运动模型,且为一个动态系统模型,用 表示;公式(9)中p(ζ|k)=N(ζ|μζk,Σζζk)及变量i与公式(7)中的表示相同。
4.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于:步骤3具体为如下,由以上得到的参数化的运动模型,即公式(8)所示,为了提高运动模型的稳定性,需要考虑稳定性问题;根据李雅普诺夫稳定性理论,通过构造如下的李雅普诺夫函数V(ζ):Rd→R:
V(ζ):Rd→R表示函数V(ζ)是d维实数空间Rd到一维实数域R的映射,V(ζ)是一个连续且具有连续的一阶偏导数的标量函数,其应该满足如下的条件:
运动模型将会在唯一的目标点处ζ*全局收敛,也即其生成轨迹均收敛到同一个目标点;
经过推导和计算得到使运动模型稳定的约束条件:
公式(12)中<0表示一个矩阵是负定矩阵,将公式(12)的条件作为运动模型的约束。
5.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于,步骤4具体为如下:在得到运动模型的稳定性约束后,需要学习得到模型的参数θ={ω1,···,ωk;μ1,···,μk;Σ1,···,Σk};将运动模型的参数学习问题转化为求解一个约束优化问题,通过非线性规划的方法求解模型的未知参数;待优化的目标函数为对数似然函数:
以上公式中 是训练数据点总的数量,目标函数对应的约束条件是:
以上通过附加约束条件的方法来保证运动模型的稳定性,将稳定性约束和GMM的约束条件共同组成了运动模型的完整的约束,最终求解得到最优参数θ*,即得到对于运动模型的完整描述。
6.根据权利要求1所述的一种基于动态系统模型的机器人模仿学习的方法,其特征在于:步骤5将学习得到的运动模型作为机器人的控制策略指导其完成对于示教运动的模仿;
其中,首先利用学习得到的控制策略和机械臂初始的运动状态,由控制策略得到下一时刻期望的运动状态;然后,通过机械臂的逆向运动学将机械臂期望的末端位置和速度状态转化为机械臂期望的关节控制角度,通过机器人系统,实现在关节空间的运动控制;随后,将机械臂的正向运动学用于求解当前机械臂的状态,也即位置和速度,以此再结合动态模型的位置和速度演化关系,得到下一时刻的位置和速度,重复以上流程,直到机器人完成对于示教运动的模仿。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于深度学习的2D+3D大飞机外形缺陷检测与分析方法 | 2020-05-08 | 965 |
一种物流系统和配货运输流程 | 2020-05-13 | 974 |
一种用于义齿性能测试的仿生咀嚼机器人及使用方法 | 2020-05-15 | 729 |
一种视觉机器人的地图表示系统及其构建方法 | 2020-05-17 | 697 |
一种变电站智能巡检机器人安全通信接入系统 | 2020-05-11 | 765 |
一种移动机器人同步定位与地图构建方法 | 2020-05-14 | 640 |
一种清洁机器人及其控制方法 | 2020-05-22 | 651 |
用于铁路客运车站巡更机器人的巡更方法及系统 | 2020-05-14 | 312 |
一种切削加工机器人的动态误差补偿与控制方法 | 2020-05-11 | 25 |
表面清洁机器人 | 2020-05-20 | 586 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。