首页 / 专利分类库 / 控制;调节 / 多智能体系统的控制方法及相关产品

多智能体系统的控制方法及相关产品

申请号 CN202410142106.9 申请日 2024-02-01 公开(公告)号 CN117687345B 公开(公告)日 2024-05-14
申请人 北京中关村实验室; 北京航空航天大学; 发明人 高庆; 刘晨光; 吕金虎; 王薇; 郭一歌;
摘要 本 发明 公开了一种多智能体系统的控制方法及相关产品。对于多智能体系统中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:#imgabs0#。该方法有助于实现对多智能体系统的无源一致性控制。
权利要求

1.一种多智能体系统的控制方法,其特征在于,包括:对于多智能体系统中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:

中, 为编号为r的智能体在时间t的控制输入,z为多智能体系统中智能体的数量,是多智能体系统的时变耦合增益矩阵U(t)中的项, 是设定的系统矩阵, 是编号为l的智能体的状态误差;
其中,时变耦合增益矩阵 有如下定义:
其中,是多智能体系统的通信拓扑中无向边的集合,当(r,l)∈B时Url(t)大于0表示智能体r和智能体l之间具有通信能,其数值表示耦合增益,当r=l时Url(t)表示智能体r与其他智能体的耦合增益之和的相反数;
其中, 是Caputo分数阶求导符号,阶数 , 是智能体r的状态误差,H是设定的系统矩阵, 是矩阵H的最大特征值, 是设定系数,用于调节自适应律速度且满足 , , 为设定系数, 是设定的系
统矩阵,并且 , 是预先定义的通信拓扑矩阵, ()表示取括号内矩
阵的从大到小第n个特征值;
其中,满足以下表达式:

其中, 并且 ,
是设定的系统矩阵,Iz是z维单位矩阵,In是n维单位矩阵, 是矩阵 的第二大的特征值,是设定的系数;
其中, ;
其中,智能体r的动力学模型为 ;
其中, 和 分别代表第r个智能体的状态、外部输入和
控制输入,  代表非线性向量函数, 是连续可微分的并且满足:
其中,为设定系数,H和M为设定矩阵, 
并且 ,n
为状态的维度。
2.根据权利要求1所述的方法,其特征在于,对于智能体r,其状态误差 定义为:

为智能体q的状态, 为智能体r的状态, 为状态均值。
3.根据权利要求1所述的方法,其特征在于,所述智能体集群的通信拓扑表示为连通的无向图。
4.一种智能体的控制器,其特征在于,所述智能体为多智能体系统中的智能体,所述控制器包括存储器和处理器,所述存储器存储程序,所述处理器运行所述程序以执行根据权利要求1至3中任一项所述的方法。
5.一种智能体,其特征在于,包括根据权利要求4所述的控制器。
6.一种程序产品,其特征在于,所述程序产品在处理器上运行时执行根据权利要求1至
3中任一项所述的方法。

说明书全文

多智能体系统的控制方法及相关产品

技术领域

[0001] 本发明涉及一种多智能体系统的控制方法及相关产品。

背景技术

[0002] 随着人工智能技术的不断发展,多智能体系统变得越来越普遍和重要。多智能体系统由多个智能体组成,这些智能体在一个共同的环境中协同工作,以达到某个共同的目标。多智能体系统广泛应用于交通运输、工业控制、群体协作等领域。多智能体系统中的一致性问题是指所有智能体必须达成一致的状态或行为,以实现系统的优化。这种一致性问题在多智能体系统中具有挑战性,因为不同智能体具有不同的目标和策略,往往存在矛盾和冲突。因此,如何在保证系统稳定性的情况下实现一致性是多智能体系统协同控制中的重要研究方向。
[0003] 近年来,无源性在多智能体系统的一致性控制中得到了广泛应用。由于无源性控制是从稳定性和李雅普诺夫稳定性的度出发,因此它更具有鲁棒性,能够很好地处理非线性和耦合增益矩阵的时变问题。例如,在非线性多智能体系统中,无源性研究可以通过结合其他控制方法用于分析系统的内部稳定性,从而进一步提高系统的性能。
[0004] 中国专利申请CN108267957A公开一种分数阶区间多智能体系统鲁棒输出一致性的控制方法,包括以下步骤:a .将分数阶区间多智能体系统的鲁棒输出一致性的控制问题转化为分数阶区间多智能体系统的状态零点的镇定问题;b .设计分布式输出反馈控制器;c  .将闭环分数阶区间多智能体系统的状态零点的镇定问题转化为N‑1个分数阶子系统的状态零点的稳定性分析问题;d .给出能够保证N‑1个分数阶子系统的状态零点同时稳定的条件;e .求解输出反馈控制器中的待定反馈矩阵。

发明内容

[0005] 本发明提供一种多智能体系统的控制方法及相关产品,以助于实现多智能体系统自动控制的无源性和一致性。
[0006] 本发明采用如下技术方案:一种多智能体系统的控制方法,包括:对于多智能体系统中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:
[0007]其中, 为编号为r的智能体在时间t的控制输入,z为多智能体系统中智能体的数量,是多智能体系统的时变耦合增益矩阵U(t)中的项, 是设定的系统矩阵, 是编号为l的智能体的状态误差;
[0008] 其中,时变耦合增益矩阵 有如下定义:
[0009]
[0010] 其中,是多智能体系统的通信拓扑中无向边的集合,当(r,l)∈B时Url(t)大于0表示智能体r和智能体l之间具有通信能,其数值表示耦合增益,当r=l时Url(t)表示智能体r与其他智能体的耦合增益之和的相反数;
[0011] 其中, 是Caputo分数阶求导符号,阶数 , 是智能体r的状态误差,H是设定的系统矩阵, 是矩阵H的最大特征值, 是设定系数,用于调节自适应律速度且满足 , , 为设定系数, 是设定的系统矩阵,并且 , 是预先定义的系统系数矩阵, ()表示取括号内
矩阵从大到小第n个特征值;
[0012] 其中,满足以下表达式:
[0013] ;
[0014] 其中, 并且, 是设定的系统矩阵,Iz是z维单位矩阵,In是n维单位矩阵,
是矩阵 的第二大的特征值,是设定的系数;
[0015] 其中, ;
[0016] 其中,智能体r的动力学模型为;
[0017] 其中, 和 分别代表第r个智能体的状态、外部输入和控制输入, 代表非线性向量函数, 是连续可微分的并且满足:
[0018]
[0019] 其中,为设定系数,H和M为设定矩阵,并且 ,n
为状态的维度。
[0020] 本发明采用如下技术方案:一种智能体的控制器,所述智能体为多智能体系统中的智能体,所述控制器包括存储器和处理器,所述存储器存储程序,所述处理器运行所述程序以执行前述的方法。
[0021] 本发明采用如下技术方案:一种智能体,包括前述的控制器。
[0022] 本发明采用如下技术方案:一种程序产品,所述程序产品在处理器上运行时执行前述的方法。
[0023] 采用该控制方法,有助于实现多智能体系统自动控制的无源性和状态一致性。附图说明
[0024] 图1是本发明的多智能体系统的控制方法示意图。
[0025] 图2是本发明实施例的多智能体系统的通信拓扑图。
[0026] 图3和图4是本发明实施例中有外部输入情况下各智能体的状态误差随时间变化曲线。
[0027] 图5和图6是本发明实施例中在有外部输入情况下耦合增益随时间的变化曲线。
[0028] 图7和图8是本发明实施例中飞行在沙尘暴中的多智能飞行器系统的状态图误差随时间变化曲线。
[0029] 图9至图12为本发明实施例中没有外部输入情况下耦合增益随时间变化曲线。

具体实施方式

[0030] 下面结合具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于此。
[0031] 本发明对智能体的种类不做限定,例如智能体为机器人、无人机、无人船等。本发明对需要达到一致的状态的具体种类不做限定,例如是编队状态、速度、姿态等。
[0032] 本发明实施例中,智能体集群的通信拓扑表示为连通的无向图。
[0033] 参考图1,本发明提供一种多智能体系统的控制方法,包括:对于多智能体系统中的任一个智能体,按照如下公式确定控制输入,并根据计算得到的控制输入调控自身状态:
[0034]其中, 为编号为r的智能体在时间t的控制输入,z为多智能体系统中智能体的数量,是多智能体系统的时变耦合增益矩阵U(t)中的项, 是设定的系统矩阵, 是编号为l的智能体的状态误差;
[0035] 其中,时变耦合增益矩阵 有如下定义:
[0036]
[0037] 其中,是多智能体系统的通信拓扑中无向边的集合,当(r,l)∈B时Url(t)大于0表示智能体r和智能体l之间具有通信能力,其数值表示耦合增益,当r=l时Url(t)表示智能体r与其他智能体的耦合增益之和的相反数;
[0038] 其中, 是Caputo分数阶求导符号,阶数 , 是智能体r的状态误差,H是设定的系统矩阵, 是矩阵H的最大特征值, 是设定系数,用于调节自适应律速度且满足 , , 为设定系数, 是设定的系统矩阵,并且 , 是预先定义的系统系数矩阵, ()表示取括号内
矩阵从大到小第n个特征值;
[0039] 其中,满足以下表达式:
[0040] ;
[0041] 其中, 并且, 是设定的系统矩阵,Iz是z维单位矩阵,In是n维单位矩阵,
是矩阵 的第二大的特征值,是设定的系数;
[0042] 其中, ;
[0043] 其中,智能体r的动力学模型为;
[0044] 其中, 和 分别代表第r个智能体的状态、外部输入和控制输入, 代表非线性向量函数, 是连续可微分的并且满足:
[0045]
[0046] 其中,为设定系数,H和M为设定矩阵,并且 ,n
为状态的维度。
[0047] 以下详细介绍该方法的设计以及证明过程。
[0048] 符号说明: 是 维矩阵的集合;节点集合 代表v个智能体构成的集合,无向边集合 表示v个智能体之间的无向通信链接;对于一个实对称 矩阵 表示 矩阵 G的 特 征值 ,且满 足
。 表示拉普拉斯变换。矩阵大于0表示该矩阵是正定的,
矩阵小于0表示该矩阵是负定的,矩阵大于或等于0表示该矩阵是半正定的,矩阵小于或等于0表示该矩阵是半负定的。
[0049] 首先介绍一些关于分数阶微积分的基本定义和性质。
[0050] 定义一、对于任意的 ,其Caputo分数阶导数被定义为:
[0051] ;
[0052] 其中, ,t≥0, 是Euler's Gamma 函数,具有如下形式:
[0053] 。
[0054] 的拉普拉斯变换为 ;其中,。
[0055] 作为指数函数的一个推广概念,Mittag‑Lefler函数在分数阶系统的解中起着关键作用,给出Mittag‑Lefler函数的定义如下。
[0056] 定义二、带有两个参数Mittag‑Lefler  和带有一个参数  被定义如下:
[0057] ;
[0058] 其中,v>0, , 并且 。 特别的, 并且 。此外,
[0059] ;
[0060] 其中 ,t≥0并且 。
[0061] 根据上述Caputo分数阶导数的定义与性质,示例性地,现在给出一个由六个智能体构成的非线性分数阶多智能体系统的动力学模型,其中每个智能体的动态被建立为:
[0062] (1)
[0063] 其中,t为时间,r是智能体的编号,z是智能体的数量,分数阶的阶数 ,和 分别代表第r个智能体的状态、外部输入和控制输入,代表非线性向量函数。
[0064] 定义 作为多智能体系统的时变耦合增益矩阵,并且满足下面的条件:
[0065] 。
[0066] 假设一、 假设非线性函数 是连续可微分的并且满足下面的条件[0067] (2)
[0068] 其中, 并且。
[0069] 定义多智能体系统的误差动态方程。首先定义所有智能体的状态均值 为, 表示编号为q的智能体在时间t的状态。可以得到:
[0070] ,
[0071] 其中, 表示编号为q的智能体在时间t接收的外部输入, 表示编号为q的智能体在时间t的控制输入。
[0072] 定义 ,表示编号为r的智能体的状态误差,其维度为n。可以得到分数阶多智能体系统的误差动态方程为:
[0073] (3);
[0074] 其中, 表示编号为r的智能体在时间t接收的外部输入, 表示编号为r的智能体在时间t的控制输入。
[0075] 为上述误差动态系统(3)定义系统输出方程为:
[0076] (4)
[0077] 其中,  和 是预先给定的常系数矩阵。为了便于陈述,预先给定如下记号:
[0078] 。
[0079] 无源性,作为耗散性的一种特例,是基于广义能量概念对系统输出和输入行为的表征。以下给出如下关于非线性分数阶多智能体系统无源性相关定义。
[0080] 定义三、由分数阶多智能体误差动态和输出动态构成系统具备输出严格无源性如果存在一个正半定的能量存储函数S(t)满足:
[0081] ,
[0082] 其中, 。
[0083] 本发明的主要目标是通过设计合适的自适应状态反馈控制器使得非线性分数阶多智能体系统通过满足系统输出严格无源性进而实现一致性,即满足下面的条件:
[0084] 。
[0085] 设计自适应状态反馈控制器并建立闭环控制系统。
[0086] 在多智能体系统运行过程中,尤其是运行在复杂环境中的多智能体系统,由于存在的不确定性和扰动导致系统参数无法精确的获取,而且多智能体之间的耦合增益对整个系统有着非常重要的影响,因此本发明设计出下面的自适应状态反馈控制器,以在调节多智能体之间的耦合增益的同时保证多智能体系统能够在动态环境中共同协作以实现一致性:
[0087] ;
[0088] 其中, , 。
[0089] 那么根据上述自适应状态反馈控制器,本发明可以得到闭环控制系统:
[0090] (6)。
[0091] 以下给出在自适应状态反馈控制器下保证闭环控制系统实现输出严格无源性的充分条件。
[0092] 以下定理给出了闭环控制系统(6)实现输出严格无源性的充分条件。
[0093] 定理一、借助上述的自适应状态反馈控制器,上述闭环控制系统能够实现输出严格无源性如果存在一个正常量 满足:
[0094] (7)
[0095] 其中,  并且。
[0096] 选取如下所示Lyapunov泛函:
[0097] (8)。
[0098] 对V1(t)进行时间导数:
[0099] 。
[0100] 对V2(t)进行时间导数:
[0101]
[0102] 。
[0103] 因此,可以得到:
[0104] (9)。
[0105] 计算出所有智能体的误差信息 :
[0106] 。
[0107] 因此,
[0108] (11)。
[0109] 对非线性项进行放缩:
[0110] (12)。
[0111] 根据 (9)‑(12), 本发明可以获得
[0112] (13)。
[0113] 根据 (13) 和输出严格无源性的定义可以进一步得到
[0114] (14)
[0115] 其中, ,
[0116]   并且 。
[0117] 结合定理条件和(12)则有: 。
[0118] 因此闭环控制系统通过自适应状态反馈控制器可以实现输出严格无源性。上述过程保证了非线性分数阶多智能体系统通过自适应状态反馈控制器(5)实现输出严格无源性。下面本发明给出线性分数阶多智能体系统通过无源性能够进一步实现一致性的条件。
[0119] 基于得到的输出严格无源性准则,给出保证非线性分数阶多地面机器人系统实现一致性的充分条件。
[0120] 定理二、如果闭环控制系统通过自适应状态反馈控制器实现了输出严格无源性,并且系统参数满足 ,那么非线性分数阶多智能体系统可以实现一致性。
[0121] 由于闭环控制系统通过自适应状态反馈控制器实现了输出严格无源性, 因此本发明可以得到:
[0122] (14)
[0123] 其中, 。
[0124]  令分数阶多智能体系统外部输入 w(t)=0, 可以得到:
[0125] (15)。
[0126] 根据 (15), 可以得到: (16)。
[0127] 通过 (15) 和 (16),可以获得:
[0128] 。
[0129] 显然存在一个非负函数 满足下面的条件:
[0130] (17)。
[0131] 对 (17)式进行Laplace变换,可以得到:
[0132] ;
[0133] 其中, 和 分别代表 V3(t) 和 拉普拉斯变换后的形式。然后可以进一步得到
[0134]  (18)。
[0135] 进一步根据 (18)进行逆Laplace变换,可以得到:
[0136] (19)
[0137] 其中 是非负的。
[0138] 将(19)代入(16),可以进一步推出:
[0139] 。
[0140] 最终,可以得到
[0141] 。
[0142] 因此,非线性分数阶多智能体系统通过自适应状态反馈控制器(5)能够实现一致性。上述过程保证了非线性分数阶多智能体系统通过状态反馈控制器(5)在基于输出严格无源性情况下通过调节系统输出参数可以进而实现一致性。
[0143] 相较于传统的整数阶微积分,分数阶微积分允许对任意阶数的导数和积分进行定义,因此分数阶微分方程建模的多智能体系统能够更好的描述在非线性、非平稳和复杂环境中的动力学特征,更贴近现实。例如能够更好的展现运行在复杂环境的智能体系统(行驶在泥泞道路或者沙地中的车辆,飞翔在沙尘暴中的飞行器等等)的动力学行为。
[0144] 本发明在建模多智能体系统的分数阶动态的同时,也考虑了多智能体的非线性行为,引入非线性项,许多现实世界中的多智能体系统都是非线性的,因为智能体之间的相互作用和动力学往往是复杂的。研究非线性多智能体系统可以更准确地模拟和描述真实世界中的复杂现象,使研究结果更具现实意义
[0145] 本发明针对这些运行在复杂环境中的多智能体系统,设计出一种自适应状态反馈控制器保证多智能体系统能够在复杂的动态环境中共同协作以实现共同的目标(达到相同的速度,编队状态和姿态)。本发明设计的自适应状态反馈控制中嵌入的分数阶自适应率可以自动调整多智能体系统的反馈增益矩阵,以适应系统参数的变化,使得多智能体系统具备适应现实环境不确定性和变化的能力。这使得闭环控制系统能够保持良好的性能,即使在面对通信不确定性的情况下也能够有效控制系统,进而实现一致性。
[0146] 本发明基于无源性,从系统输入输出能量关系的角度出发,通过无源性进而保证了多智能体系统的一致性,易于各种多智能体系统在实际中应用和实现。
[0147] 实例:参考图2,针对运行在复杂环境中的一个由六个智能体构成的非线性多智能体系统,本发明构建如下分数阶动态模型:
[0148] ;
[0149] 其中,智能体的编号 。 是连续可微分的非线性函数,并且 。
[0150] 情形一、误差动态方程中第 r 个智能体的输出方程表示为:
[0151] 。
[0152] 其中,本发明给定输出方程的调节系数矩阵:
[0153] 。
[0154] 智能体之间的通信拓扑矩阵如下所示:
[0155] 。
[0156] 定义以下参数
[0157] 。
[0158] 该系统满足定理一,这表明闭环的非线性分数阶多智能体系统如预期的一样在自适应状态反馈控制器下能够实现输出严格无源性。仿真结果如图3至图6所示。
[0159] 情形二、如果本发明选择与情形一相同的系统参数 ,那么本发明可以发现 ,因此定理二也同样能够被满足。参考图3、图4以及图7、图8,所有智能体的误差 随时间增加都是趋于0的。这表明闭环的非线性分数阶多地
面机器人系统如预期的一样在自适应状态反馈控制器下保证输出严格无源性的同时通过调节输出方程参数能够实现一致性。与此同时,参考图5、图6以及图9至图12,耦合增益随着时间的变化逐渐收敛到一些常量。
[0160] 基于相同的发明构思,本发明的实施例还提供:一种智能体的控制器,所述智能体为多智能体系统中的智能体,所述控制器包括存储器和处理器,所述存储器存储程序,所述处理器运行所述程序以执行前述的方法。
[0161] 基于相同的发明构思,本发明的实施例还提供:一种智能体,包括前述控制器。
[0162] 基于相同的发明构思,本发明的实施例还提供:一种程序产品,所述程序产品在处理器上运行时执行前述的方法。
[0163] 本发明中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
[0164] 本发明的保护范围不限于上述的实施例,显然,本领域的技术人员可以对本发明进行各种改动和变形而不脱离本发明的范围和精神。倘若这些改动和变形属于本发明权利要求及其等同技术的范围,则本发明的意图也包含这些改动和变形在内。
QQ群二维码
意见反馈