欢迎光临小豌豆知识网!
当前位置:首页 > 物理技术 > 调节控制> 多智能体系统的自主分簇控制方法和装置独创技术20292字

多智能体系统的自主分簇控制方法和装置

2021-02-10 09:09:21

多智能体系统的自主分簇控制方法和装置

  技术领域

  本申请涉及智能体技术领域,特别是涉及一种多智能体系统的自主分簇控制方法和装置。

  背景技术

  作为多智能体各种合作行为的控制技术分析和综合中最重要的主题之一,系统共识引起了特别的关注。共识的目标是使系统中所有个体的全部状态或输出接近一个公共向量。但随着人们对应用系统的职能要求不断增大,使得系统规模的增加以及复杂度的提高,导致单聚点共识模式无法满足系统的控制需求,因而越来越多的人开始关注分群一致性或多聚点同步,即网络中的多智能体被分为若干群,以实现系统功能互补。据现有文献报道,多智能体系统的自主分簇实现的技术有以下方法:

  2016年Mathematical Models and Methods in Applied Sciences刊载的“Emergenceof bi-cluster flocking for the Cucker-Smale model”,提出了一种双聚点集群行为实现方法,通过设置子系统间较大距离、明显分离速度以及子系统内部位置、速度差异较小的初始条件,证明了系统发生双聚点集群行为。该方案对多智能体系统的初始条件进行一定限制,未权衡子系统的聚集状态与整个系统宏观行为的关系,未考虑系统历史状态因素对个体的影响。

  2017年Journal of the Franklin Institute刊载的“Multi-cluster flockingbehavior of the hierarchical Cucker-Smale model”,提出了一种多聚点集群的解决方案,利用满足序关系的初始条件,通过计算一些特征,解决了一维条件下的多聚点集群问题。该方法关键在于对初始条件序关系的设计,没有考虑子系统集群状态悬殊较大时的整个系统的状态,也没有考虑个体的运动对历史状态的依赖。

  2020年JOURNAL OF DIFFERENTIAL EQUATIONS刊载的“Completeclassification of the asymptotical behavior for singular C-S model on thereal line”,通过构造个体间相对距离的下界,提供了一种实现多团簇的聚类算法。类似于上述两个方案,这类方法只涉及系统的分簇,对个体的记忆因素以及如何权衡子系统与多智能体系统的共识等问题都没有考虑。

  综上所述,以上文献中多智能体系统分簇的实现往往是在人的干预下实现的,即对初始条件进行调节使系统达到分簇的效果。这种方式并没有很好的体现多智能体系统的自主控制的能力。

  发明内容

  基于此,有必要针对上述技术问题,提供一种能够解决多智能体自主分簇问题的多智能体系统的自主分簇控制方法和装置。

  一种多智能体系统的自主分簇控制方法,所述方法包括:

  获取多智能体系统的状态变量;

  根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵,根据所述邻接矩阵,获取对应的拉普拉斯矩阵,以及所述拉普拉斯矩阵的零特征值的重数;

  计算用于将所述拉普拉斯矩阵进行分块的非奇异矩阵,获取所述非奇异矩阵的列向量组成的线性无关向量组,以及获取所述线性无关向量组的对偶基向量组;

  根据所述重数、所述线性无关向量组以及所述对偶基向量组,对所述状态变量进行分解,得到多智能体系统状态坐标,计算所述状态坐标的收敛值;

  根据所述收敛值和所述线性无关向量组,构建范德蒙德矩阵,根据范德蒙德矩阵的秩,确定分簇数量;

  根据所述分簇数量、所述线性无关向量组以及所述收敛值,确定多智能体系统的共识向量,根据所述共识向量计算各个分簇的相位同步向量;

  根据所述相位同步向量进行多智能体系统的运动控制。

  在其中一个实施例中,还包括:获取多智能体系统的状态变量为:

  

  根据所述状态变量,确定多智能体系统的动态刻画为:

  

  其中,表示多智能体系统个体间的耦合系数,定义=A,A表示邻接矩阵,I矩阵表示单位矩阵,L矩阵表示A矩阵对应的拉普拉斯矩阵,表示时间滞量最大值,满足

  在其中一个实施例中,还包括:根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵为:

  

  其中,A指的是邻接矩阵,表示多智能体系统中个体i和个体j之间的影响强度,N表示个体之间的半径。

  在其中一个实施例中,还包括:计算用于将所述拉普拉斯矩阵进行Jordan分块的非奇异矩阵为:

  

  其中,的列向量;获取所述非奇异矩阵的列向量组成的线性无关向量组为,以及获取所述线性无关向量组的对偶基向量组为;其中是克罗内克符号。

  在其中一个实施例中,还包括:根据所述重数、所述线性无关向量组以及所述对偶基向量组,对所述状态变量进行分解为,其中,为多智能体系统状态坐标,

  在其中一个实施例中,还包括:计算所述状态坐标的收敛值为:

  

  其中,

  在其中一个实施例中,还包括:根据所述收敛值和所述线性无关向量组,构建范德蒙德矩阵为:

  

  表示重数,是一族标准0-1向量,满足)并且表示所述拉普拉斯矩阵;根据范德蒙德矩阵的秩,确定分簇数量。

  一种多智能体系统的自主分簇控制装置,所述装置包括:

  状态获取模块,用于获取多智能体系统的状态变量;

  计算模块,用于根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵,根据所述邻接矩阵,获取对应的拉普拉斯矩阵,以及所述拉普拉斯矩阵的零特征值的重数;计算用于将所述拉普拉斯矩阵进行分块的非奇异矩阵,获取所述非奇异矩阵的列向量组成的线性无关向量组,以及获取所述线性无关向量组的对偶基向量组;根据所述重数、所述线性无关向量组以及所述对偶基向量组,对所述状态变量进行分解,得到多智能体系统状态坐标,计算所述状态坐标的收敛值;

  相位同步计算模块,用于根据所述收敛值和所述线性无关向量组,构建范德蒙德矩阵,根据范德蒙德矩阵的秩,确定分簇数量;根据所述分簇数量、所述线性无关向量组以及所述收敛值,确定多智能体系统的共识向量,根据所述共识向量计算各个分簇的相位同步向量;

  控制模块,用于根据所述相位同步向量进行多智能体系统的运动控制。

  上述多智能体系统的自主分簇控制方法和装置,通过构建范德蒙德矩阵,根据范德蒙德矩阵的秩,确定分簇数量,然后通过智能体个体之间的影响强度悬殊较大的子系统对耦合系统共识状态的影响,提高多智能体系统在复杂环境下的自主行为能力。

  附图说明

  图1为一个实施例中多智能体系统的自主分簇控制方法的流程示意图;

  图2为一个实施例中多智能体系统的自主分簇控制装置的结构框图。

  具体实施方式

  为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

  在一个实施例中,如图1所示,提供了一种多智能体系统的自主分簇控制方法,包括以下步骤:

  步骤102,获取多智能体系统的状态变量。

  状态变量是用来衡量多智能体系统的运动行为,若通过表示第个智能体在时刻的位置,则状态变量可以表示为

  对于多智能体的主动分簇,可以采用如下模型描述:

  

  表示多智能体系统个体间的耦合系数,,是个体间的影响半径,是关于个体间相对距离的截断型交互函数,定义为,考虑由此类模型刻画的多智能体系统的分簇行为,如果个体间影响半径,即系统内部只存在局部的相互影响,此时可以利用系统的结构和初始条件进行分簇行为设计,这样的处理方式上述提及的分簇技术中已存在;如果个体间影响半径,即系统中个体间相互作用是全局的,此时自主分簇模型描述为:

  

  其中,表示多智能体系统中个体i和个体j之间的影响强度,是时间滞量最大值,并且延迟分布被归一化,即满足

  步骤104,根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵,根据邻接矩阵,获取对应的拉普拉斯矩阵,以及拉普拉斯矩阵的零特征值的重数。

  步骤106,计算用于将拉普拉斯矩阵进行分块的非奇异矩阵,获取非奇异矩阵的列向量组成的线性无关向量组,以及获取线性无关向量组的对偶基向量组。

  步骤108,根据重数、线性无关向量组以及对偶基向量组,对状态变量进行分解,得到多智能体系统状态坐标,计算状态坐标的收敛值。

  步骤110,根据收敛值和线性无关向量组,构建范德蒙德矩阵,根据范德蒙德矩阵的秩,确定分簇数量。

  步骤112,根据分簇数量、线性无关向量组以及收敛值,确定多智能体系统的共识向量,根据共识向量计算各个分簇的相位同步向量。

  步骤114,根据相位同步向量进行多智能体系统的运动控制。

  上述多智能体系统的自主分簇控制方法中,通过构建范德蒙德矩阵,根据范德蒙德矩阵的秩,确定分簇数量,然后通过智能体个体之间的影响强度悬殊较大的子系统对耦合系统共识状态的影响,提高多智能体系统在复杂环境下的自主行为能力。

  在其中一个实施例中,获取多智能体系统的状态变量为:

  

  根据所述状态变量,确定多智能体系统的动态刻画为:

  

  其中,表示多智能体系统个体间的耦合系数,定义=A,A表示邻接矩阵,I矩阵表示单位矩阵,L矩阵表示A矩阵对应的拉普拉斯矩阵,表示时间滞量最大值,满足

  在另一个实施例中,根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵为:

  

  其中,A指的是邻接矩阵,表示多智能体系统中个体i和个体j之间的影响强度,N表示个体之间的半径。

  在其中一个实施例中,计算用于将拉普拉斯矩阵进行Jordan分块的非奇异矩阵为:

  

  其中,的列向量;获取非奇异矩阵的列向量组成的线性无关向量组为,以及获取线性无关向量组的对偶基向量组为;其中是克罗内克符号。

  在其中一个实施例中,根据重数、线性无关向量组以及对偶基向量组,对状态变量进行分解为,其中,为多智能体系统状态坐标,

  在其中一个实施例中,计算状态坐标的收敛值为:

  

  其中,

  在其中一个实施例中,根据收敛值和线性无关向量组,构建范德蒙德矩阵为:

  

  表示重数,是一族标准0-1向量,满足)并且表示拉普拉斯矩阵;具体的,0-1向量,是指向量中的分量是0或1;一族标准0-1向量,是指且满足

  根据范德蒙德矩阵的秩,确定分簇数量。

  在其中一个实施例中,确定共识向量,即共识子空间由生成。

  具体的,当时,多智能体系统实现无条件同步,其对应的相位同步向量为:

  

  当并且初始条件满足,,此时,系统实现条件同步,对应的同步向量为:

  以下以一个具体实施例,对本发明的上述实施例进行说明。

  分析一类具有分布式延迟的相位耦合齐次多振子系统聚类准则。考虑以下具有6个震荡器构成的振子系统述如下:

  

  该系统由两个方程式耦合,第一个方程式定义振子的动态行为,第二个方程式确定耦合函数的变化;其中

  ——振子的相位;

  ——,振子的固有频率,且

  ——

  ——

  ——,时间滞量最大值;

  ——,其满足

  初始条件——

  为了获得相位同步值,首先将该系统在其特殊解处线性化,得到:

  

  其中;在此计算过程中的数据如表1所示;

  表1 实施例计算数据

  

  邻接矩阵及其对应的拉普拉斯矩阵为:

  

  首先直接计算容易知道拉普拉斯矩阵的零特征值的重数

  计算得到如下非奇异矩阵将矩阵进行Jordan分块。

  

  使得,其中零特征值对应的两个线性无关的特征向量为;记

  计算得到的对偶基,使得,其中是克罗内克符号;特别地,得到

  关于的计算得到

  取,其满足并和并且;进而就有;因此,,则有:

  

  即振子系统能够自组分成两簇。

  知道,进而直接计算得到:

  

  

  

  本发明提出了一种多智能体系统的自主分簇方法,给出了系统的分簇准则和局部同步值得计算方法。根据实施例,分簇准则和同步计算公式能同时确保多智能体系统得分簇行为。

  应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

  在一个实施例中,如图2所示,提供了一种多智能体系统的自主分簇控制装置,包括:状态获取模块202、计算模块204、相位同步计算模块206和控制模块208,其中:

  状态获取模块202,用于获取多智能体系统的状态变量;

  计算模块204,用于根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵,根据所述邻接矩阵,获取对应的拉普拉斯矩阵,以及所述拉普拉斯矩阵的零特征值的重数;计算用于将所述拉普拉斯矩阵进行分块的非奇异矩阵,获取所述非奇异矩阵的列向量组成的线性无关向量组,以及获取所述线性无关向量组的对偶基向量组;根据所述重数、所述线性无关向量组以及所述对偶基向量组,对所述状态变量进行分解,得到多智能体系统状态坐标,计算所述状态坐标的收敛值;

  相位同步计算模块206,用于根据所述收敛值和所述线性无关向量组,构建范德蒙德矩阵,根据范德蒙德矩阵的秩,确定分簇数量;根据所述分簇数量、所述线性无关向量组以及所述收敛值,确定多智能体系统的共识向量,根据所述共识向量计算各个分簇的相位同步向量;

  控制模块208,用于根据所述相位同步向量进行多智能体系统的运动控制。

  在其中一个实施例中,状态获取模块202还用于获取多智能体系统的状态变量为:

  

  根据所述状态变量,确定多智能体系统的动态刻画为:

  

  其中,表示多智能体系统个体间的耦合系数,定义=A,A表示邻接矩阵,I矩阵表示单位矩阵,L矩阵表示A矩阵对应的拉普拉斯矩阵,表示时间滞量最大值,满足

  在其中一个实施例中,计算模块204还用于根据多智能体系统中各个智能体个体之间的影响强度,确定邻接矩阵为:

  

  其中,A指的是邻接矩阵,表示多智能体系统中个体i和个体j之间的影响强度,N表示个体之间的半径。

  在其中一个实施例中,计算模块204还用于计算用于将所述拉普拉斯矩阵进行Jordan分块的非奇异矩阵为:

  

  其中,的列向量;获取所述非奇异矩阵的列向量组成的线性无关向量组为,以及获取所述线性无关向量组的对偶基向量组为;其中是克罗内克符号。

  在其中一个实施例中,计算模块204还用于根据所述重数、所述线性无关向量组以及所述对偶基向量组,对所述状态变量进行分解为,其中,为多智能体系统状态坐标,

  在其中一个实施例中,计算模块204还用于计算所述状态坐标的收敛值为:

  

  其中,

  在其中一个实施例中,计算模块204还用于根据所述收敛值和所述线性无关向量组,构建范德蒙德矩阵为:

  

  表示重数,是一族标准0-1向量,满足)并且表示所述拉普拉斯矩阵;根据范德蒙德矩阵的秩,确定分簇数量。

  关于多智能体系统的自主分簇控制装置的具体限定可以参见上文中对于多智能体系统的自主分簇控制方法的限定,在此不再赘述。上述多智能体系统的自主分簇控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

  本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

  以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

  以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

《多智能体系统的自主分簇控制方法和装置.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)