第38卷第10期自动化学报Vol.38,No.10 2012年10月ACTA AUTOMATICA SINICA October,2012
多个体协调控制问题综述
闵海波1刘源1王仕成1孙富春2
摘要对多个体协调控制问题的研究现状进行综述.介绍了多个体协调控制领域的基本问题,并结合系统中网络与动力学不确定性,对该领域当前的研究热点和前沿进行分析阐述.进一步,对工程中广为应用的Euler-Lagrange系统协调控制最新研究成果进行归纳总结.最后指出该研究领域存在的问题及今后的研究方向.
关键词协调控制,一致性,时延,拓扑切换,异步网络,网络化Euler-Lagrange系统
引用格式闵海波,刘源,王仕成,孙富春.多个体协调控制问题综述.自动化学报,2012,38(10):1557?1570
DOI10.3724/SP.J.1004.2012.01557
An Overview on Coordination Control Problem of Multi-agent System
MIN Hai-Bo1LIU Yuan1WANG Shi-Cheng1SUN Fu-Chun2
Abstract This paper presents an overview on the state-of-the-art of the coordination control problem of multi-agent systems.The fundamental problems in the coordination control?eld are introduced,and the research hotspots and frontiers are analyzed and summarized.Furthermore,some of the latest research achievements on coordination control of networked Euler-Lagrange systems are also presented.Finally,the problems in this area and the prospect of future research are summarized.
Key words Coordination control,consensus,time delay,switching topology,asynchronous network,networked Euler-Lagrange systems
Citation Min Hai-Bo,Liu Yuan,Wang Shi-Cheng,Sun Fu-Chun.An overview on coordination control problem of multi-agent system.Acta Automatica Sinica,2012,38(8):1557?1570
自上世纪80年代以来,受生物学、人类社会学研究的启发,多个体协调控制成为众多领域的研究热点[1].类似于鱼群捕食、鸟群迁徙等生物与人类社会中的群体性优势,多个体之间的协调与合作将大大提高个体行为的智能化程度,更好地完成很多单个个体无法完成的工作,并具有高效率,高容错性和内在的并行性等优点.时至今日,多个体协调控制技术已在无线传感器网络[2]、多机械臂协同装配[3]、无人机编队[4]、卫星编队[5]、集群航天器深空探测[6]等
收稿日期2011-09-23录用日期2012-04-25
Manuscript received September23,2011;accepted April25, 2012
国家重点基础研究发展计划(973计划)(2012CB821206),国家自然科学基金(61203354,60904083,61004021),高等学校博士学科点专项科研基金资助课题(20111011321),北京市自然科学基金(4122037)资助
Supported by National Basic Research Program of China(973 Program)(2012CB821206),National Natural Science Founda-tion of China(61203354,60904083,61004021),Specialized Re-search Fund for the Doctoral Program of Higher Education(2011 1011321),and Municipal Natural Science Foundation of Beijing (4122037)
本文责任编委吕金虎
Recommended by Associate Editor LV Jin-Hu
1.第二炮兵工程大学西安710025
2.清华大学计算机科学与技术系人工智能国家重点实验室北京100084
1.Hi-Tech Institute of Xi an,Xi an710025
2.State Key Laboratory of Intelligence Technology,Department of Computer Science and Technology,Tsinghua University,Beijing100084领域得到广泛应用.
多个体协调控制的基本问题包括一致性控制、会合控制、聚结控制和编队控制.其中后三者可视为一致性控制的推广与特例.目前已有文献对一致性问题进行了系统性综述[7?8].就系统属性而言,多个体系统区别于单体系统最本质的要素在于其通过网络进行信息传递与共享,网络的不确定性(如丢包,时延等)对多个体协调控制性能的影响不容忽视,因此,该问题成为近几年协调控制领域研究的前沿和热点[9].另一方面,多个体协调控制领域的研究对象也逐渐由前期简单的一阶或高阶线性系统过渡为更一般的非线性系统,并考虑更为实际的系统不确定性等因素.其中Euler-Lagrange系统作为一类工程中应用极其广泛的典型系统受到学者的普遍关注.为此,本文力图在剖析多个体协调控制领域最新研究成果的基础上,对该领域的发展现状进行综述,并提出该领域研究的前沿性问题.
本文结构安排如下:第1节针对多个体协调控制几个基本问题进行阐述,为后续讨论奠定基础.第2节围绕最近几年该领域的发展前沿—网络不确定性与系统不确定性进行综述,并对相关研究方法进行归纳总结.第3节介绍了工程中广为应用的Euler-Lagrange系统协调控制最新研究成果.第4节总结全文,并提出该领域的发展方向.
1558自动化学报38卷
1多个体协调控制中的基本问题
1.1一致性(Consensus)控制
一致性是指多个体通过信息的共享与交互,实现某种状态的趋同[7],其控制目标可描述为
lim
t→∞
x j(t)?x i(t) =0,?i,j∈I(1)其中,I为系统中个体的集合,x i为系统中第i个个体的状态.这种状态可以是卫星的姿态[10]、鱼群或鸟群的行动方向[11?12]、数据融合[13]或者分布式传感器滤波值[2].
一致性问题最早在计算机科学中提出.在该领域奠基性工作中,Tsitsiklis等[14]针对分布式决策问题,研究了异步情形下的优化算法.计算机图形领域,Reynolds[15]按照自然界中鸟群的特点较早地对鸟群、鱼群等系统的群体行为进行了计算机仿真,并提出著名的Boid模型.该模型按照下面的规则进行仿真:1)中心聚结:所有个体试图靠近邻近的个体;2)防撞:所有个体与邻近个体保持适当间距,以免碰撞;3)速度匹配:所有个体试图与邻近个体的速度保持一致.1995年,Vicsek等[16]又从统计力学的角度,对文献[15]中的规则进行了简化,通常称为Vicsek模型.该模型是由N个自治的个体组成的离散时间系统,每个个体在平面中以恒定的速率运行,其角度是邻居范围内所有个体角度的平均,另外还受到一个均值为零的噪声的影响.邻居是那些与该个体的Euclidean距离小于某个给定的半径r内的所有个体的集合.Vicsek模型实际上是Boid 模型的一种特殊情形.文献[16]通过仿真给出了令人惊讶的结果:当个体密度比较大且噪声比较小时,系统中的每个个体的飞行方向趋于某个共同的角度,该现象称为同步[17].
Vicsek模型不但引起了物理学家的兴趣,数学家、控制工程师和系统理论专家也试图对该群体系统的这种一致性行为给出一个严格的理论分析. Jadbabaie等[18]通过对Vicsek模型中角度的非线性更新用线性模型来近似,试图给出同步的理论分析.对一阶积分器型线性系统,其动力学模型为
˙x i=u i,?i∈I(2)
其中,x i∈R为第i个个体的状态,u i为施加的控制量.早期的工作中,学者们设计了几种不同的协调控制律[18?21],可统一为以下数学描述[7]:
u i=?
j∈N i(t)
a ij(t)(x i(t)?x j(t))(3)
其中,j∈N i(t)表示第i个个体的相邻个体集合, a ij(t)为时变的拓扑加权系数.控制律(3)意味着每个个体的状态不断趋同于其相邻个体的状态(可能时变).此外,由式(3)可以看出,在针对第i个个体设计分布式控制律时,仅利用其相邻的个体与其自身的状态差,而无需非相邻个体的任何信息,因此这一规则称为“近邻规则”.Ren等[21]证明了:对于一阶系统,当通信拓扑中存在一个衍生树(Spanning tree)时,该协调控制律能够保证系统达到一致性.此外,对于复杂网络系统,Chen等[22]提出以图论的视角对系统同步性进行分析,得到了有趣的结论:通信图中多余的边不仅无益于同步,相反还会破坏同步,这也揭示了通信图对于系统可同步性的基础性作用.
对应于离散系统,文献[18,20?21]设计了如下控制协议:
x i[k+1]=
j∈N i(k)
βij[k]x j[k](4)其中,
j∈N i(k)∪{i}
βij[k]=1,βij[k]>0,?j∈N i(k)
{i}.其基本思想是利用迭代算法,使系统状态趋向于一个由x1=x2=···=x n刻画的共同空间.
在一阶系统结果的基础上,近几年二阶及高阶线性系统也成为研究的热点,代表性工作包括文献[23?26].以二阶线性系统为例,其动力学模型可表述为
˙x i=v i,
˙v i=u i,?i∈I
(5)对应的一致性控制律(或控制协议)可设计为[26] u i(t)=α
j∈N i
a ij(x j(t)?x i(t))+
β
j∈N i
a ij(v j(t)?v i(t)),i∈I
(6)
以经典控制的视角来看,该控制器本质上是一个PD 控制器,即协调控制律中既包含位置误差信息,也包含速度误差信息.所不同的是,对于多个体系统而言,其利用的是群体性误差信息,而针对单体系统的控制仅需要该单体与期望状态的误差信息.因此,相对于单体,针对多个体一致性控制的分析与综合更为复杂.事实上,二阶系统实现一致性的条件相比于一阶系统而言更为保守:除通信拓扑中需要具有一个衍生树之外,还需要控制增益α和β满足一定条件[26].此外,针对更为一般的高阶线性系统,Li 等[27]提出一种新的控制体系,并在该体系下处理多体系统的一致性与复杂网络系统的同步问题.在另一个工作中,Li等[28]针对系统的H∞和H2分布式控制问题进行研究.通过引入性能域(Performance
10期闵海波等:多个体协调控制问题综述1559 region)概念,对系统的H∞和H2性能进行了详尽
的分析讨论.有关线性系统一致性更详尽的分析和
综述可参见文献[7?8].
近年来,针对非线性系统的一致性控制研究也
取得了一定的进展.众所周知,一般非线性系统相
对于线性系统在动力学特性方面要复杂得多,因此
针对非线性系统一致性控制的分析和综合通常比较
困难.相对于线性系统完备的分析工具(如代数图
论[29]、非负矩阵论[30]等)与结论,面向一般非线性
多体系统一致性控制的研究尚处于起步阶段,目前
的研究仍集中在几种特殊的系统中.例如Su等[31]
和Song等[32]等针对含有非线性动力特性的二阶系
统设计了一致性跟随控制器.虽然假定系统中含有
未知动力学参数的非线性项,但如果将该非线性项
视为扰动,该问题本质上仍是一个二阶线性系统的
协调控制.而M¨u nz等[33?34]则在考虑通信时延与
动态拓扑情形下,针对局部无源的一类特殊非线性
系统设计了一致性控制律,其控制律仍是线性的.而
Fang等[35]和Qu等[36]则直接利用非线性控制器
对该问题加以解决.另外,最近几年,针对工程中广
泛应用的Euler-Lagrange多体系统的一致性控制
研究成为该领域的一个前沿和热点[37].总体而言,
目前在非线性一致性控制领域所形成的理论体系远
非成熟,该领域的研究仍然任重而道远.另外需要指
出的是,以上讨论的一致性控制问题绝大多数都是
针对理想通信网络情形,即假定网络中不存在通信
时延且拓扑为时不变的.考虑到现实网络的非理想
特性,这些问题就变得更为复杂和困难.我们将在第
2节中对这些特殊问题进行更为深入的分析.
1.2会合(Rendezvous)控制
概括而言,会合指系统中的所有个体速度逐渐
趋于零,且静止于某一位置,其控制目标可描述为
lim
t→∞
x j(t)?x i(t) =0,?i,j∈I
lim t→∞ ˙x i(t) =0,?i∈I
(7)
由式(7)可以看出,该问题在本质上是一致性问题的一个特例,可简单理解为终态为静止的一致性.会合控制最早由Ando等提出[38],后被Lin等推广至同步和异步的“走–停”策略[39].针对线性系统,在通信拓扑保持连通性的条件下,Cortes等[40]放宽了文献[38]中通信拓扑连通的条件.通过引入“邻近图(Proximity graphs)”概念,Cortes等进一步降低了这些算法对于通信拓扑的保守性.在此基础上,Martinez等[41]还对这些算法进行了时间复杂度分析.针对非线性系统会合的研究也引起了学者的关注.例如,Dimarogonas等[42]针对非万向轮的小车设计了分散反馈控制器,使得由小车组成的MAS系统实现会合.Hui[43]则针对有限时间限制的会合问题,设计了分布式非平滑静态与动态输出反馈控制器.值得注意的是,学术界对于会合问题还有另一种定义.该定义要求MAS中所有个体同时达到相同位置,工程应用中包括航天器的交会[44]等.
1.3聚结(Flocking)控制
聚结问题在自然界中十分常见,如鸟群的迁徙,鱼群的捕食等.早期Reynolds[15]的工作即是针对聚结现象展开的.此后,针对聚结现象理论研究的研究小组包括:Toner等[45]、Shimoyama等[46]和Levine等[47],但这些研究小组都没有给出聚结行为严格的理论分析.2001年,Leonard等[48]首次将人工势场(Arti?cial potential,AP)方法引入聚结行为的理论分析中,之后该方法成为研究聚结现象的一种重要数学工具.Olfati-Saber[49]首先基于AP 建立了一个完整的理论分析框架.其基本思想是:通过建立子系统之间的局部势能函数,使得全局势能函数(所有局部函数相加值)的最小值对应于期望的聚结状态.此外,通过引入分别代表“自由聚合”、“障碍”和“共同目标”的α-agent、β-agent和γ-agent,使得聚结可考虑外部障碍和给定的期望轨迹.利用类似的思路,Tanner等[12]针对固定和切换通信拓扑下的二阶积分器线性系统,设计了聚结控制律.该控制律展示了通信拓扑连通性与系统稳定性的关系,并从理论上证明该系统的稳定性对通信网络拓扑的切换具有鲁棒性.
1.4编队(Formation)控制
编队控制是多个体协调控制中的一个研究热点,其本质是一种几何构型严格的聚结控制[5,8].编队控制的目标在于通过调整个体的行为使系统实现特定几何构型的整体性位移,其数学描述为
lim
t→∞
[x j(t)?x i(t)]=x dij,?i,j∈I
lim
t→∞
[˙x i(t)?c(t)]=0,?i∈I
(8)
其中,x dij为第i个与第j个个体的期望相对位置矢量,c(t)为期望的整体位移速度.编队控制在诸如多机器人协调[50?52]、无人机(Unmanned aerial vehicle,UAVs)编队[4]及航天器编队[53]中得到广泛研究.尽管诸多应用各具特点,但编队控制亦有其共同点.例如,在绝大多数应用中,系统中的个体具有相同的动力学和相似的局部控制器构架;同时,每个个体的通信和计算能力都是受限的,且通信拓扑在编队控制中都起关键性作用.
目前针对编队控制问题已有许多研究方法,大致可分为三类,即主从式、虚拟结构式和行为式.
1)主从式
1560自动化学报38卷
主从式方法中,多个体系统中的一个或几个个体充当“主体”,其他个体充当“从体”并通过与其相邻个体的交互达到跟随主体的目的.通常情形下,主体的动力学特性可简化为式(8)中期望的速度c(t).由于每个个体仅需适应其局部环境,这种方法可自然地利用分布式模式实现.然而,这一方法内在的不足表现在其严重依赖主体的状态:一旦主体失效,整个编队也随之失效,且单个个体的稳定性并不意味着编队的稳定性.因此需要对局部控制器施加严格的稳定性条件.此外,该构架下各个体的动力学扰动具有累加性,因此基于该构架的控制律不具有可裁剪性[54].这意味着随编队中个体数目不断增大,编队不稳定的风险将越来越大.
2)虚拟结构式
虚拟结构是一种广为采用的编队控制方法[55].该构架下,通过对所有个体状态进行一定的代数运算生成一个虚拟个体.整个编队被视为一个刚体,而虚拟的个体就成为参考点.这样,每个个体的位置和轨迹都可通过该参考点的位置和期望的编队构型明确地计算出来.这一方法易于刻画整个编队的几何构型,并保持准确的编队.但是,由于虚拟结构方法需要集中处理数据,其仅适用于小型编队系统.近几年来,Ren等[5]在利用分布式构架实现虚拟结构式编队方面,做了大量卓有成效的工作.
3)行为式
行为式方法中针对每个个体预定义一个合适的控制律,使其对应于所有个体可能的状态.尽管该方法是分布式的,但难以定量分析.事实上,基于行为式的编队控制并不多见,典型的文献包括文献[56?57]等.
通过上述讨论,我们可以得出编队控制属于分布式控制构架.对于第i个个体,可将其动力学表示为[58]
˙x i=f(x i,u i(x i,x neighbor))(9)
其中,x neighbor为通过其相邻个体收集的信息,并由通信拓扑确定,u i(x i,x neighbor)为施加在第i个个体上的局部控制器.当系统中个体的动力学相对于系统协调控制的影响可以忽略(如深空探测任务中的航天器[6])时,多个体系统的动力学便可简化为一阶或高阶积分器,可利用一致性控制丰富的研究成果对编队稳定性进行分析.与之相反,在处理诸如近地航天器、无人机编队等系统时,系统自身的动力学特性便不能被忽略,因此不能将这些系统直接简化为简单的积分器型线性系统.这种情况下,需直接利用系统实际的动力学特性,并结合一致性控制中的相关理论具体分析[50?51,53,59].2多个体协调控制中的特殊问题
就系统属性而言,多个体系统区别于单体系统最本质的要素在于其通过网络进行信息传递与共享,因此,网络传输中普遍存在的丢包、时延等因素对于系统性能的影响不容忽视.此外,由于系统动力学参数未知或外部扰动引发系统动力学参数发生变化,使得多个体系统动力学存在不确定性.为此,本节将分别针对多个体系统网络不确定性和动力学不确定性这两类特殊问题进行阐述.
2.1网络不确定性
2.1.1时延网络
多个体协调控制中的时延问题在近几年得到广泛关注.按照时延属性可将系统中存在的时延分为两种:通信时延和自时延.
2.1.1.1通信网络
通信时延是指多个体中个体之间在进行信息交互时,发送方的信息经一定时间滞后才到达接收方.假定系统中第i个个体与第j个个体之间的状态差为e ij,则存在时延T ij(T ij>0)情形下的误差可表述为
e ij=x j(t?T ij)?x i(t)(10)因此,第i个个体在t时刻接收到的信息实际上是第j个个体在T ij时刻之前发送的.
对于一阶线性系统,最为常见的分布式一致性控制律设计为[20]
u i=?
j∈N i(t)
a ij(t)(x i(t)?x j(t?T ij))(11)
其中,a ij>0.由式(11)可知,这类控制律实质上是一个分布式P类时滞控制器.区别于一般单体系统,针对该控制器的理论分析与系统通信拓扑的性质密切相关.例如,对于恒定的通信时延T ij,Moreau 等[20]通过构造Lyapunov泛函证明了:在连续有界的时间间隔T内,如果
t+T
t
A(s)d s对应的连通图包含一个全局可达结点(A(s)为t时刻的近邻矩阵,该矩阵由通信拓扑决定),则该控制律可容许任意有界时延.M¨u nz等[33]根据Lyapunov-Razumikhin 函数的不变集原理证明:当T ij为时变时延时,如果连接拓扑在连续有界时间间隔内的连通图含有全局可达结点,则系统渐近实现一致性.此外,针对式(11)中T ij为时变值及系统存在外部噪声干扰的情形,刘学良等[60]设计分布式H∞控制器,保证了系统的一致性.
对应于连续系统,一阶离散系统的通信时延问
10期闵海波等:多个体协调控制问题综述1561题也得到了广泛研究.一种典型的系统描述为[61?62]
x i(k+1)=
j∈N i∪{i}
a ij x j(k?T ij)(12)
其中,a ij>0,j∈N i∪{i},a ii≥0且
n
j=1
a ij=
1,N i∪{i}表示第i个个体相邻个体的并集,T ij>0为通信时延且T ii=0(即不存在自时延).结合延时状态的有限性,可将该系统通过状态扩维技术转化为非时滞系统:
z(k+1)=Γz(k)(13)
其中,z为状态x的扩维向量,Γ是一个随机矩阵,其对应的连通拓扑为有向图,Cao等[61]将其定义“时延图”.利用时延图与对应随机矩阵的关系,Wang 等[63]证明了在有界时变时延作用下,系统渐近收敛一致的充要条件是连通拓扑下含有全局可达结点. Xiao等[62]研究了在个体异步接收邻个体信息条件下的一致性问题,并得到结论:在有界通信时延下,系统渐近收敛一致的充要条件是通信拓扑中含有全局可达结点.
针对二阶线性系统的分布式协调控制也取得了很多研究成果.类似于无时延情形下的一致性控制律(6),二阶一致性控制律可设计为[64]
u i=
j∈N i α[(x i(t)?x j(t?T ij))]+
j∈N i β[(v i(t)?v j(t?T ij))]
(14)
由式(14)可知,含通信时延的分布式控制器本质上是时滞PD类控制器.所不同的是,针对该控制器的稳定性分析不仅与通信拓扑和控制增益有关,而且与时延T ij有关[64?65].在式(14)这一基本思想下,Lin等[65]利用Lyapunov-Krasovskii定理,推导了平均一致性的线性矩阵不等式(Linear matrix inequality,LMI)条件,并证明了其所设计的分布式协调控制律可容许系统中存在任意有界的恒定通信时延.Zhu等[66]在主从式构架下,研究了T ij 为时变情形下的动态跟随控制.结果表明:当主体为系统全局可达结点且T ij有界时,通过选取适当的控制增益可实现系统的一致性跟随控制.对于一般的非主从式构架,Yang等[64]利用频域分析中的small-μ定理,推导了系统稳定性条件.通过对比可知,利用频域所得的充分性条件相比于时域分析的结果较为保守.此外,针对含通信时延的二阶离散系统一致性问题,Lin等[67]等利用模型转换和非负矩阵的性质证明其所设计的控制律可容许任意有界时延.刘德林等[68]针对具有通信时延的离散时间二阶多体系统的一致性问题,根据广义Nyquist判据和Gerschgorin圆盘定理,得到系统渐近收敛的条件.
通过对含有通信时延的二阶积分器线性系统和一阶系统的对比分析,我们可以得到以下结论:1)通过设计合适的协调控制律,两种系统都可实现任意有界时延下的一致;2)为保证系统稳定性,二阶系统的控制增益与通信拓扑和时延都相关,而一阶系统的控制增益则与这两者无关.
此外,针对通信时延下非线性系统协调控制的研究也取得了一定成果.例如,佘莹莹等[69]提出了基于一类连续非线性函数的有限时间一致性算法. Chopra等[70]考察了仿射非线性系统的协调控制,并应用无源性理论[71]与波变量理论[72]技术,设计了输出协调控制律.类似地,利用波变量技术与收缩定理,Wang等[73]针对网络互连的非线性系统设计了线性协调控制律.另外,Chopra等[74]和Nu?n o 等[75?76]针对遥操作协调控制进行了广泛的研究, Chung等[53,77]则针对Euler-Lagrange系统的协调控制进行了初步研究.
:
˙x i=f(x i)+g(x i)u i
y i=h(x i)
(15)
2.1.1.2自时延
多个体中的自时延用于刻画包括执行器时延,个体对于自身行为(状态)和邻个体行为的不同反应延迟以及通信与计算的混合延时等等.实际上,由于通信时延与自时延一般同时存在,而且系统仅存自时延是其特例,因此绝大多数文献也将“自时延”默认为两者共存的情况.本文的讨论也循此惯例.
假定系统中第i个个体与第j个个体之间的状态差为e ij,则当系统同时存在通信时延T ij(T ij>
0)和自时延τij(τij>0)时,e ij可表述为
e ij=x j(t?T ij)?x i(t?τij)(16)可见,在t时刻该误差实际上是第i个个体和第j个个体分别在T ij时刻与τij时刻之前的状态差.
对于存在自时延情形下的一阶系统,一个经典的协调控制律设计为[19]
˙x i=
j∈N i(t)
αij(t)[x j(t?T ij)?x i(t?τij)](17)
该控制律假定通信时延与自时延相同.利用代数图论、矩阵论和稳定性控制理论,文献[19]给出了系统达到平均一致性的充要条件:假定τij=τ为常值,
则当τ∈[0,π
2λmax(L)
]时,系统达到平均一致性,其中λmax(L)是Laplacian矩阵的最大特征值.由于文献[19]针对的是固定,无向和连通的通信拓扑,因此结果相对保守.Xiao等[78]将其推广至更为一般的拓
1562自动化学报38卷
扑构型.Bliman等[79]则将文献[19]的结论推广至τij为时变时延以及τij=T ji两种情形,通过偏微分方程(Partial di?erential equations,PDEs)给出了系统平均一致性的充分条件.在假定τij为Markov 链支配的随机时延情形下,Wu等[80]以随机稳定性视角研究了所设计一致性控制律的稳定性.Tian 等[81]将自时延描述为“输入时延”,针对输入时延与通信时延不同的情形进行研究,并得到结论:该类系统的可一致性条件(Consentability)与输入时延有关,而与通信时延无关.此外,Lin等[62]还将文献[19]的结果推广至二阶共连(Jointly-connected)的拓扑情形.最近,M¨u nz利用广义Nyquist理论,对相对度一和相对度二的含自时延线性系统进行了深入研究[82].在假定通信拓扑为无向图的前提下,这一方法将文献[19,79,81]等统一在同一个理论分析框架下,并得到了该条件下相同的结论.文献[82]的研究结果表明:相对于自时延,系统对于通信时延具有更高的鲁棒性,因此自时延对于系统稳定性具有较大影响.同时我们注意到,尚无针对非线性多个体含自时延的研究文献,因此目前该问题仍是多个体协调控制研究的热点和难点.
对现有方法进行归纳,可将含时延多个体协调控制的研究方法分为以下三类:
1)状态扩维法
该方法主要针对离散系统.其主要思想是:通过状态扩维使原系统转变为部分无时延系统,然后根据代数图论和矩阵理论进行系统分析[61?63,67?68,78].
2)频域法
其主要思想是:通过Laplace变换将时域下的系统动力学转换至频域,然后利用Nyquist定理等频域分析方法对系统稳定性进行分析[19,64,81?82],或利用偏微分分析研究[79].
3)时域Lyapunov类分析方法
该方法主要针对连续系统.通过合理构造Lya-punov类函数(如Lyapunov-Krasovskii函数[65]、Lyapunov-Razumikhin函数[33]、Set-valued Lya-punov函数[20]等),利用相关稳定性定理对系统稳定性进行分析.
2.1.2切换网络
网络拓扑切换是指多个体的通信拓扑因某种原因从一种模式转换为其他模式.尽管在多个体协调控制的研究中,通过假设固定通信拓扑可使问题得到简化,但实际的通信拓扑则很可能是时变的.例如,当受到干扰或通信距离发生变化时,通信网络中的某些链路可能断开或连通[82],此外网络中信息的丢包也可简化为通信拓扑的切换[18].因此,研究多个体在通信拓扑切换情形下的协调控制具有重要的理论和现实意义.
针对该问题早期的一个代表性工作由Jad-babaie等[18]完成.文献[18]给出了一阶线性多体系统达到一致性的一个充分条件,即当通信网络是联合连通(Jointly connected)时,系统可达一致性.此后,大量的后续研究在此基础上展开.Lin 等[83]首先将文献[18]的结果推广至有向图情形,并证明了:如果在每个有限切换时间间隔内都至少存在一个分段恒定的强连通通信拓扑,则系统达到渐近一致性.Ren等[21]进一步将上述工作推广至更为一般的情形,并指出:在系统演化过程中,如果通信图包含衍生树的频率足够高,则系统可实现渐近一致性.Hu等[84]则研究了含测量噪声情形下的变拓扑一致性控制,通过分布式状态估计,使得系统可达均方意义下的随机稳定性.总体而言,目前对具有动态拓扑的图或网络的理论分析仍缺少合适的数学工具,这也是对多体系统协调控制进行理论分析的数学障碍.
值得注意的是,文献[18,21,83?84]所提出的一致性条件是基于模型“过程”的,即假定在整个系统演化过程中由所有个体形成的邻居关系图满足一定的连通性条件时,系统可达一致性(或同步).而实际上对初始条件的建立和分析则更为本质,这一类工作可参见文献[17,85?86].例如,针对Vicsek 模型,Liu等[17]指出:经过足够长时间后系统中每个个体的角度都存在极限,而当初始角度在一定范围时,邻居关系图的连通性并不是Vicsek模型同步的充分条件,从而说明线性化的Vicsek模型与原始Vicsek模型的根本不同.为克服连通性条件难以验证的困难,Tang等[85]给出了概率意义下简化Vicsek模型的一致性条件,结果表明:在足够大规模下,系统以较大概率实现同步,且可同步系统的初始条件与种群规模有关.这一结果以一种全新的视角对简化Vicsek模型进行了阐释.Cucker等[86]则设计了一个通信权重依赖于距离的动力学模型,用以刻画鸟群的演化.文献[86]同样表明,鸟群的初始位置与速度对系统同步起决定性作用.
针对切换拓扑的二阶线性系统的协调控制也取得了一些研究成果.例如,Zhang等[87]讨论了二阶离散线性系统在Markov切换拓扑下的一致性问题,证明系统实现均方意义一致性的充要条件是系统连通图的集合具有一个全局可达结点.Qin等[88]则针对二阶连续系统,研究了时变通信拓扑下的聚结问题,并证明了:当通信图连接权重在某个特定有限集内时,即使通信图不具有全局可达结点,仍可实现聚结控制.最近,Cao等[89]利用变结构控制相关理论,分别针对一阶和二阶连续线性系统设计了分布式一
10期闵海波等:多个体协调控制问题综述1563
致性控制律,使得系统能够在时变通信拓扑下,实现有限时间内的一致性跟随控制.特别地,针对二阶系统,其控制器设计为
u i=
j∈N i(t)
[(r i?r j)+α(v i?v j)]?
βsgn
j∈N i(t)
[γ(r i?r j)+(v i?v j)](18)
其中,sgn为符号函数.与式(6)相比,式(18)中第2项(非连续项)的引入使得系统具有更快的收敛性能.
相对于线性系统,在通信拓扑时变情形下,针对具有本质非线性动力学个体协调控制的研究更具有挑战性.Cao等[90]针对非线性系统
˙r i=f(t,r i)+u i,i=1,···,n(19)进行了研究.利用非连续控制器,作者证明了当切换频率有限时,如果拓扑包含一个衍生树,则该系统可在有限时间内达到一致性.类似地,Min等[91]针对Euler-Lagrange系统,利用非平滑版的Barbalat引理,证明了该系统在有限时间切换情形下可实现任意期望状态的一致性.在应用方面,Smith等[6]针对深空探测任务,研究了切换信息下的航天器编队控制.值得注意的是,近几年学者们更多关注通信拓扑同时存在时延和切换的情形,这一问题无疑比考虑单一因素更具有挑战性.概括而言,可将该领域的研究方法划分为以下四类:
1)代数图与不等式法
其基本思想是:通过建立合适的数学模型,寻找通信拓扑切换与对应Laplacian矩阵的相应关系,并通过状态转移与非负矩阵的性质求解系统状态,最终通过不等式理论分析系统收敛的平衡点[62,66,78,92].
2)微分包含与不变集
其基本思想是:构造合适的Lyapunov类函数,求解该函数的广义Dini微分.假定系统平衡点落入某不变集中,则可以利用针对非平滑系统的LaSall 理论求得系统平衡点[82,89,93].需要注意的是,该方法利用到微分包含,因此具有一定的保守性.
3)Lyapunov函数类方法
其基本思想是:通过构造适当可微的Lyapunov 函数,分析系统的动态特性.例如,Moreau利用定值Lyapunov函数(Set-valued Lyapunov)研究无向时变通信拓扑下的一致性控制.M¨u nz等[34]和Hong等[94]则通过构造在每一切换时段都可微的共同Lyapunov函数(Common Lyapunov)证明系统的稳定性.通常而言,构建共同Lyapunov函数需要一定的技巧性,因此如何选择合适的共同Lyapunov 函数是该方法面临的主要问题.
4)其他方法
除了前三种方法之外,还有一些其他的研究思路.例如,Lin等[95]针对系统中既存在自时延,又存在切换拓扑的情形,巧妙构造了Lyapunov-Krasovskii函数,并给出了系统一致性的充分条件.
2.1.3异步网络
区别于同步网络,异步网络中多体系统个体所对应的时间参考基准(时钟)是不同的,因而系统中个体所利用的信息可能是过时的.在异步网络多体系统中,由于不同时钟的相对速度未知,因此个体发送的信息到达接收端的时间是一个未知量,这与实际的物理系统(如分布式网络)是一致的.与单独处理时延、拓扑切换等网络不确定性不同,异步网络可将这些因素统一刻画,为学者们提供了认识该问题本质的一个新视角,因此成为近年来学者们的研究前沿和热点[96].事实上,从控制构架来看,所有未考虑网络异步特性的协调控制律都不是真正意义上的分布式控制律.这是因为系统中所有个体的决策都必须同步于群体中一个共同的时钟.而在很多应用场合,这一条件是不现实的.
尽管以异步网络的视角认识网络的不确定性具有种种优点,异步网络下多体协调控制的分析与综合仍是一个难题.考虑如图1所示由四个体组成的多体系统(正方形代表个体的“移动”事件,圆形代表个体的“状态更新”事件).随着时间推移,个体位置逐渐趋同.在同步网络下,每个个体信息更新的时间是一致的,而在异步网络下,个体更新信息的时刻则是随机的.这种更新信息的不确定性与网络控制系统中的信息时序错乱类似,将会给系统收敛性的分析带来极大困难
.
图1异步网络中的信息更新
Fig.1Information update under asynchronous topologys 针对一阶离散线性时不变系统,Cao等[97]和Fang等[96]分别从不同的角度研究了异步网络情形下的一致性控制.前者的基本思想是将异步系统转换为有限个离散的同步系统.不同于Jadbabaie 等[18]假定系统中所有个体的时钟同步,文献[97]假定每个个体依据自身独立时钟更新其信息,这样个体信息的更新可能是异步的.通过引入“分析同步(Analytic synchronization)”概念,Cao等[97]得
1564自动化学报38卷
到结论:异步网络下一阶线性系统的一致性条件与同步网络下的相同,但对其分析所需状态空间的维数为后者的两倍.Fang等[96]则试图直接利用异步系统的相关理论解决异步一致性问题.其基本思路是通过将异步一致性问题直接转化为异步迭代(Asynchronous iterations)[98],利用非线性仿收缩理论证明了所设计控制律的收敛性.值得指出的是, Fang等将同步网络下的拓扑切换问题转换为异步网络下的固定拓扑问题,从而得到了与Ren等[21]一致的结论,从而提供了以异步网络视角重新认识拓扑切换问题的新思路.Fang等[99]还利用数学仿真研究了收敛点,同步与异步系统的性能比较等开放性问题.此外,Liu等[100?101]和Gazi等[102?103]利用并行和分布式计算的相关结论,研究了一阶离散多体系统的异步会合.
针对一阶连续系统,Xiao等[104]研究了网络中同时存在时延和拓扑切换的异步一致性控制问题.在假定每个个体的更新时刻与其他个体无关情况下,利用非负矩阵理论和图论设计了异步一致性控制律.类似于文献[97],利用非负矩阵理论和图论,Xiao 等证明了当各切换时段内拓扑所构成的集合包含一个衍生树时,系统可达到一致性.此外,Gao等[105]研究了二阶连续线性系统的异步一致性问题.系统的异步性在于个体仅能在离散时间点测量其与相邻个体的相对状态.通过将异步一致性问题转化为一个含时延的离散时间系统的同步一致性问题,文献[105]给出了LMI形式下的一致性协议.类似地, Liu等[106]研究了含输入时延和通信时延的二阶连续系统一致性问题.作者认为,由于存在通信时延,个体接收的信息可能是过时的,因此该系统也可视为一种“异步交联”系统,并给出了一致性的充分条件.事实上,文献[106]仍是基于系统具有全局统一时钟的假设,因此并不是真正意义上的异步系统.
2.2系统动力学不确定性
实际物理系统中的动力学参数往往是未知的,且外部扰动也可能引发系统动力学发生变化,因此动力学不确定性是系统分析与综合中需要面临的一个常见问题.众所周知,目前针对含不确定性动力学的单个体系统(如机械臂,移动机器人,航天器,无人机等)控制已取得了丰硕的研究成果.相比于单体系统,具有不确定性的多个体协调控制问题更为复杂,成为近年来学者们关注的焦点[107?108].现有针对含不确定性多个体协调控制的研究尚不多见,且绝大多数文献采用了自适应控制技术[3,53,75,107?111].
可将现有研究成果划分为以下几类:
1)自适应神经网络控制器
该类研究借鉴单体控制中已有的神经网络自适应控制算法,将其推广至多个体系统中,借以估计未知的系统参数,并利用通信拓扑所对应Laplacian 矩阵的性质与Lyapunov稳定性分析理论,对系统稳定性进行分析.例如Das等[107]研究了含有未知非线性动力学和外部扰动的二阶系统:
˙x1
i
=x2
i
˙x2
i
=f i(x i)+u i+w i(20)
其中,u i为控制输入,w i为施加在每个结点上的扰动.作者通过构造自适应神经网络观测器对系统的不确定性进行估计,并设计了自适应协同跟踪控制律.在Das等的另一个工作中[108],作者采用类似的技术研究了分布式结点动力学系统的协调控制,其动力学方程为
˙x i=f i(x i)+u i+w i(t)(21)
在假定主体动力学特性未知的情形下,设计了基于神经网络的分布式协调控制律,以实现从体的自适应跟随控制.类似的工作还包括文献[75]等.最近, Miyasato[109]将自适应H∞控制器的设计方法引入Euler-Lagrange系统的编队控制中,使得所设计的控制器能够同时考虑系统参数不确定性以及外部扰动,并可实现H∞意义下的最优控制.
2)后推自适应控制器
其代表性工作由Dong等完成[110].作者针对非万向轮式移动机器人编队任务,假定机器人动力学参数未知,利用Backstepping技术和代数图论,设计了分散式自适应协调控制器,并证明该控制器对于恒定通信时延具有鲁棒性.
3)传统自适应控制器
其代表性工作包括文献[3,53,75]等.针对多个移动机械臂在刚性表面环境下抓取物体的协调任务, Li等[3]设计了一个执行器级的分布式协调控制器.该控制器容许被抓取物的质量改变、未知的系统物理参数及外部有界扰动.Nu?n o等[75]针对多移动机械臂系统中存在通信时延的情形,设计自适应协调控制律,使其能够容许系统中存在未知的动力学参数.此外,针对绳系航天器编队任务,Chung等[53]通过系统扩维与收缩理论设计了分布式编队控制律,并证明该控制律容许航天器动力学参数未知及空间有界扰动的情形.
4)其他方法
区别于自适应控制方案,Yang等[111]应用干扰–观测器控制,对系统状态进行观测,并使得系统中的所有智能体可以渐近达到一致.通过分析具有固定拓扑和时变拓扑的移动多智能体动态系统,得到了基于抗干扰观测器的系统收敛性条件.
10期闵海波等:多个体协调控制问题综述1565 3网络化Euler-Lagrange系统协调控制
本节对网络化Euler-Lagrange系统的协调控
制问题进行综述.Euler-Lagrange方程能够刻画大
量实际的机械系统(如机器人、机械臂、地面车辆、
航天器等),因此网络化Euler-Lagrange系统协调
控制的研究成为近年来一个新的热点,得到各国学
者的广泛关注[112?121].
常见Euler-Lagrange系统方程可表述为
M(q
i )¨q
i
+C(q
i
,˙q
i
)˙q
i
+g(q
i
)=τi(t)+τd
i
(t)(22)
其中,q
i 表示个体的状态,M(q
i
)为个体的惯性矩
阵,C(q
i ,˙q
i
)˙q
i
为个体的哥氏力向量,g(q
i
)为个体
的重力(力矩),τi(t)为施加在个体上的力(力矩),τd
i
(t)为外部扰动量.不同于一般线性系统,Euler-Lagrange系统具有内在的强非线性,使得许多针对线性多个体的分析方法(如非负矩阵分析等)不再适用.这样,针对Euler-Lagrange系统分布式协调控制的研究也更多借助于非线性控制相关理论.另一方面,与一般线性多体系统相似,Euler-Lagrange 系统通信拓扑也在系统性能和稳定性等方面起关键作用,而代数图论仍然是处理该问题一个强有力的数学工具.因此,针对分布式Euler-Lagrange系统协调控制的研究本质上是非线性控制理论与代数图论的交叉与结合.
目前,针对网络化Euler-Lagrange系统的研究已取得了一定成果,按照研究方法可将其分为以下三类:
1)基于无源性理论(Passivity theory)
无源性的基本思想是:在控制律作用下,如果动态系统“存储”的能量不增加,则可以保证系统的稳定性[113].该领域部分重要工作由Chopra和Spong完成[114?116].通过建立输入–输出无源性框架,对一般Euler-Lagrange系统[114]和带有未知参数的双边遥操作具体应用[115]设计协调控制器,并展示了线性系统中常用的P类线性控制器对于分布式Euler-Lagrange系统仍然有效.此外,针对系统中存在通信时延的情形,Chopra利用Lyapunov-Krasovskii定理证明了系统的稳定性[116].在应用领域,Kristiansen等[117]针对航天器编队控制问题,在主从式控制构架下,将航天器六自由度动力学模型转化为Euler-Lagrange方程,并基于无源性理论设计了从航天器的跟踪控制器.Yu等[118]则具体针对具有非万向限制(Nonholonomic constraints)的分布式Euler-Lagrange系统,设计无源性协调控制器.针对同一问题,Yu等[119]则采用输入输出线性化方法,得到一个等价的线性无源系统.在假定通信图为无向强连通拓扑情形下,设计了基于无源理论的协调控制器.Min等[91]针对参数未知Euler-Lagrange系统,考察了在通信拓扑中存在交联时延和拓扑切换情形下的协调控制问题,并基于无源性理论设计了分布式协调控制器.值得说明的是,无源性理论在其他类型多个体协调控制的研究中也得到了广泛应用,一个系统性的工作出现在文献[120]中.
2)基于Lyapunov函数的稳定性分析理论
基于Lyapunov函数的稳定性分析理论被广泛应用于各类系统的稳定性分析中,其中针对非线性系统使用较多的包括Lasall定理、Barbalate定理及Matrosov定理等.区别于一般单体系统,Lyapunov 理论在分布式Euler-Lagrange系统中的应用需要与代数图理论紧密结合,常需要根据通信拓扑对应的Laplacian矩阵确定系统的控制参数,并对系统稳定性进行分析.
根据所研究闭环方程的类型,可将此类分析方法粗略分为两类:一类针对非自主方程,通常采用基于Matrosov稳定性理论的分析方法(例如文献[121]).另一类则更为多见,即将动力学系统转化为自主闭环方程,采用直接Lyapunov稳定性定理, Lasalle定理或Barbalate定理进行分析.需要注意的是,当系统动力学参数未知时,通常结合自适应控制理论进行控制器的分析与设计[37,75,122?125].此外,最近的一些研究成果更注重与实际工程应用的结合,例如地面车辆[122]、遥操作[123]、航天器姿态协调等[124?125],并考虑信息时延、拓扑切换等综合因素,需要综合运用时滞控制理论与切换控制理论等.
3)基于收缩理论(Contraction theory)
收缩理论是非线性系统稳定性分析理论中的一种,其对系统稳定性的释义十分形象:假定可以找到一个包含给定动力学系统的虚拟球体,区别于Lyapunov稳定性理论中寻找一个递减标量函数的做法,如果该球体“收缩”,则说明系统稳定[126].利用该理论,Chung等[53,77]针对绳系卫星以及轮式机器人编队等任务,对分布式EL协调控制进行了深入的研究,包括系统中存在不确定性[53]、恒定的通信时延[77]等情形.其基本思想是:利用系统扩维,用类Laplacian矩阵反映通信拓扑的通信影响,进而利用收缩性原理进行控制器参数设计,并对稳定性加以证明.相比于无源性理论,收缩理论意义下的稳定意味着指数稳定,因此具有更快的收敛速度和更强的系统鲁棒性.但值得注意的是,系统扩维方法仅适用于“同构”系统,即要求系统中个体的动力学相同,这对于EL系统的要求过于保守[124].
4)其他方法
基于前面三种理论的控制器设计多为连续控制器.为获得更好的动态性能,借鉴变结构控制与滑模
1566自动化学报38卷
控制相关理论,Mei等[112]针对具有时变加速度主体的EL系统协调控制,设计了非连续控制器,并利用微分包含与非平滑分析(Nonsmooth analysis)对系统稳定性进行了证明.
4结论
近年来,随着控制、通信、计算技术的交叉融合,多体协调控制得到各国学者的广泛关注,并已取得丰硕的研究成果.相对于单体系统,多体系统可以完成更复杂的任务,并具有高效率、高容错性和内在的并行性等优点.然而,多体系统内在的交联特性给系统的分析与综合带来很多难题.多体协调控制作为一个新兴的研究领域,其研究仍处于发展阶段,有以下问题尚未得到很好的解决:
1)在研究问题方面,针对多体协调控制系统的分析方法和设计方法尚缺乏普适性.例如,现有文献对仅存通信时延的研究较多,对自时延和通信时延并存的研究较少;对仅存动态拓扑的同步系统研究较多,而异步网路系统的研究较少;对多体系统控制律稳定性分析较多,而根据实际控制目标与参数优化目标进行系统综合比较少.因此多体协调控制分析与设计方法的普适性还有待进一步深入研究.
2)在控制对象方面,目前针对协调控制的研究仍集中在一阶或高阶线性积分器模型,而针对实际的非线性物理系统的研究还很不充分.虽然目前针对网络化Euler-Lagrange系统已有一些研究成果,但绝大多数的研究仍假定系统处于确定性同步网络环境(无时延、固定拓扑),尚无针对动态拓扑与异步网络下的研究成果,遑论针对更为一般的非线性系统的研究.由于非线性系统相对于线性系统一般具有更为复杂的动力学特性,使得针对线性多体系统中常用的非负矩阵分析等手段将不再适用.如何将线性系统的相关研究成果推广至非线性系统是一个值得深入研究的问题,针对非线性系统协调控制的研究依然任重而道远.
3)到目前为止,多体协调控制更多的是作为一个理论课题进行研究.将多体协调控制的理论研究与工程实践紧密结合,并将理论成果转化为实际的工程方法还需要深入研究和探索.以无人机、航天器、地面及水下机器人协调控制为例,当前最重要的问题是通过大量模型简化得到的模式化成果多,而真正与实际结合的较少.例如实际的力学系统常具有对称性和非完整性约束等,在处理卫星(航天器)编队时,还需考虑其轨道约束、漂移项等.同时,传感器网络、电网中也具有许多实际的特点.例如,传感器网络中通常要求功耗极低,因此考虑传感器网络的协调控制时,还需综合考虑动态功率管理及网络协议等问题.而电网协调控制系统则要求系统具有高度的可靠性,并实现自动负荷分配与调度、电压自动管理等功能.这些与实际系统密切相关的问题,在目前理论进一步与应用相结合更深入发展时,将面临重要的挑战.这些问题已成为我们现阶段的一个重要研究方向[91,124?125].
此外,现有绝大多数关于多体协调控制的研究仍基于鸟群、鱼群等群体“近邻规则”的猜想与假设,而Ballerini等[127]则发现鸟群中存在以拓扑距离进行通信的机制,从而对“近邻规则”提出了质疑.那么,这些分布式的原则是否在自然界中是最有效率的?自然界中群体性生物的协调与协同是否还有其他规则?可以预见,随着生物医学,脑神经科学与控制科学的不断交叉、深化与融合,必将在协调控制研究领域产生更为丰硕的研究成果.
References
1Pettersen K Y,Gravdahl J T,Nijmeijer H.Group Coor-dination and Cooperative Control.Berlin:Springer-Verlag, 2006
2Cort′e s J.Distributed algorithms for reaching consensus on general functions.Automatica,2008,44(3):726?737
3Li Z J,Li J X,Kang Y.Adaptive robust coordinated con-trol of multiple mobile manipulators interacting with rigid environments.Automatica,2010,46(12):2028?2034
4Wang X H,Yadav V,Balakrishnan S N.Cooperative UAV formation?ying with obstacle/collision avoidance.IEEE Transactions on Control Systems Technology,2007,15(4): 672?679
5Beard R W,Lawton J,Hadaegh F Y.A coordination archi-tecture for spacecraft formation control.IEEE Transactions on Control Systems Technology,2001,9(6):777?790
6Smith R S,Hadaegh F Y.Control of deep-space formation-?ying spacecraft:relative sensing and switched information.
Journal of Guidance,Control and Dynamics,2009,28(1): 106?114
7Olfati-Saber R,Fax J A,Murray R M.Consensus and co-operation in networked multi-agent systems.Proceedings of IEEE,2007,95(1):215?233
8Ren W,Beard R W,Atkins E M.A survey of consensus problems in multi-agent coordination.In:Proceedings of the 2005American Control Conference.Portland,USA:ACC, 2005.1859?1864
9Liu Cheng-Lin,Tian Yu-Ping.Survey on consensus problem of multi-agent systems with time delays.Control and Deci-sion,2009,24(11):1601?1608
(刘成林,田玉平.具有时延的多个体系统的一致性问题综述.控制与决策,2009,24(11):1601?1608)
10Sarlette A,Sepulchre R,Leonard N E.Autonomous rigid body attitude synchronization.Automatica,2009,45(2): 572?577
11Olfati-Saber R.Flocking for multi-agent dynamic systems: algorithms and theory.IEEE Transactions on Automatic Control,2006,51(3):401?420
10期闵海波等:多个体协调控制问题综述1567
12Tanner H G,Jadbabaie A,Pappas G J.Flocking in?xed and switching networks.IEEE Transactions on Automatic Control,2007,52(5):863?868
13Wang Shuai,Yang Wen,Shi Hong-Bo.Consensus-based?l-tering algorithm with packet-dropping.Acta Automatica Sinica,2010,36(12):1689?1696
(王帅,杨文,侍洪波.带丢包一致性滤波算法研究.自动化学报, 2010,36(12):1689?1696)
14Tsitsiklis J,Bertsekas D,Athans M.Distributed asyn-chronous deterministic and stochastic gradient optimization algorithms.IEEE Transactions on Automatic Control,1986, 31(9):803?812
15Reynolds C W.Flocks,herds,and schools:a distributed behavioral model.In:Proceedings of the14th Annual Con-ference on Computer Graphics and Interactive Techniques.
New York,USA:ACM,1987.25?34
16Vicsek T,Czir′o k A,Ben-Jacob E,Cohen I,Shochet O.Novel type of phase transition in a system of self-driven particles.
Physical Review Letters,1995,75(6):1226?1229
17Liu Z X,Guo L.Connectivity and synchronization of multi-agent systems.In:Proceedings of the25th Chinese Control Conference.Harbin,China:Beihang University Press,2006.
373?378
18Jadbabaie A,Lin J,Morse A S.Coordination of groups of mobile autonomous agents using nearest neighbor rules.
IEEE Transactions on Automatic Control,2003,48(6):988?1001
19Olfati-Saber R,Murray R M.Consensus problems in net-works of agents with switching topology and time-delays.
IEEE Transactions on Automatic Control,2004,49(9): 1520?1533
20Moreau L.Stability of multiagent systems with time-dependent communication links.IEEE Transactions on Au-tomatic Control,2005,50(2):169?182
21Ren W,Beard R W.Consensus seeking in multiagent sys-tems under dynamically changing interaction topologies.
IEEE Transactions on Automatic Control,2005,50(5):655?661
22Chen G R,Duan Z https://www.wendangku.net/doc/0b12315927.html,work synchronizability analysis:
a graph-theoretic approach.Chaos,2008,18(3):037102-
1?037102-10
23Ren W.On consensus algorithms for double-integrator dy-namics.IEEE Transactions on Automatic Control,2008, 58(6):1503?1509
24Hong Y G,Chen G R,Bushnell L.Distributed observers design for leader following control of multi-agent networks.
Automatica,2008,44(3):846?850
25Hong Y G,Hu J P,Gao L X.Tracking control for multi-agent consensus with an active leader and variable topology.
Automatica,2006,42(7):1177?1182
26Yu W W,Chen G R,Cao M.Some necessary and su?-cient conditions for second-order consensus in multi-agent dynamical systems.Automatica,2010,46(6):1089?1095 27Li Z K,Duan Z S,Chen G R,Huang L.Consensus of multi-agent systems and synchronization of complex networks:a uni?ed viewpoint.IEEE Transactions on Circuits and Sys-tems I:Regular Papers,2010,57(1):213?22428Li Z K,Duan Z S,Chen G R.On H∞and H2performance regions of multi-agent systems.Automatica,2011,47(4): 797?803
29Royle G F,Godsil C.Algebraic Graph Theory.New York: Springer Graduate Texts in Mathematics,2001
30Berman A,Plemmons R J.Nonnegative Matrices in the Mathematical Sciences.New York:Academic Press,1979
31Su H S,Chen G R,Wang X F,Lin Z L.Adaptive second-order consensus of networked mobile agents with nonlinear dynamics.Automatica,2011,47(2):368?375
32Song Q,Cao J D,Yu W W.Second-order leader-following consensus of nonlinear multi-agent systems via pinning con-trol.Systems and Control Letters,2010,59(9):553?562 33M¨u nz U,Papachristodoulou A,Allg¨o wer F.Nonlinear multi-agent system consensus with time-varying delays.In:Pro-ceedings of the17th World Congress of the International Federation of Automatic Control(IFAC).Seoul,Korea, 2008.1522?1527
34M¨u nz U,Papachristodoulou A,Allg¨o wer F.Consensus reaching in multi-agent packet-switched networks with non-linear coupling.International Journal of Control,2010, 82(5):953?969
35Fang L,Antsaklis P J.Asynchronous consensus protocols using nonlinear paracontractions theory.IEEE Transactions on Automatic Control,2008,53(10):2351?2356
36Qu Z H,Chunyu J M,Wang J.Nonlinear cooperative control for consensus of nonlinear and heterogeneous systems.In: Proceedings of the46th IEEE Conference on Decision and Control.New Orleans,USA:IEEE,2007.2301?2308
37Mei J,Ren W,Ma G F.Containment control for multi-ple Euler-Lagrange systems with parametric uncertainties in directed networks.In:Proceedings of the2011Ameri-can Control Conference(ACC).San Francisco,USA:IEEE, 2011.2186?2191
38Ando H,Y Oasa,Suzuki I,Yamashita M.Distributed mem-oryless point convergence algorithm for mobile robots with limited visibility.IEEE Transactions on Robotics and Au-tomation,1999,15(5):818?828
39Lin J,Morse A S,Anderson B D O.The multi-agent ren-dezvous problem.In:Proceedings of the42nd Conference on Decision and Control(CDC).Hawaii,USA:IEEE,2003.
1508?1513
40Cortes J,Martinez S,Bullo F.Robust rendezvous for mo-bile autonomous agents via proximity graphs in arbitrary di-mensions.IEEE Transactions on Automatic Control,2006, 51(8):1289?1298
41Martinez S,Bullo F,Cortes J,Frazzoli E.On synchronous robotic networks—Part I:models,tasks,and complex-ity.IEEE Transactions on Automatic Control,2007,52(12): 2199?2205
42Dimarogonas D V,Kyriakopoulos K J.On the rendezvous problem for multiple nonholonomic agents.IEEE Transac-tions on Automatic Control,2007,52(5):916?922
43Hui Q.Finite-time rendezvous algorithms for mobile au-tonomous agents.IEEE Transactions on Automatic Control, 2011,56(1):207?211
1568自动化学报38卷
44Breger L,How J P.Safe trajectories for autonomous ren-dezvous of spacecraft.Journal of Guidance,Control,and Dynamics,2008,31(5):1478?1489
45Toner J,Tu Y H.Flocks,herds,and schools:a quantitative theory of?ocking.Physical Review E,1998,58(4):4828?4858
46Shimoyama N,Sugawara K,Mizuguchi T,Hayakawa Y, Sano M.Collective motion in a system of motile elements.
Physical Review Letters,1996,76(20):3870?3873
47Levine H,Rappel W J,Cohen I.Self-organization in systems of self-propelled particles.Physical Review E,2001,63(1): 97?101
48Leonard N E,Fiorelli E.Virtual leaders,arti?cial poten-tials and coordinated control of groups.In:Proceedings of the40th Conference on Decision and Control.Orlando,FL: IEEE,2001.2968?2973
49Olfati-Saber R.Flocking for multi-agent dynamic systems: algorithms and theory.IEEE Transactions on Automatic Control,2006,51(3):401?420
50Balch T,Arkin R C.Behavior-based formation control for multirobot teams.IEEE Transactions on Robotics and Au-tomation,1998,14(6):926?939
51Desai J P,Ostrowski J P,Kumar V.Modeling and control of formations of nonholonomic mobile robots.IEEE Trans-actions on Robotics and Automation,2001,17(6):905?908
52Feddema J T,Lewis C,Schoenwald D A.Decentralized control of cooperative robotic vehicles:theory and applica-tion.IEEE Transactions on Robotics and Automation,2002, 18(5):852?864
53Chung S J,Ahsun U,Slotine J J E.Application of syn-chronization to formation?ying spacecraft:lagrangian ap-proach.Journal of Guidance,Control,and Dynamics,2009, 32(2):512?526
54Pant A,Seiler P,Hedrick J K.Mesh stability of look-ahead interconnected systems.IEEE Transactions on Automatic Control,2002,47(2):403?407
55Egerstedt M,Hu X,Stotsky A.Control of mobile platforms using a virtual vehicle approach.IEEE Transactions on Au-tomatic Control,2001,46(11):1777?1782
56Lawton J R,Beard R W.Synchronized multiple spacecraft rotations.Automatica,2002,38(8):1359?1364
57Balch T,Arkin R C.Behavior-based formation control for multirobot teams.IEEE Transactions on Robotics and Au-tomation,1998,14(6):926?939
58Murray R M.Recent research in cooperative control of mul-tivehicle systems.Journal of Dynamic Systems,Measure-ment,and Control,2007,129(5):571?583
59Chen Yang-Yang,Tian Yu-Ping.Directed coordinated con-trol for multi-agent formation motion on a set of given curves.Acta Automatica Sinica,2009,35(12):1541?1549 (陈杨杨,田玉平.多智能体沿多条给定路径编队运动的有向协同控制.自动化学报,2009,35(12):1541?1549)
60Liu Xue-Liang,Xu Bu-Gong.Distributed H∞consensus control for multiple-agent systems with communication de-lays.Control and Decision,2012,27(4):494?500
(刘学良,胥布工.具有多个通信时延的多智能体系统分布式H∞一致性控制.控制与决策,2012,27(4):494?500)61Cao M,Morse A S,Anderson B D O.Reaching an agreement using delayed information.In:Proceedings of45th Con-ference on Decision and Control(CDC).San Diego,USA: IEEE,2006.3375?3380
62Xiao F,Wang L.Asynchronous consensus in continuous-time multi-agent systems with switching topology and time-varying delays.IEEE Transactions on Automatic Control, 2008,53(8):1804?1816
63Wang L,Xiao F.A new approach to consensus problems for discrete-time multiagent systems with time-delays.In: Proceedings of the2006American Control Conference.Min-neapolis,MN:IEEE,2006.2118?2123
64Yang W,Bertozzi A L,Wang X F.Stability of a second order consensus algorithm with time delay.In:Proceedings of the47th Conference on Decision and Control.Cancun, Mexico:IEEE,2008.2926?2931
65Lin P,Jia Y M.Consensus of a class of second-order multi-agent systems with time-delay and jointly-connected topolo-gies.IEEE Transactions on Automatic Control,2010,55(3): 778?784
66Zhu W,Cheng D Z.Leader-following consensus of second-order agents with multiple time-varying delays.Automatica, 2010,46(12):1994?1999
67Lin P,Jia Y M.Consensus of second-order discrete-time multi-agent systems with nonuniform time-delays and dy-namically changing topologies.Automatica,2009,45(9): 2154?2158
68Liu De-Lin,Liu Cheng-Lin.Consensus problem of discrete-time second-order multi-agent network with communication delay.Control Theory and Applications,2010,27(8):1108?1112
(刘德林,刘成林.具有通信时延的离散时间二阶多个体网络的一致性问题.控制理论与应用,2010,27(8):1108?1112)
69She Ying-Ying,Fang Hua-Jing.Fast consensus for multi-agent systems in directed networks.Control and Decision, 2010,25(7):1026?1030
(佘莹莹,方华京.基于有向网络的多智能体系统快速一致性.控制与决策,2010,25(7):1026?1030)
70Chopra N,Spong M W.Output synchronization of nonlinear systems with time delay in communication.In:Proceedings of the45th Conference on Decision and Control.San Diego, CA:IEEE,2008.4986?4992
71Byrnes C I,Isidori A,Willems J C.Passivity,feedback equivalence,and the global stabilization of minimum phase nonlinear systems.IEEE Transactions on Automatic Con-trol,1991,36(11):1228?1240
72Lohmiller W,Slotine J J E.Control system design for me-chanical systems using contraction theory.IEEE Transac-tions on Automatic Control,2000,45(5):984?989
73Wang W,Slotine J J E.Contraction analysis of time-delayed communications and group cooperation.IEEE Transactions on Automatic Control,2006,51(4):712?717
74Chopra N,Spong M W,Lozano R.Synchronization of bilat-eral teleoperators with time delay.Automatica,2008,44(8): 2142?2148
75Nu?n o E,Basa?n ez L,Ortega R.Adaptive control for the synchronization of multiple robot manipulators with cou-pling time-delays.In:Proceedings of the2010IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).Taipei,China:IEEE,2010.3308?3313
10期闵海波等:多个体协调控制问题综述1569
76Nu?n o E,Basa?n ez L,Ortega R,Spong M W.Position track-ing for non-linear teleoperators with variable time delay.The International Journal of Robotics Research,2009,28(7): 895?910
77Chung S J,Slotine J J E.Cooperative robot control and con-current synchronization of lagrangian systems.IEEE Trans-actions on Robotics,2009,25(3):686?700
78Xiao F,Wang L.State consensus for multi-agent systems with switching topologies and time-varying delays.Interna-tional Journal of Control,2006,79(10):1277?1284
79Bliman P A,Ferrari-Trecate G.Average consensus prob-lems in networks of agents with delayed communications.
Automatica,2008,44(8):1985?1995
80Wu J,Shi Y.Consensus in multi-agent systems with random delays governed by a Markov chain.Systems and Control Letters,2011,60(1):863?870
81Tian Y P,Liu C L.Consensus of multi-agent systems with diverse input and communication delays.IEEE Transactions on Automatic Control,2008,53(9):2122?2128
82M¨u nz U.Delay Robustness in Cooperative Control[Ph.D.
dissertation].Institut f¨u r Systemtheorie und Regelungstech-nik,Universit¨a t Stuttgart,Germany,2010
83Lin Z Y,Broucke M,Francis B.Local control strategies for groups of mobile autonomous agents.IEEE Transactions on Automatic Control,2004,49(4):622?629
84Hu J P,Feng G.Distributed tracking control of leader-follower multi-agent systems under noisy measurement.Au-tomatica,2010,46(2):1382?1387
85Tang G G,Guo L.Convergence of a class of multi-agent systems in probabilistic framework.In:Proceedings of the 46th Conference on Decision and Control.New Orleans,LA: IEEE,2007.318?323
86Cucker F,Smale S.Emergent behavior in?ocks.IEEE Transactions on Automatic Control,2007,52(5):852?862
87Zhang Y,Tian Y P.Consentability and protocol design of multi-agent systems with stochastic switching topology.Au-tomatica,2009,45(5):1195?1201
88Qin J H,Zheng W X,Gao H J.Consensus of multiple second-order vehicles with a time-varying reference signal under directed topology.Automatica,2011,47(2):1983?1991
89Cao Y C,Ren W.Distributed coordinated tracking with reduced interaction via a variable structure approach.IEEE Transactions on Automatic Control,2011,57(1):33?48 90Cao Y,Ren W,Chen F,Zong G.Finite-time consensus of multi-agent networks with inherent nonlinear dynamics under an undirected interaction graph.In:Proceedings of the2011American Control Conference.San Francisco,CA, USA:AACC,2011.4020?4025
91Min H,Sun F,Wang S,Li H.Distributed adaptive consen-sus algorithm for networked Euler-Lagrange systems.IET Control Theory and Application,2010,5(1):145?154
92Sun Y G,Wang L,Xie G M.Average consensus in networks of dynamic agents with switching topologies and multiple time-varying delays.Systems and Control Letters,2008, 57(2):175?183
93Hui Q,Haddad W M.Distributed nonlinear control algo-rithms for network consensus.Automatica,2008,44(9): 2375?2381
94Hong Y,Gao L,Cheng D,Hu J.Lyapunov-based approach to multiagent systems with switching jointly connected in-terconnection.IEEE Transactions on Automatic Control, 2007,52(5):943?948
95Lin P,Jia Y M.Multi-agent consensus with diverse time-delays and jointly-connected topologies.Automatica,2011, 47(4):848?856
96Fang L,Antsaklis P J.Asynchronous consensus protocols using nonlinear paracontractions theory.IEEE Transactions on Automatic Control,2008,53(10):2351?2355
97Cao M,Morse A S,Anderson B D O.Agreeing asyn-chronously.IEEE Transactions on Automatic Control,2008, 53(8):1826?1838
98Frommer A,Szyld D B.On asynchronous iterations.Jour-nal of Computational and Applied Mathematics,2000, 123(1?2):201?216
99Fang L,Antsaklis P J,Tzimas A.Asynchronous consensus protocols:preliminary results,simulations and open ques-tions.In:Proceedings of the44th Conference on Decision and Control,and the European Control Conference.Seville, Spain:IEEE,2005.2194?2199
100Liu Y,Passino K M,Polycarpou M M.Stability analysis of one-dimensional asynchronous swarms.IEEE Transactions on Automatic Control,2003,48(10):1848?1854
101Liu Y,Passino K M,Polycarpou M M.Stability analysis of m-dimensional asynchronous swarms with a?xed communi-cation topology.IEEE Transactions on Automatic Control, 2003,48(1):76?95
102Gazi V,Passino K M.Stability of a one-dimensional discrete-time asynchronous swarm.IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2005, 35(4):834?841
103Gazi V.Stability of an asynchronous swarm with time-dependent communication links.IEEE Transactions on Au-tomatic Control,2008,38(1):267?274
104Xiao F,Wang L.Asynchronous consensus in continuous-time multi-agent systems with switching topology and time-varying delays.IEEE Transactions Automatic Control, 2008,53(8):1804?1816
105Gao Y P,Wang L.Asynchronous consensus of agents with double-integrator dynamics.In:Proceedings of the Joint 48th Conference on Decision and Control and28th Chinese Control Conference.Shanghai,China:IEEE,2009.3691?3696
106Liu C,Liu F.Consensus problem of second-order multi-agent systems with input delay and communication delay.
In:Proceedings of the30th Chinese Control Conference.
Yantai,China:IEEE,2011.4747?4752
107Das A,Lewis F L.Cooperative adaptive control for synchro-nization of second-order systems with unknown nonlineari-ties.International Journal of Robust and Nonlinear Control, 2011,21(13):1509?1524
108Das A,Lewis F L.Distributed adaptive control for syn-chronization of unknown nonlinear networked systems.Au-tomatica,2011,46(12):2014?2021
1570自动化学报38卷
109Miyasato Y.Adaptive H∞formation control for Euler-Lagrange systems by utilizing neural network approxima-tors.In:Proceedings of the2011American Control Confer-ence.San Francisco,CA,USA:IEEE,2011.1753?1758 110Dong W J,Farrell J A.Decentralized cooperative control of multiple nonholonomic dynamic systems with uncertainty.
Automatica,2009,16(45):706?710
111Yang H Y,Zhang Z X,Zhang S.Consensus of mobile multi-ple agent systems with disturbance-observer-based control.
Control Theory and Applications,2010,27(12):1787?1792 112Mei J,Ren W,Ma G F.Distributed coordinated tracking with a dynamic leader for multiple Euler-Lagrange systems.
IEEE Transactions on Automatic Control,2011,56(6): 1415?1421
113Slotine J J,Li W P.Applied Nonlinear Control.New Jersey: Prentice Hall,1991
114Li P,Jia Y M.Consensus of a class of second-order multi-agent systems with time-delay and jointly-connected topolo-gies.IEEE Transactions on Automatic Control,2010,55(3): 778?784
115Chopra N,Spong M W,Lozano R.Synchronization of bilat-eral teleoperators with time delay.Automatica,2008,44(8): 2142?2148
116Spong M W,Chopra N.Synchronization of networked La-grangian systems.Lecture Notes in Control and Information Sciences,2007,366:47?59
117Kristiansen R,Nicklasson P J,Gravdahl J T.Space-craft coordination control in6DOF:integrator backstep-ping vs.passivity-based control.Automatica,2008,44(11): 2896?2901
118Yu H,Antsaklis P J.Passivity-Based Distributed Control of Networked Euler-Lagrange Systems with Nonholonomic Constraints.Technical Report of the ISIS Group at the Uni-versity of Notre Dame,USA,2009
119Yu H,Antsaklis P J.Passivity-based output synchroniza-tion of networked Euler-Lagrange systems subject to non-holonomic constraints.In:Proceedings of the2010Ameri-can Control Conference.Baltimore,MD:IEEE,2010.208?213
120Arcak M.Passivity as a design tool for group coordina-tion.IEEE Transactions on Automatic Control,2007,52(8): 1380?1390
121Ren W.Distributed leaderless consensus algorithms for net-worked Euler-Lagrange systems.International Journal of Control,2009,82(11):2137?2149
122Dong W J.On consensus algorithms of multiple uncertain mechanical systems with a reference trajectory.Automatica, 2011,47(9):2023?2028
123Nu?n o E,Ortega R,Basa?n ez L.An adaptive controller for nonlinear teleoperators.Automatica,2010,46(1):155?159 124Min H,Wang S,Sun F,Cao Z,Wang Y.Distributed six degree-of-freedom spacecraft formation control with possible switching topology.IET Control Theory and Application, 2011,5(9):1120?1130125Min H B,Wang S C,Sun F C,Gao Z J,Zhang J S.Decen-tralized adaptive attitude synchronization of spacecraft for-mation.System and Control letters,2012,61(1):238?246 126Lohmiller W,Slotine J J E.On contraction analysis for nonlinear systems.Automatica,1998,34(6):683?696
127Ballerini M,Cabibbo N,Candelier R,Cavagna A,Cisbani E,Giardina I,Lecomte V,Orlandi A,Parisi G,Procaccini A,Viale M,Zdravkovic V.Interaction ruling animal col-lective behavior depends on topological rather than metric distance:evidence from a?eld study.Proceedings of the Na-tional Academy of Sciences of the United States of America, 2008,105(4):1232?1237
闵海波博士,第二炮兵工程大学讲师.
主要研究方向为航天器编队,多智能体
协调控制.本文通信作者.
E-mail:haibo.min@https://www.wendangku.net/doc/0b12315927.html,
(MIN Hai-Bo Ph.D.,lecturer at
the Second Artillery Engineering Uni-
versity.His research interest covers
spacecraft formation and multi-agent coordination control.Corresponding author of this paper.)
刘源第二炮兵工程大学博士研究生.
主要研究方向为多智能体协调控制,航
天器姿态控制.
E-mail:craig wayne@https://www.wendangku.net/doc/0b12315927.html,
(LIU Yuan Ph.D.candidate at the
Second Artillery Engineering Univer-
sity.His research interest covers multi-
agent coordination control and space-craft attitude control.)
王仕成第二炮兵工程大学教授.主要
研究方向为导航、制导与控制,控制理论
与工程.
E-mail:wshcheng@https://www.wendangku.net/doc/0b12315927.html,
(W ANG Shi-Cheng Ph.D.,profes-
sor at the Second Artillery Engineering
University.His research interest covers
navigation,guidance and control,con-trol theory and engineering.)
孙富春清华大学计算机科学与技术系
教授.主要研究方向为智能控制与机器
人,模式识别与智能系统.
E-mail:fcsun@https://www.wendangku.net/doc/0b12315927.html,
(SUN Fu-Chun Ph.D.,professor in
the Department of Computer Science
and Technology,Tsinghua University.
His research interest covers intelligent control and robotics,pattern recognition and intelligent systems.)