自动化学院本科生在Neurocomputing发表研究成果电子科技大学成电新闻网

分享到微信 ×

打开微信“扫一扫”
即可将网页分享至朋友圈

自动化学院本科生在Neurocomputing发表研究成果

文：胡江平图：胡江平来源：自动化学院时间：2020-07-14 7832

　　近日，电子科技大学自动化工程学院2016级本科生张洁夫在胡江平教授的指导下，于《Neurocomputing》（JCR分区Q1期刊，影响因子4.438）发表题为“Internal reinforcement adaptive dynamic programming for optimal containment control of unknown continuous-time multi-agent systems”的研究成果。张洁夫为论文第一作者，胡江平教授为通讯作者，电子科技大学自动化工程学院为第一作者单位。

　　多智能体系统（MAS）以其在电力系统、传感器网络、移动机器人系统等领域的应用，近年来受到了学界的广泛关注，而其中的MAS最优包含控制问题则是关注的热点之一。传统的最优包含控制算法需要求解复杂的偏微分方程，且高度依赖系统模型，这些缺点都限制了其在现实中的应用。自适应动态规划（ADP）算法的出现在一定程度上解决了上述问题，但收敛速度慢等缺点仍使其在应用方面具有较大局限性。

　　为了解决上述问题，在该文中，作者对传统ADP算法进行了改进，提出了含有内部增强信号的ADP（IR-ADP）算法。传统ADP算法仅依靠预先定义的外部增强信号来提供信息，对于较复杂的系统而言无法保证算法的收敛速度。相比之下，文中提出的IR-ADP算法新增了内部增强信号，这一信号包含更丰富的信息，能够加速算法的收敛。相关的数学分析证明，该文提出的算法能够在保证系统稳定性的同时令系统各项指标收敛至最优值。为了避免使用系统模型，实现数据驱动，作者使用了神经网络来分别近似内部增强信号、值函数和控制策略。仿真表明，这一算法对于不同通信拓扑结构的多智能体连续时间系统都能保证较好的控制效果，且收敛速度优于传统ADP算法。