自动化学院本科生在Neurocomputing发表研究成果

文:胡江平 图:胡江平 / 来源:自动化学院 / 2020-07-14 / 点击量:2536

  近日,电子科技大学自动化工程学院2016级本科生张洁夫在胡江平教授的指导下,于《Neurocomputing》(JCR分区Q1期刊,影响因子4.438)发表题为“Internal reinforcement adaptive dynamic programming for optimal containment control of unknown continuous-time multi-agent systems”的研究成果。张洁夫为论文第一作者,胡江平教授为通讯作者,电子科技大学自动化工程学院为第一作者单位。

1.png

  多智能体系统(MAS)以其在电力系统、传感器网络、移动机器人系统等领域的应用,近年来受到了学界的广泛关注,而其中的MAS最优包含控制问题则是关注的热点之一。传统的最优包含控制算法需要求解复杂的偏微分方程,且高度依赖系统模型,这些缺点都限制了其在现实中的应用。自适应动态规划(ADP)算法的出现在一定程度上解决了上述问题,但收敛速度慢等缺点仍使其在应用方面具有较大局限性。

2.png

  为了解决上述问题,在该文中,作者对传统ADP算法进行了改进,提出了含有内部增强信号的ADP(IR-ADP)算法。传统ADP算法仅依靠预先定义的外部增强信号来提供信息,对于较复杂的系统而言无法保证算法的收敛速度。相比之下,文中提出的IR-ADP算法新增了内部增强信号,这一信号包含更丰富的信息,能够加速算法的收敛。相关的数学分析证明,该文提出的算法能够在保证系统稳定性的同时令系统各项指标收敛至最优值。为了避免使用系统模型,实现数据驱动,作者使用了神经网络来分别近似内部增强信号、值函数和控制策略。仿真表明,这一算法对于不同通信拓扑结构的多智能体连续时间系统都能保证较好的控制效果,且收敛速度优于传统ADP算法。


3.png

  《Neurocomputing》为Elsevier旗下期刊,主要关注神经网络与学习系统在计算机、控制、优化、机器视觉等领域的理论与应用,为中科院分区计算机科学的学科顶级期刊。

  张洁夫自大二起加入胡江平教授团队,开展多智能体系统控制方面的研究,曾参与多项科研项目,曾以第二作者身份在《Science China Information Science》期刊(JCR分区Q1期刊,影响因子3.304)发表论文。目前,张洁夫已在美国密西根大学攻读机器人学硕士学位。

 



编辑:助理编辑  / 审核:林坤  / 发布者:陈伟