自适应动态规划综述

被引:79
|
作者
张化光 [1 ,2 ]
张欣 [3 ]
罗艳红 [1 ]
杨珺 [1 ]
机构
[1] 东北大学信息科学与工程学院
[2] 东北大学流程工业综合自动化国家重点实验室
[3] 中国石油大学(华东)信息与控制工程学院
关键词
自适应动态规划; 神经网络; 非线性系统; 稳定性;
D O I
暂无
中图分类号
TP13 [自动控制理论];
学科分类号
摘要
自适应动态规划(Adaptive dynamic programming,ADP)是最优控制领域新兴起的一种近似最优方法,是当前国际最优化领域的研究热点.ADP方法利用函数近似结构来近似哈密顿–雅可比–贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程的解,采用离线迭代或者在线更新的方法,来获得系统的近似最优控制策略,从而能够有效地解决非线性系统的优化控制问题.本文按照ADP的结构变化、算法的发展和应用三个方面介绍ADP方法.对目前ADP方法的研究成果加以总结,并对这一研究领域仍需解决的问题和未来的发展方向作了进一步的展望.
引用
收藏
页码:303 / 311
页数:9
相关论文
共 15 条
  • [11] A single network adaptive critic (SNAC) architecture for optimal control synthesis for a class of nonlinear systems
    Padhi, Radhakant
    Unnikrishnan, Nishant
    Wang, Xiaohua
    Balakrishnan, S. N.
    [J]. NEURAL NETWORKS, 2006, 19 (10) : 1648 - 1660
  • [12] Nearly optimal control laws for nonlinear systems with saturating actuators using a neural network HJB approach
    Abu-Khalaf, M
    Lewis, FL
    [J]. AUTOMATICA, 2005, 41 (05) : 779 - 791
  • [13] A Distributed Approach for Coordination of Traffic Signal Agents[J] . Ana L. C. Bazzan.Autonomous Agents and Multi-Agent Systems . 2005 (1)
  • [14] Adaptive dynamic programming. Murray J J,Cox C J,Lendaris G G,Saeks R E. IEEE Transactions on Systems, Man, and Cybernetics, Part C:Applications and Reviews . 2002
  • [15] A heuristic- dynamic-programming-based power system stabilizer for a turbogenerator in a single-machine power system. Wenxin Liu,G K Venayagamoorthy,D C Wunsch. IEEE Transactions on Industry Applications . 2005