自适应动态规划综述

被引：82

作者：

张化光 ^{[1
,2
]}

张欣 ^{[3
]}

罗艳红 ^{[1
]}

杨珺 ^{[1
]}

机构：

[1] 东北大学信息科学与工程学院

[2] 东北大学流程工业综合自动化国家重点实验室

[3] 中国石油大学(华东)信息与控制工程学院

来源：

自动化学报 | 2013年 / 39卷 / 04期

关键词：

自适应动态规划; 神经网络; 非线性系统; 稳定性;

D O I：

暂无

中图分类号：

TP13 [自动控制理论];

学科分类号：

0711 ; 071102 ; 0811 ; 081101 ; 081103 ;

摘要：

自适应动态规划(Adaptive dynamic programming,ADP)是最优控制领域新兴起的一种近似最优方法,是当前国际最优化领域的研究热点.ADP方法利用函数近似结构来近似哈密顿–雅可比–贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程的解,采用离线迭代或者在线更新的方法,来获得系统的近似最优控制策略,从而能够有效地解决非线性系统的优化控制问题.本文按照ADP的结构变化、算法的发展和应用三个方面介绍ADP方法.对目前ADP方法的研究成果加以总结,并对这一研究领域仍需解决的问题和未来的发展方向作了进一步的展望.

引用

页码：303 / 311

页数：9

共 15 条

[1] 非线性离散时间系统带ε误差限的自适应动态规划 [J].

林小峰 ;

张衡 ;

宋绍剑 ;

宋春宁 .

控制与决策, 2011, 26 (10) :1586-1590+1595

[2] 一种改进的近似动态规划方法及其在SVC的应用 [J].

孙健 ;

刘锋 ;

SI Jennie ;

郭文涛 ;

梅生伟 .

电机与控制学报, 2011, 15 (05) :95-102

[3]

基于自适应动态规划的一类带有时滞的离散时间非线性系统的最优控制策略(英文)[J]. 魏庆来,张化光,刘德荣,赵琰.自动化学报. 2010(01)

[4]

基于数据自适应评判的离散2-D系统零和博弈最优控制（英文）[J]. 魏庆来,张化光,崔黎黎.自动化学报. 2009(06)

[5]

基于自适应动态规划的城市交通信号优化控制方法综述[J]. 赵冬斌,刘德荣,易建强.自动化学报. 2009(06)

[6] 基于自适应评价的非线性系统神经网络控制 [J].

陈宗海 ;

文锋 ;

王智灵 .

控制与决策 , 2007, (07) :765-768+773

[7]

Multi-player non-zero-sum games: Online adaptive learning solution of coupled Hamilton–Jacobi equations[J] . Kyriakos G. Vamvoudakis,Frank L. Lewis.Automatica . 2011 (8)

[8]

Optimal control laws for time-delay systems with saturating actuators based on heuristic dynamic programming[J] . Ruizhuo Song,Huaguang Zhang,Yanhong Luo,Qinglai Wei.Neurocomputing . 2010 (16)

[9]

Online actor–critic algorithm to solve the continuous-time infinite horizon optimal control problem[J] . Kyriakos G. Vamvoudakis,Frank L. Lewis.Automatica . 2010 (5)

[10]

Optimal control of unknown affine nonlinear discrete-time systems using offline-trained neural networks with proof of convergence[J] . Travis Dierks,Balaje T. Thumati,S. Jagannathan.Neural Networks . 2009 (5)

← 1 2 →