ON THE CONVERGENCE OF POLICY ITERATION IN FINITE STATE UNDISCOUNTED MARKOV DECISION-PROCESSES - THE UNICHAIN CASE

被引：15

作者：

HORDIJK, A ^{[1
]}

PUTERMAN, ML ^{[1
]}

机构：

[1] UNIV BRITISH COLUMBIA,FAC COMMERCE & BUSINESS ADM,DIV MANAGEMENT SCI,VANCOUVER V6T 1Y8,BC,CANADA

来源：

MATHEMATICS OF OPERATIONS RESEARCH | 1987年 / 12卷 / 01期

关键词：

MATHEMATICAL PROGRAMMING;

D O I：

10.1287/moor.12.1.163

中图分类号：

C93 [管理学]; O22 [运筹学];

学科分类号：

070105 ; 12 ; 1201 ; 1202 ; 120202 ;

摘要：

We study the convergence of policy iteration for the undiscounted, finite state, discrete time Markov decision problem with compact action space and unichain transition structure. Using a 'Newton Method type' representation for policy iteration, we establish the existence of a solution to the optimality equation. We show that to find an average optimal policy, it is sufficient to solve the optimality equation on the recurrent set of the maximizing policy. Under the additional assumption of a unique maximizing policy at each stage of the policy iteration procedure, we show that the iterates are convergent and the resulting policy is Blackwell optimal.

引用

页码：163 / 176

页数：14

共 50 条

[11] DISCOUNTING, ERGODICITY AND CONVERGENCE FOR MARKOV DECISION-PROCESSES
MORTON, TE
WECKER, WE
MANAGEMENT SCIENCE, 1977, 23 (08) : 890 - 900
[12] FINITE-STATE APPROXIMATIONS FOR DENUMERABLE STATE DISCOUNTED MARKOV DECISION-PROCESSES
CAVAZOSCADENA, R
APPLIED MATHEMATICS AND OPTIMIZATION, 1986, 14 (01): : 1 - 26
[13] FINITE-STATE APPROXIMATIONS FOR DENUMERABLE MULTIDIMENSIONAL STATE DISCOUNTED MARKOV DECISION-PROCESSES
HERNANDEZLERMA, O
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1986, 113 (02) : 382 - 389
[14] A note on the convergence of policy iteration in Markov decision processes with compact action spaces
Golubin, AY
MATHEMATICS OF OPERATIONS RESEARCH, 2003, 28 (01) : 194 - 200
[15] DENUMERABLE STATE NONHOMOGENEOUS MARKOV DECISION-PROCESSES
BEAN, JC
SMITH, RL
LASSERRE, JB
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1990, 153 (01) : 64 - 77
[16] FINITE STATE APPROXIMATION ALGORITHMS FOR AVERAGE COST DENUMERABLE STATE MARKOV DECISION-PROCESSES
THOMAS, LC
STENGOS, D
OR SPEKTRUM, 1985, 7 (01) : 27 - 37
[17] FINITE STATE APPROXIMATIONS FOR DENUMERABLE-STATE INFINITE HORIZON CONTRACTED MARKOV DECISION-PROCESSES - POLICY SPACE METHOD
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1979, 72 (02) : 512 - 523
[18] MARKOV DECISION-PROCESSES
WHITE, CC
WHITE, DJ
EUROPEAN JOURNAL OF OPERATIONAL RESEARCH, 1989, 39 (01) : 1 - 16
[19] MARKOV DECISION-PROCESSES
SCHAL, M
STOCHASTIC PROCESSES AND THEIR APPLICATIONS, 1984, 17 (01) : 13 - 13
[20] Policy iteration type algorithms for recurrent state Markov decision processes
Patek, SD
COMPUTERS & OPERATIONS RESEARCH, 2004, 31 (14) : 2333 - 2347

← 1 2 3 4 5 →