COMPUTATIONAL COMPARISON OF VALUE-ITERATION ALGORITHMS FOR DISCOUNTED MARKOV DECISION-PROCESSES

被引：8

作者：

THOMAS, LC

HARLEY, R

LAVERCOMBE, AC

机构：

[1] UNIV MANCHESTER,DEPT DECIS THEORY,MANCHESTER M13 9PL,LANCS,ENGLAND

[2] BRISTOL POLYTECH,DEPT MATH,BRISTOL,ENGLAND

来源：

OPERATIONS RESEARCH LETTERS | 1983年 / 2卷 / 02期

关键词：

D O I：

10.1016/0167-6377(83)90040-8

中图分类号：

C93 [管理学]; O22 [运筹学];

学科分类号：

070105 ; 12 ; 1201 ; 1202 ; 120202 ;

摘要：

引用

页码：72 / 76

页数：5

共 50 条

[21] MULTIOBJECTIVE DISCOUNTED MARKOV DECISION-PROCESSES WITH EXPECTATION AND VARIANCE CRITERIA
LIU, QS
OHNO, K
NAKAYAMA, H
INTERNATIONAL JOURNAL OF SYSTEMS SCIENCE, 1992, 23 (06) : 903 - 914
[22] MODIFIED POLICY ITERATION ALGORITHMS FOR DISCOUNTED MARKOV DECISION PROBLEMS
PUTERMAN, ML
SHIN, MC
MANAGEMENT SCIENCE, 1978, 24 (11) : 1127 - 1137
[23] An optimistic value iteration for mean-variance optimization in discounted Markov decision processes
Ma, Shuai
Ma, Xiaoteng
Xia, Li
RESULTS IN CONTROL AND OPTIMIZATION, 2022, 8
[24] VALUE-ITERATION AND ROLLING PLANS FOR MARKOV CONTROL PROCESSES WITH UNBOUNDED REWARDS
HERNANDEZLERMA, O
LASSERRE, JB
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 177 (01) : 38 - 55
[25] MARKOV DECISION-PROCESSES AND THE VALUE OF METEOROLOGICAL INFORMATION
KATZ, RW
MURPHY, AH
WINKLER, RL
BULLETIN OF THE AMERICAN METEOROLOGICAL SOCIETY, 1981, 62 (06) : 883 - 883
[26] The complexity of Policy Iteration is exponential for discounted Markov Decision Processes
Hollanders, Romain
Delvenne, Jean-Charles
Jungers, Raphael M.
2012 IEEE 51ST ANNUAL CONFERENCE ON DECISION AND CONTROL (CDC), 2012, : 5997 - 6002
[27] DISCOUNTED AND AVERAGE MARKOV DECISION-PROCESSES WITH UNBOUNDED REWARDS - NEW CONDITIONS
QI, YH
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1992, 171 (01) : 111 - 124
[28] NONSTATIONARY CONTINUOUS-TIME MARKOV DECISION-PROCESSES WITH DISCOUNTED CRITERION
HU, QY
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 180 (01) : 60 - 70
[29] A SECONDARY APPROACH TO THE DISCOUNTED MODEL IN SEMI-MARKOV DECISION-PROCESSES
DONG, ZQ
SONG, JS
KEXUE TONGBAO, 1988, 33 (06): : 448 - 454
[30] MARKOV DECISION-PROCESSES - DISCOUNTED EXPECTED REWARD OR AVERAGE EXPECTED REWARD
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 172 (02) : 375 - 384

← 1 2 3 4 5 →