AVERAGE, SENSITIVE AND BLACKWELL OPTIMAL POLICIES IN DENUMERABLE MARKOV DECISION CHAINS WITH UNBOUNDED REWARDS

被引：34

作者：

DEKKER, R ^{[1
]}

HORDIJK, A ^{[1
]}

机构：

[1] STATE UNIV LEIDEN,INST APPL MATH & COMP SCI,2312 AV LEIDEN,NETHERLANDS

来源：

MATHEMATICS OF OPERATIONS RESEARCH | 1988年 / 13卷 / 03期

关键词：

D O I：

10.1287/moor.13.3.395

中图分类号：

C93 [管理学]; O22 [运筹学];

学科分类号：

070105 ; 12 ; 1201 ; 1202 ; 120202 ;

摘要：

引用

页码：395 / 420

页数：26

共 50 条

[31] Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains
Cavazos-Cadena, R
MATHEMATICAL METHODS OF OPERATIONS RESEARCH, 2002, 56 (02) : 181 - 196
[32] SAMPLE-PATH OPTIMAL STATIONARY POLICIES IN STABLE MARKOV DECISION CHAINS WITH THE AVERAGE REWARD CRITERION
Cavazos-Cadena, Rolando
Montes-De-Oca, Raul
Sladky, Karel
JOURNAL OF APPLIED PROBABILITY, 2015, 52 (02) : 419 - 440
[33] Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains
Rolando Cavazos-Cadena
Rolando Cavazos-Cadena
Mathematical Methods of Operations Research, 2002, 56 : 181 - 196
[34] SEMI-MARKOV DECISION PROCESSES WITH UNBOUNDED REWARDS
LIPPMAN, SA
MANAGEMENT SCIENCE SERIES A-THEORY, 1973, 19 (07): : 717 - 731
[35] Optimization of Average Rewards of Time Nonhomogeneous Markov Chains
Cao, Xi-Ren
IEEE TRANSACTIONS ON AUTOMATIC CONTROL, 2015, 60 (07) : 1841 - 1856
[36] Optimal policies for constrained average-cost Markov decision processes
Gonzalez-Hernandez, Juan
Villarreal, Cesar E.
TOP, 2011, 19 (01) : 107 - 120
[37] Optimal policies for constrained average-cost Markov decision processes
Juan González-Hernández
César E. Villarreal
TOP, 2011, 19 : 107 - 120
[38] Nonstationary denumerable state Markov decision processes - with average variance criterion
Guo, XP
MATHEMATICAL METHODS OF OPERATIONS RESEARCH, 1999, 49 (01) : 87 - 96
[39] Nonstationary denumerable state Markov decision processes – with average variance criterion
Xianping Guo
Mathematical Methods of Operations Research, 1999, 49 (1) : 87 - 96
[40] COMPUTATION OF OPTIMAL POLICIES IN DISCOUNTED SEMI-MARKOV DECISION CHAINS
CANTALUPPI, L
OR SPEKTRUM, 1984, 6 (03) : 147 - 160

← 1 2 3 4 5 →