Average criteria in denumerable semi-Markov decision chains under risk-aversion

被引：0

作者：

Cavazos-Cadena, Rolando ^{[1
]}

Cruz-Suarez, Hugo ^{[2
]}

Montes-De-Oca, Raul ^{[3
]}

机构：

[1] Univ Autonoma Agr Antonio Narro, Dept Estadist & Calculo, Blvd Antonio Narro 1923, Saltillo 25315, Coah, Mexico

[2] Benemerita Univ Autonoma Puebla, Fac Ciencias Fisicomatemat, Ave San Claudio & Rio Verde, Puebla 72570, Pue, Mexico

[3] Univ Autonoma Metropolitana Iztapalapa, Dept Matemat, Ave Ferrocaril San Rafael Atlixco 186,Col Leyes Re, Cdmx 09310, Mexico

来源：

DISCRETE EVENT DYNAMIC SYSTEMS-THEORY AND APPLICATIONS | 2023年 / 33卷 / 03期

关键词：

Exponential utility function; Certainty equivalent; Total relative cost; Verification theorem; Cost structure with bounded support; INFINITE-HORIZON RISK; SENSITIVE CONTROL; OPTIMALITY; COST; SYSTEM;

D O I：

10.1007/s10626-023-00376-w

中图分类号：

TP [自动化技术、计算机技术];

学科分类号：

0812 ;

摘要：

This note concerns with semi-Markov decision chains evolving on a denumerable state space. The system is directed by a risk-averse controller with constant risk-sensitivity, and the performance of a decision policy is measured by a long-run average criterion associated with bounded holding cost rates and one-step cost function. Under mild conditions on the sojourn times and the transition law, restrictions on the cost structure are given to ensure that the optimal average cost can be characterized via a bounded solution of the optimality equation. Such a result is used to establish a general characterization of the optimal average cost in terms of an optimality inequality from which an optimal stationary policy can be derived.

引用

页码：221 / 256

页数：36

共 50 条

[31] Average Reward Reinforcement Learning for Semi-Markov Decision Processes
Yang, Jiayuan
Li, Yanjie
Chen, Haoyao
Li, Jiangang
NEURAL INFORMATION PROCESSING, ICONIP 2017, PT I, 2017, 10634 : 768 - 777
[32] MULTIVARIATE DECISION-MAKING UNDER RISK-AVERSION
OLSON, LJ
JOURNAL OF ECONOMIC THEORY, 1990, 50 (01) : 193 - 203
[33] AVERAGE, SENSITIVE AND BLACKWELL OPTIMAL POLICIES IN DENUMERABLE MARKOV DECISION CHAINS WITH UNBOUNDED REWARDS
DEKKER, R
HORDIJK, A
MATHEMATICS OF OPERATIONS RESEARCH, 1988, 13 (03) : 395 - 420
[34] Correction to: Using Semi-Markov Chains to Solve Semi-Markov Processes
Bei Wu
Brenda Ivette Garcia Maya
Nikolaos Limnios
Methodology and Computing in Applied Probability, 2021, 23 (4) : 1433 - 1434
[35] COMPUTATION OF OPTIMAL POLICIES IN DISCOUNTED SEMI-MARKOV DECISION CHAINS
CANTALUPPI, L
OR SPEKTRUM, 1984, 6 (03) : 147 - 160
[36] SEMI-MARKOV REPLACEMENT CHAINS
GERONTIDIS, II
ADVANCES IN APPLIED PROBABILITY, 1994, 26 (03) : 728 - 755
[37] Risk Aversion in Finite Markov Decision Processes Using Total Cost Criteria and Average Value at Risk
Carpin, Stefano
Chow, Yin-Lam
Pavone, Marco
2016 IEEE INTERNATIONAL CONFERENCE ON ROBOTICS AND AUTOMATION (ICRA), 2016, : 335 - 342
[38] RISK-SENSITIVE SEMI-MARKOV DECISION PROCESSES WITH GENERAL UTILITIES AND MULTIPLE CRITERIA
Huang, Yonghui
Lian, Zhaotong
Guo, Xianping
ADVANCES IN APPLIED PROBABILITY, 2018, 50 (03) : 783 - 804
[39] CONTINUITY OF MEAN RECURRENCE TIMES IN DENUMERABLE SEMI-MARKOV PROCESSES
DEPPE, H
ZEITSCHRIFT FUR WAHRSCHEINLICHKEITSTHEORIE UND VERWANDTE GEBIETE, 1985, 69 (04): : 581 - 592
[40] Hidden hybrid Markov/semi-Markov chains
Guédon, Y
COMPUTATIONAL STATISTICS & DATA ANALYSIS, 2005, 49 (03) : 663 - 688

← 1 2 3 4 5 →