A policy improvement method for constrained average Markov decision processes

Authors:
Hyeong Soo Chang
Affiliations:
Department of Computer Science and Engineering, Sogang University, Seoul, Korea
Venue:
Operations Research Letters
Year:
2007

Citing 4
Cited 1

Adaptive Markov Control Processes

Adaptive Markov Control Processes
Markov Decision Processes: Discrete Stochastic Dynamic Programming

Markov Decision Processes: Discrete Stochastic Dynamic Programming
Constrained Average Cost Markov Control Processes in Borel Spaces

SIAM Journal on Control and Optimization
Parallel Rollout for Online Solution of Partially Observable Markov Decision Processes

Discrete Event Dynamic Systems

Comments on: "A policy improvement method for constrained average Markov decision processes" [Oper. Res. Lett. 35 (2007) 434-438]

Operations Research Letters

Quantified Score

Hi-index	0.00

Visualization

Abstract

This brief paper presents a policy improvement method for constrained Markov decision processes (MDPs) with average cost criterion under an ergodicity assumption, extending Howard's policy improvement for MDPs. The improvement method induces a policy iteration-type algorithm that converges to a local optimal policy.