A policy iteration algorithm for zero-sum stochastic games with mean payoff - 15/02/08
pages | 6 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Abstract |
We give a policy iteration algorithm to solve zero-sum stochastic games with finite state and action spaces and perfect information, when the value is defined in terms of the mean payoff per turn. This algorithm does not require any irreducibility assumption on the Markov chains determined by the strategies of the players. It is based on a discrete nonlinear analogue of the notion of reduction of a super-harmonic function. To cite this article: J. Cochet-Terrasson, S. Gaubert, C. R. Acad. Sci. Paris, Ser. I 343 (2006).
Le texte complet de cet article est disponible en PDF.Résumé |
Nous donnons un algorithme dʼitération sur les politiques pour résoudre les jeux stochastiques à somme nulle, avec espaces dʼétat et dʼaction finis, en information parfaite, lorsque la valeur du jeu est définie en termes de gain moyen par tour. Cet algorithme ne demande pas que les chaînes de Markov déterminées par les stratégies des deux joueurs soient irréductibles. Il repose sur un analogue discret non-linéaire de la notion de réduite dʼune fonction surharmonique. Pour citer cet article : J. Cochet-Terrasson, S. Gaubert, C. R. Acad. Sci. Paris, Ser. I 343 (2006).
Le texte complet de cet article est disponible en PDF.Plan
Vol 343 - N° 5
P. 377-382 - septembre 2006 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?