16/02/2012

Théorie des jeux

John Von Neuman & Oskar Morgenstern[1] et John Nash[2] étudient l’interaction des prises de décisions rationnelles : pour jouer, il faut des joueurs, des stratégies et des gains associés à chaque issue du jeu. Chaque joueur connaît sa stratégie et ses gains ainsi que les stratégies possibles et les gains des autres.

C’est une théorie particulièrement utile pour les situations économiques où il n’y a pas beaucoup d’intervenants comme les oligopoles ou la politique monétaire.

Il existe une typologie des jeux :

-          les jeux statiques : ne concernent qu’un seul coup

-          les jeux répétés : plusieurs jeux successifs

-          les jeux en information parfaite

-          les jeux en information imparfaite

Le cas le plus simple vise le jeu statique en information parfaite, qui est associé à l’équilibre de Nash. Les autres cas sont des raffinements de cet équilibre.

 

 

 

Information parfaite

 

 

Information imparfaite

 

Jeu statique

 

 

Equilibre de Nash

 

Equilibre bayésien (Harsanyi)

 

Jeu répété

 

 

Equilibre de Nash parfait (Selten)

 

Equilibre bayésien parfait

 

I] Les jeux statiques

  • L’équilibre de Nash

Chaque joueur choisit une séquence de jeu qui constitue une meilleure réponse aux séquences de jeu des autres joueurs. Etant donné ce que font les autres, chaque joueur choisit sa meilleure réponse. Il faut savoir comment les autres se comportent.

La meilleure façon de trouver l’équilibre consiste à éliminer les stratégies dominées.

Le dilemme du prisonnier :

Deux joueurs, qui doivent se dénoncer ou ne pas se dénoncer.

 

                                 Joueur 2

 

Joueur 1

 

Dénonce

 

Ne dénonce pas

 

Dénonce

 

 

(-1 ; -1)

 

(1 ; -2)

 

Ne dénonce pas

 

 

(-2 ; 1)

 

(0 ; 0)

Les seules combinaisons stratégiques qui soient compatibles entre elles, c’est la dénonciation mutuelle. C’est un équilibre de Nash sous-optimal au sens de Pareto.

Au total chaque joueur perd 1. Ils ne coopèrent pas, car chacun a intérêt à dévier.

Les matching pennies :

Chaque joueur a une pièce et la lance, si les choix sont identiques A reçoit 1.

 

                                Joueur B

 

Joueur A

 

Pile

 

Face

 

Pile

 

 

(1 ; -1)

 

(-1 ; 1)

 

Face

 

 

(-1 ; 1)

 

(1 ; -1)

Dans ce jeu, il n’y a pas d’équilibre par élimination de stratégie dominée, en stratégie pure. Par contre, en stratégie mixte, il existe un équilibre quand les joueurs choisissent au hasard.

La bataille des sexes :

Madame et Monsieur sont contents s’ils sont ensemble

 

                               Monsieur

 

Madame

 

Opéra

 

Boxe

 

Opéra

 

 

(2; 1)

 

(0 ; 0)

 

Boxe

 

 

(0; 0)

 

(1 ; 2)

Ils ne vont pas négocier, ils annoncent : si Monsieur annonce l’opéra, Madame va suivre et réciproquement si Monsieur annonce la boxe.

On obtient ainsi deux équilibres de Nash : on sait qu’ils seront ensemble mais on ne sait pas où. Pour opérer une sélection, il peut y avoir une convention, c’est à dire une donnée extérieure aux gens.

Pour Schelling[3] on peut également se référer au point focal : les agents possèdent les données psychologiques et historiques qui leur permettent de choisir spontanément.

 

  • L’équilibre bayésien

Harsanyi[4] montre qu’un joueur a une information imparfaite quand il ne sait pas ce que les autres ont fait auparavant et qu’il a une information incomplète lorsqu’il ne connaît pas les caractéristiques précises de ses adversaires.

On peut transformer un jeu en information incomplète en jeu à information imparfaite, c’est la transformation (le passage) d’Harsanyi.

Dans le dilemme du prisonnier, l’information est imparfaite quand l’un des joueurs joue avant l’autre et que le second n’a pas observé ce qu’il a fait. De même, l’information est incomplète quand le premier ne sait pas qui a été arrêté en second.

C’est la nature qui va choisir les caractéristiques des joueurs au début du jeu. Ainsi on ne sait pas l’action qu’a choisie la nature.

Chaque joueur doit donc jouer en anticipant le type ou les actions de l’autre joueur.

L’équilibre bayésien correspond à la situation dans laquelle chacun va choisir la situation qui maximise son espérance de gain étant donné son type, ses croyances et les croyances et les stratégies des autres joueurs.

 

II] Les jeux répétés

  • L’équilibre de Nash parfait

C’est la version répétée de l’équilibre de Nash.

On va considérer que les joueurs vont répéter plusieurs fois le dilemme du prisonnier. A long terme, sous certaines conditions, les joueurs peuvent avoir intérêt à coopérer.

On parle d’ « équilibre parfait » pour un ensemble d’équilibres à chaque point du jeu avec élimination des stratégies non crédibles[5]. On ne prend en compte que les actions des autres allants dans leur propre intérêt.

Pour obtenir un équilibre parfait, on part de la fin du jeu et on remonte de l’aval vers l’amont : c’est de l’induction à rebours (« backward induction »).

On suppose que l’on va répéter n fois le dilemme du prisonnier : le jeu est fini. On remonte en éliminant les stratégies non crédibles.

Ex : en n ils se dénoncent ; en n-1 ils se dénoncent ; en n-2 ils se dénoncent et ainsi de suite jusqu’à 0.

Si le jeu est fini, il n’y a donc qu’un équilibre parfait : la dénonciation mutuelle.

Par contre, si l’horizon est infini, il n’y a pas de dernière période. Les joueurs ont donc intérêt à coopérer. De plus, il existe une menace crédible : ne plus jamais coopérer.

Dans ce cas, il y a équilibre de Nash parfait, tant que le taux d’actualisation n’est pas trop élevé ; ce qui signifie que le gain associé à la coopération est toujours plus fort que celui associé à la dénonciation. Si le gain pour le présent est élevé, on a intérêt à tricher aujourd’hui.

Il existe donc une infinité d’équilibres de Nash parfaits dans un jeu à horizon infini : c’est le « Folk theorem ».

Mais en général, les jeux sont finis. On peut donc dire que les jeux ne finissent pas à chaque période mais qu’il existe une probabilité de fin ou de continuation. Si la probabilité de continuer est élevée : l’horizon est infini.

Si on coopère tant que l’autre ne dévie, c’est un équilibre de « Trigger strategies ». Si l’autre dévie, on le dénonce à l’infini. Cela s’applique si le taux de préférence pour le présent n’est pas trop élevé.

Si une personne triche, il peut y avoir équilibre de non coopération pour une période puis retour à la coopération : c’est la stratégie de don contre don.

Plus on choisit la coopération, plus cela rapporte : c’est la stratégie d’équité.

De nombreuses stratégies sont donc possibles, mais on ne sait pas laquelle sera mise en place.

 

  • L’équilibre bayésien parfait

Il y a répétition du jeu en information imparfaite.

Or, en information imparfaite, à chaque action de l’autre joueur, on va pouvoir réviser ses croyances sur ce qu’il est. On utilise la règle de Bayes.

Un équilibre bayésien parfait est une combinaison de stratégies et un ensemble de croyances tels que les stratégies sont optimales étant donné les croyances. Celles-ci sont révisées selon un processus bayésien au vu des actions prises.

On va retrouver les équilibres parfaits bayésiens en politique monétaire où les agents ne connaissent pas le type du banquier central : ils vont l’inférer en fonction de ses actions. Ainsi, le banquier pourra essayer de manipuler par ses actions les croyances des agents.

De même, on utilise cette notion quand des agents vont opter pour des stratégies différentes et ainsi révéler leur type : c’est un équilibre séparateur. Alors que s’ils choisissent la même stratégie, c’est un équilibre de regroupement (« pooling »).

 


[1]VON NEUMANN, John & MORGENSTERN, Oskar : Theory of games and economic behavior, Princeton University Press, 1944

[2] NASH, John : The bargaining problem, Econometrica, 1950

[3] SCHELLING, Thomas : Stratégie du conflit, Puf, 1960

[4] HARSANYI, John : Games with incomplete information played by bayesian players, Management Science, 1967

[5] SELTEN, Reinhard : Reexamination of the perfectness concept for equilibrium points in extensive games, International Journal of Game Theory, 1975

 

18:39 Écrit par Guillaume ARNOULD dans Economie |  Facebook | | |

Les commentaires sont fermés.