1. Filière (DUT) : Développement Web et Multimédia-S1
Année Universitaire : de 2020 – 2022 au 2023 – 2024
Diaporamas du cours :
Théorie de graphe & théorie de jeux
Préparé par : Idriss CHANA
Enseignant chercheur au Département Génie Informatique, EST-UMI
Meknès Email : i.chana@umi.ac.ma
Au Profit des Etudiants de La Première Année de la filière DWM inscrits en
semestre S1
3. Plan de cours
• Définition de jeux, forme normale et extensive
• les jeux simultanés ( statiques informations imparfaites)
• les jeux séquentiels (dynamiques information parfaites)
• Résolution et équilibre du jeu:
- équilibre de Nash,
- le dilemme du prisonnier,
- Stratégie dominante,
- Jeu de la poule mouillée,
• Fonctions de meilleures réponses,
• jeu en stratégies pures et jeu en stratégies mixtes
4. • Un jeu se compose de :
– Un ensemble de joueurs.
– Un ensemble de stratégies/ Actions pour
chaque joueur.
– Des gains/ Play-off associés à chaque
stratégie des joueurs.
Qu’est ce qu’un jeu ?
6. Jeu à 2 joueurs avec 2 stratégies possibles
• Les joueurs s’appellent A et B.
• Le joueur A a deux stratégies : “up” ou “down”.
• Le joueur B a deux stratégies : “Left” ou “Right”.
• La matrice des gains est représentée comme suit :
Exemple
Joueur B
Joueur A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
7. Joueur B
Joueur A
Les gains du joueur A sont (ici, )
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
8. Joueur B
Joueur A
Les gains du joueur B sont ( , ici)
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
9. Exemple : Si A joue Up et B joue Right alors A gagne
1 et B gagne 8
Joueur B
Joueur A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
10. Joueur B
Joueur A
Une situation de jeu est une paire (ex : (U,R) ) où le premier
élément (U) est la stratégie choisie par le joueur A et le
deuxième élément (R) est la stratégie choisie par le joueur B
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
11. Quel est le résultat de ce jeu ?
Joueur B
Joueur A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
12. Joueur B
Joueur A
(U,R) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
13. Joueur B
Joueur A
Si B joue R (right)alors la meilleure réponse de A est D (down).
Ainsi les gains de A passeront de 1 à 2.
Donc (U,R) n’est pas possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
(U,R) est-il
un résultat
possible ?
14. Joueur B
Joueur A
(D,R) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
15. Joueur B
Joueur A
Si B joue R(right) alors la meilleure réponse de A est D(down).
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
(D,R) est-il
un résultat
possible ?
16. Joueur A
Si B joue Right alors la meilleure réponse de A est Down.
Si A joue Down alors la meilleure réponse de
B est Right. Donc, (D,R) est possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
(D,R) est-il
un résultat
possible ?
Théorie des jeux
Joueur B
17. Joueur B
Joueur A
(D,L) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
18. Joueur B
Joueur A
Si A joue D(down), la meilleure réponse de B est R, donc (D,L)
n’est pas possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
(D,L) est-il
un résultat
possible ?
Théorie des jeux
19. Joueur B
Joueur A
(U,L) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
20. Joueur B
Joueur A
Si A joue U(up), la meilleure réponse de B est L(left).
Si B joue L (left), la meilleure réponse de A est U(up).
Donc (U,L) est possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
(U,L) est-il
un résultat
possible ?
Théorie des jeux
21. Un jeu en forme normale est décrit comme suit:
1. Un ensemble de N joueurs, J ≡ {1,2,…,N}
2. Chaque joueur i, i J a un ensemble d’actions ( Strategies) Ai qui
est l’ensemble de toutes les actions possibles pour i. Soit ai Ai, une
action ( Strategie ) particulière de Ai. On appelle ai un résultat du jeu
3. Chaque joueur a une fonction de payoff, Πi qui assigne un nombre
réel Πi(a), à chaque action du joueur i.
Théorie des jeux: notation
Joueur B
Joueur
A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
1) J= {Joueur A, Joueur B}
2) S1 = S Joueur A= {U, D}; S2= S Joueur B= {L,R}
3) Π1 (U)= 3 ou 1 Π1 (D)= 0 ou 2
Π2 (L)= 9 ou 0 Π2 (R)= 8 ou 1
22. Théorie des jeux : Exercice 1
Dilemme du prisonnier
Enoncé:
Deux suspects Ali et Fahd sont arrêtés par la police, mais la police manque de
preuve pour les emprisonner. La police doit les faire avouer:
Si les deux avouent, ils auront chacun 4 ans de prison
si l’un avoue et l’autre nie,
Celui qui a avoué encourera 1 an de prison
L’aute qui a nié encourera 10 ans de prison
si les deux nient, ils auront chacun 2 ans de prison
Questions :
1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions)
2) Représenter le jeu sous forme normale
3) Jouer le jeu: Qu’il sera le résultat de ce jeu ( nombre d’années de prison )?, Peut
on l’améliorer ? Comment ?
23. Fahd
avoue nie
Ali
avoue (4;4) (1;10)
nie (10;1) (2;2)
1) L’ensemble de joueurs J ={ Ali, Fahd}
L’ensemble de Stratégies ( Actions) A1 = A2 ={avoue, nie}
2) La forme normale de ce jeu est :
Solution
3) Le résultat de jeu est (avoue,avoue) (4,4) ,
oui on peut l’améliorer si les deux prisonniers coopèrent
Théorie des jeux : Exercice 1
Dilemme du prisonnier
25. On parle de jeu à information parfaite dans le cas de jeu sous forme extensive, où
chaque joueur a une connaissance parfaite de toute l'histoire du jeu.: On dit alors
qu'un jeu est à information complète si chaque joueur connaît lors de la prise de
décision :
• Ses possibilités d'action
• Les possibilités d'action des autres joueurs
• Les gains résultants de ces actions
Un jeu à information incomplète est aussi à information imparfaite
- Les échecs sont à information complète et parfaite
- Le jeu de Poker : est à information incomplète et imparfaite
Information parfaite ( jeu séquentiel)
Théorie des jeux: Information
parfaite/imparfaite
26. Forme extensive : est un arbre (graphe connexe sans cycle) représentant
les déroulements possibles du jeu.:
à chaque Sommet non terminal est associé un joueur : arrivé à ce point du
jeu c'est à son tour de jouer.
Chaque arc représente chacune des actions (coups autorisés par la règle)
que ce joueur peut prendre à ce point du jeu.
à chaque sommet terminal correspond un résultat du jeu donné par vecteur
des paiements (liste des gains attribués à chaque joueur).
Théorie des jeux: Forme extensive
Définition
28. Bihi
Ali
U D U D
(3;9)
L R
(0;0) (1;8) (2;1)
Théorie des jeux: Forme extensive
A et B jouent en même temps
Le trait …… Signifie que le jeu est simultané : c’est à dire Ali ne connait pas
l’action de Bihi
Bihi
Ali
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
B
A1
U
D U D
(3;9)
L R
(0;0) (1;8) (2;1)
A joue après B
Si le jeu est séquentiel et Ali connait l’action de
Bihi. la forme extensive du jeu sera comme
suit:
A2
Représentation Graphique : Exemples Trait signifiant
que le jeu est
simultané
29. • Enoncé : Il s’agit d’ un jeu entre deux enfants Ali et leila, les deux choisissent un
objet parmi les 3 suivant : papier, ciseau et caillou. Selon ces choix, soit l’enfant
gagne le jeu soit il n y a pas de gagnant( s’ils choisissent le même objet) .
• Papier gagne contre caillou , ciseau gagne contre papier et caillou gagne
contre ciseau. Soit 2 le gain de l’enfant qui gagne, 0 le gain de celui qui perd et
1 le gain en cas d égalité.
Questions :
1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions) de chaque joueur.
2) Représenter le jeu simultané en forme normale
3) Représenter le jeu simultané en forme extensive
4) Même question que (3) si Ali triche et observe le choix de Leila avant de jouer
5) Même question que (3) si Ali n’ observe le choix de Leila que s’elle choisit caillou
Théorie des jeux: Forme extensive
papier, ciseau et caillou
Exercice 2
30. Théorie des jeux: Forme extensive
Exercice 2
papier, ciseau et caillou
Solution
32. Les étapes de résolutions d’un jeu sont comme suit
1. Identifier les décisions de A
Meilleure décision de A, compte tenu des décisions de B1
Meilleure décision de A, compte tenu des décisions B2,
Etc ….
2. Identifier les décisions de B
Meilleure décision de B, compte des décisions A1
Meilleure décision de B, compte des décisions A2,
etc…
3. On caractérise la solution du jeu, si elle existe
Résolution d’un jeu et Equilibre
33. Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
Exemple de Résolution d’un jeu (1/5)
1. Seules les décisions
de A sont prises en
compte
2. Seules les décisions
de A sont retenues si B
choisit Qd
3. On retient la décision
qui génère le plus gros
gain
*
Résolution d’un jeu et Equilibre
34. Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Seules les décisions
de A sont prises en
compte
2. Seules les décisions
de A sont retenues si B
choisit Qe
3. On retient la décision
qui génère le plus gros
gain (*)
*
*
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (2/5)
35. Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Seules les décisions
de B sont prises en
compte
2. Seules les décisions
de B sont retenues si A
choisit Qd
3. On retient la décision
qui génère le plus gros
gain (*)
*
* *
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (3/5)
36. Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Seules les décisions
de B sont prises en
compte
2. Seules les décisions
de B sont retenues si A
choisit Qe
3. On retient la décision
qui génère le plus gros
gain(*)
*
* *
*
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (4/5)
37. Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Un jeu a un équilibre
quand il génère une
convergence des
décisions stratégiques
2. Le couple de stratégies
(Qd;Qd) est la solution
du jeu
*
* *
*
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (5/5)
38. Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
Soient les deux société de l’aéronautique Boeing et Airbus qui décide de
Produire ou de Ne pas produire avec des play-off décrits selon un jeu
dont la forme normale est la suivante:
Résolution d’un jeu et Equilibre :
Exercice 3
Faites la résolution de ce jeu et trouver son équilibre
39. Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Boeing sont prises
en compte
2. Seules les décisions
de Boeing sont
retenues si Airbus
choisit de produire
3. On retient la décision
qui génère le plus gros
gain
*
Résolution d’un jeu et Equilibre :
solution (1/5)
40. Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Boeing sont prises
en compte
2. Seules les décisions
de Boeing sont
retenues si Airbus
chosit de ne pas
produire
3. On retient la décision
qui génère le plus gros
gain
*
*
Résolution d’un jeu et Equilibre :
solution (2/5)
41. Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Airbus sont prises
en compte
2. Seules les décisions
de Airbus sont
retenues si Boeing
choisit de produire
3. On retient la décision
qui génère le plus gros
gain
*
*
*
Résolution d’un jeu et Equilibre :
solution (3/5)
42. Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Airbus sont prises
en compte
2. Seules les décisions
de Airbus sont
retenues si Boeing
choisit de ne pas
produire
3. On retient la décision
qui génère le plus gros
gain
*
*
*
*
Résolution d’un jeu et Equilibre :
solution (4/5)
43. Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
Ce jeu a deux équilibres
(convergence des
décisions stratégiques)
Le couple de tratégies
(P;NP) est le premier
équilibre du jeu
Le couple de stratégies
(NP;P) est le deuxième
équilibre du jeu.
*
*
*
*
Résolution d’un jeu et Equilibre :
solution (5/5)
44. Joueur 2
S1 S2
Joueur 1
S1 (0,10) (10,0)
S2 (10,0) (0,10)
Exemple de jeu sans équilibre
Faites la résolution de ce jeu et trouver son équilibre
1/2
45. Joueur 2
S1 S2
Joueur 1
S1 (0,10) (10,0)
S2 (10,0) (0,10)
Exemple de jeu sans équilibre
*
*
*
*
2/2
Puisque il n y a pas de convergence de stratégie, ce jeu est un
jeu sans équilibre
47. Notations
Stratégie Dominante/ Dominée, EISD et équilibre du Nash
Un jeu en forme normale est décrit comme suit :
Un ensemble de N joueurs, J ≡ {1,2,…,N}
Chaque joueur J a un ensemble m de Stratégies SJ = {sJ1,sJ2, ..sJm}
Chaque joueur J a une fonction de payoff(gain), ΠJ qui assigne un
nombre réel ΠJ(SJ), à chaque action du joueur J.
soient :
- si un profil de stratégies {s1,…..sn} / qlq soit i, si ∊à Si
- s-i ( s indice –i ) le profil de stratégies autres que celles du joueur J :
s-i = {s1,……Si-1,Si+1, ……sN} ( N est le nombre de joueur)
On note S l’espace des stratégies ie : S = S1xS2x ……xSN
48. Principe
Une stratégie n’est jamais jouée si une autre assure
un gain meilleure dans tous les cas
X Y
U (5 ,3) (4,2)
V (3,6) (7, 1)
J2
J1
Stratégie
dominée
de J2
Stratégie
dominante
de J2
Π2 (U , X ) > Π2 (U,Y )
Π2 (V , X ) > Π2 (V,Y )
Stratégie dominée/dominante
Incomparables: Pas de
stratégie dominante ni
Dominée pour J1
Π1 (U , X ) > Π1 (V,X )
Π1 (U, Y ) < Π1 (V,Y )
J2
J1
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Définition:
Une stratégie sd est (strictement) dominée :
pour le joueur J, s il existe une stratégie si telle que pour
tous les gains générés par les stratégies autre que sd ( qu
on note par s-i ) on a :
ΠJ (si , s-i ) > ΠJ (sd , s-i )
• Une stratégie sf est faiblement dominée
pour le joueur i s il existe une stratégie s’i telle que pour tous
les gains correspondant à s-i on a
ΠJ (si , s-i ) ≥ ΠJ (sd , s-i ) ( sup. ou égal)
49. Equilibre en Stratégie dominante
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Player 1
u v
x 4,2 3,6
y 2,5 1,8
Player 2
s
3,1
3,0
z 8,1 4,2 6,0
Π2 (x,v ) > Π2 (x,u ) Π2 (x ,v ) > Π2 (x,s )
Π2 (y , v ) > Π2 (y,u ) Π2 (y , v ) > Π2 (y,s)
Π1 (z , u ) > Π1 (y, u)
Player 1
Player 2
Π1 (z , u ) > Π1 (x,u )
Π2 (z , v ) > Π2 (z,u) Π2 (z , v ) > Π2 (z,s)
Π1 (z , v ) > Π1 (y, v) Π1 (z , v ) > Π1 (x,v )
Π1 (z , s ) > Π1 (y, s) Π1 (z , s ) > Π1 (x,s )
% U de Player 2
% X de Player 1
% S de Player 2
% V de Player 2
% Y de Player 1
% Z de Player 1
La stratégie Z domine
pour Player1
La stratégie V domine
pour Player 2
4,2
L’équilibre en Stratégie Dominante existe et vaut ( z,v)
avec une utilité de (4,2)
% = par rapport à
50. Joueur 2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
51. Introduction a
`la The´orie des Jeux – p.20/77
Joueur 2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
52. Joueur 2
Joueur 1
u v
x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
53. Joueur 2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Une stratégie si est (strictement) dominée pour le
joueur i si il existe une stratégie si
J
telle que pour
tous les profils s−i
Π i (si
J
, s−i ) > Π i (si , s−i ) --( > strict. Sup)
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
54. Joueur
2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Une stratégie si est faiblement dominée pour le
joueur i si il existe une stratégie si
J
telle que pour
tous les profils s−i
Π i (si
J
, s−i ) ≥ Π i (si , s−i ) -- (≥ Sup. ou egal)
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
55. Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
56. Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
57. Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
58. Introduction a
`la The´orie des Jeux – p.21/77
Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
59. Joueur 2
Joueur 1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,3
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
60. Un jeu est dit résolvable par élimination itérative des stratégies dominées, si on
obtient un unique profil en éliminant successivement des stratégies (strictement)
dominées.
Les profils obtenus aprés élimination itérative des stratégies (strictement)
dominées (EISSD) ne dépendent pas de l’ordre choisi pour l’élimination des
stratégies.
Par contre, on peut obtenir des profils différents lorsque l’on choisit des ordres
différents pour l’élimination itérative de stratégies faiblement dominées (EISFD).
Les résultats obtenus par EISSD sont donc plus robustes que ceux obtenus
par EISFD.
Problème majeur de cette méthode: tous les jeux ne sont pas résolvable par EISD !
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
61. Exercices :: Pour les 3 jeux sous forme normale ci-dessous
1) Y a t il un équilibre en stratégie dominante
2) Existe-t-il un équilibre en EISD ( Elimination Itérative de Stratégie Dominées )
X Y Z
X 3 , 6 5,7 4,5
Y 5 ,1 6,2 6,1
Z 6 , 0 8,9 3,6
Joueur B
Jeu 1
Dilemme de prisonniers
St Y
bas Haut
St X
bas 40,30 45,10
Haut 20,60 50,50
Jeu 2
2 sociétés
Jeu 3
Joueur
A
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
62. Fahd
avoue nie
Ali
avoue (-4;-4) (-1;-10)
nie (-10;-1) (-2;-2)
1) Vérifions qu’il y a un équilibre en stratégie dominante
Donc avoue est une stratégie dominante pour Ali
Pour Ali (Πali(avoue , avoue ) > Πali(nie , avoue )
et (Πali(avoue , nie ) > Πali(nie , nie )
Pour Fahd (Πfahd(avoue , nie ) > Πfahd(nie , nie )
et (Πfahd(avoue , avoue ) > Πfahd(nie , avoue )
Donc avoue est une stratégie dominante pour Fahd
Résultat , il y a un équilibre en
stratégie dominante ( avoue,avoue)
Jeu1: Dilemme de prisonniers
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Correction
63. Fahd
avoue nie
Ali
avoue (-4;-4) (-1;-10)
nie (-10;-1) (-2;-2)
2) Vérifions qu’il y a un équilibre par EISSD
Donc nie est une stratégie dominée pour Ali
Pour Ali (Πali(nie , nie ) < Πali(avoue , nie )
et Πali(nie , avoue ) < (Πali(avoue , avoue )
Pour Fahd ( Πfahd(nie , nie ) < Πfahd(avoue , nie )
et (Πfahd(nie , avoue ) < Πfahd(avoue , avoue )
Donc nie est une stratégie dominée pour Fahd
Résultat , il y a un équilibre en
EISSD ( avoue,avoue)
Jeux Dilemme de prisonniers
Remarque : un équilibre en Stratégie Dominante est un Equilibre en EISSD,
l’inverse n’est pas vrai
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
64. 1) Vérifions qu’il y a un équilibre en stratégie dominante
Alors : Les deux stratégies sont incomparable
il n y a pas une stratégie dominante pour Stx
Pour St X (Πstx(bas , bas) =40) > ( Πstx(haut , bas ) =20)
et (Πstx(bas , haut ) = 45 ) < ( Πstx(haut , haut)=50 )
Pour St y (Πsty(bas , bas ) =30) > (Πsty(haut , bas )=10)
et (Πsty (bas, haut)=60) > Πsty(haut , bas ) = 50)
Donc bas est une stratégie dominante pour Sty
Résultat , il y a pas d équilibre en
stratégie dominante pour ce jeu
Jeu 2 : 2 sociétés
St Y
bas Haut
St X
bas 40,30 45,10
Haut 20,60 50,50
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
65. 2) Vérifions qu’il y a un équilibre en EISSD
Donc Haut est strictement dominée par bas pour Stx
Pour St X (( Πstx(haut , bas ) =20 < Πstx(bas , bas) =40) )
Rationalité St Y ne jouera jamais Haut
Pour St y ((Πsty(haut , bas )=10) < Πsty(bas , bas ) =30)
et (Πsty(haut , bas ) = 50) < Πsty (bas, haut)=60)
Donc haut est une stratégie dominée pour St Y
Résultat : l’ équilibre par EISD pour ce jeu est
( bas, bas )
St Y
bas Haut
St X
bas 40,30 45,10
Haut 20,60 50,50
Jeu 2 : 2 sociétés
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
66. 1) Vérifions qu’il y a un équilibre en stratégie dominante
Pour A (ΠA(X , X) =3) < ( ΠA(Y , X ) =20 ) < ΠA(Z , X ) =6 )
et (ΠA(X , Z) =4) > ( ΠA(Z , Z ) =3 ))
X Y Z
X 3 , 6 5,7 4,5
Y 5 ,1 6,2 6,1
Z 6 , 0 8,9 3,6
Joueur B
Joueur
A
Incomparable donc il n y a pas d équilibre en stratégie dominante
2) Vérifions qu’il y a un équilibre en EISSD
Jeu 3 :
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
67. J A: 5>3 , 6>5 6 > 4 donc la
stratégie X est dominée par Y pour
le joueur A
J B: 2>1 9 > 6 donc la stratégie Z est dominée par Y pour le joueur B
J A: 6>5 , 8>6 donc la stratégie Y
est dominée par Z pour le joueur A
J B: 9>0 donc la stratégie X est
dominée par Y pour le joueur B Résultat : Existance de l
Equilibre en EISSD (z,y)
2) Vérifions qu’il y a un équilibre en EISSD
Jeu 3 :
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
68. • Une situation ( Profil) du jeu où chaque stratégie
est la meilleure réponse à l’autre est un équilibre
de Nash.
• L’équilibre de Nash est une situation où aucun
joueur ne peut améliorer sa situation en changeant
unilatéralement de stratégie, compte tenu des
décisions de l’autre joueur
Équilibre de Nash
69. u v w
x 3,0 0,3 0,4
y 2,0 1,2 2,0
z 0,3 0,2 3,0
Introduction a
`la The´orie des Jeux – p.23/77
Joueur 2
Joueur 1
(Y,V) est un equilibre de Nash
Équilibre de Nash
70. u v w
x 3,0 0,3 0,4
y 2,0 1,2 2,0
z 0,3 0,2 3,0
Introduction a
`la The´orie des Jeux – p.23/77
Joueur 2
Joueur 1
Rappel : l’équilibre de Nash est une situation telle qu’aucun joueur
n’a pas intérêt à dévier (seul) de la situation obtenue.
Un équilibre de Nash est un profil de stratégies s∗
= { s∗
1 , . . . , s∗
n }
tel que pour tout joueur i, pour toute stratégie sJ
∈ Si :
Πi (s*i , s*-i ) ≥ Πi (sJ,s*-i )
Équilibre de Nash
(Y,V) est un équilibre de Nash
71. Un profil (unique) obtenu par élimination itérative de stratégies
(strictement) dominées (EISSD) est un équilibre de Nash (et c’est le
seul équilibre du jeu).
Un jeu (en stratégies pures) peut avoir plusieurs équilibres de
Nash, comme il peut aussi n’en avoir aucun !
Deux équilibres de Nash s∗
et sJ∗
sont équivalents si ils donnent la
même utilité à tous les joueurs, i.e.
pour tout i ∈ N Πi (s∗
) = Πi (sJ∗
).
Propriétés
Équilibre de Nash
Question: comment choisir un équilibre particulier lorsqu’il y en a plusieurs ?
72. Joueur B
Joueur A
(U,L) et (D,R) sont deux “équilibres de Nash” pour ce jeu
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Équilibre de Nash
Exemple 1
73. joueur B
joueur A
(U,L) et (D,R) sont des équilibres de Nash pour ce jeu. Mais,
lequel va apparaître ?
Nous remarquons que (U,L) est préféré à (D,R) par les deux
joueurs. Pour autant est-ce que (U,L) va apparaître ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Équilibre de Nash
Exemple 1 ( suite)
74. deux approches pour déterminer laquelle de ces stratégies équilibrées est la plus
plausible :
1. La stabilité : Les joueurs peuvent opter pour l'équilibre de Nash qui
semble le plus stable, c'est-à-dire celui où aucune des parties n'a une forte
incitation à dévier de sa stratégie.
2. La convention : Les joueurs peuvent convenir à l'avance d'une stratégie
particulière en cas de multiples équilibres de Nash. Cette approche peut découler
de négociations, d'accords ou de règles établies à l'avance pour résoudre les
situations d'équilibre multiple.
Équilibre de Nash
Réponse : Lorsqu'un jeu contient deux équilibres de Nash ou plus , on parle
d'équilibre multiple les joueurs peuvent avoir plusieurs stratégies optimales,
75. l’exemple de Duopole:
Matrice des
gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
Un joueur peut-il seul
améliorer sa position ?
L’entreprise A ?
L’entreprise B ?
Puisque aucun joueur
ne peut améliorer sa
situation, il s’agit d’un
équilibre de Nash
Équilibre de Nash
Exemple 2
76. Efficacité de l’équilibre
L’exemple de Duopole:
Matrice des
gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
L’équilibre de Nash est
«Qd-Qd» mais n’est pas
collectif
Si le nombre d’agents est
restreint, la rationalité
individuelle n’amène pas
forcement au bien être
collectif
l’ optimal est:
Exemple 2 ( suite)
77. L’exemple de Duopole:
Matrice des
gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
Remarquons que puisque
les gains en cas d’entente
sont supérieurs au gains
sans entente, il s’agit d’un
jeu de coordination.
Un jeu de coordination est
un jeu où les paiements
(gains) sont plus élevés
quand les joueurs peuvent
coordonner leurs stratégies.
Efficacité de l’équilibre
Exemple 2 ( suite)
78. Ce Jeu a t- il l’ Equilibre de Nash ?
A
B
(6,6) (1,10)
(10,1) (-20,-20)
Coopère
Trahit
Coopère Trahit
Le jeu de la poule mouillée
Oui : 2 Equilibres de Nash :
La stratégie dominante
Exercice
(Coopère, Trahir) avec un gain de (10,1) ou (Trahir, Coopère) avec un gain (1,10)
- Dans ces deux équilibres de Nash, toujours un joueur se trouve défavorisé
devant l’autre mais si on choisit tous les deux (Coopère, Coopère) après discussion
et coordination, même si ce n’est pas un équilibre de Nash on peut optimiser nos
gain collectifs.
80. • Dans nos deux exemples, les joueurs
jouaient simultanément.
• Il existe des jeux où les joueurs jouent l’un
après l’autre : jeux séquentiels.
• Le joueur qui joue en premier est le
leader, celui qui joue en deuxième est le
follower.
Jeu séquentiel: Rappel
81. • Parfois, un jeu a plusieurs équilibres de
Nash et il est difficile de savoir lequel va
sortir du jeu…
• En revanche, quand un jeu est séquentiel,
il est possible de dire quel équilibre de
Nash va sortir du jeu.
Exemple
82. joueur B
joueur A
(U,L) et (D,R) sont deux équilibres de Nash
quand le jeu est simultané. Et, il est
impossible de savoir quel équilibre va arriver.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
83. joueur B
joueur A
Supposons maintenant que le jeu est
séquentiel : A est le leader et B le follower.
Nous pouvons réécrire ce jeu sous sa forme
extensive…
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
84. U D
L L
R R
(3,9) (1,8) (0,0) (2,1)
A
B B
A jour en premier
B jour en second
Théorie des jeux
85. U D
L L
R R
(3,9) (1,8) (0,0) (2,1)
A
B B
(U,L) est un équilibre de Nash
(D,R) est un équilibre de Nash
Quel est celui qui va sortir du jeu?
Théorie des jeux
86. U D
L L
R R
(3,9) (1,8) (0,0) (2,1)
A
B B
Si A joue U alors B joue L; A gagne 3.
Si A joue D alors B joue R; A gagne 2.
Donc (U,L) est l’équilibre de Nash qui sortira
Théorie des jeux
88. La fonction de meilleure réponse du joueur i est la fonction Bi
qui associe à chaque combinaison de stratégies des autres
joueurs s−i les stratégies du joueur i qui maximise son utilité:
Un équilibre de Nash est un profil s∗
tel que la stratégie du
joueur i est une meilleure réponse:
fonction de meilleure réponse
Équilibre de Nash
S*i ∈ Bi (s*−i ) pour tout i ∈ N
Bi (s−i ) = {si ∈ Si t.q. Πi (si , s−i ) ≥ Πi (sJ
i , s−i )
pour tout sJ
i ∈ Si }
89. • Soit un jeu 2×2; i.e., un jeu avec deux joueurs A et B, qui ont
chacun deux actions possibles
• A peut choisir entre deux actions : aA
1 et aA
2
• B peut choisir entre deux actions aB
1 et aB
2
• Il y a 4 paires d’action possibles
(aA
1, aB
1), (aA
1, aB
2), (aA
2, aB
1), (aA
2, aB
2)
• Chaque paire d’action donnera des gains différents aux joueurs
Fonction de meilleure réponse
Équilibre de Nash
A
aA
1 (6 ,4)
(4 , 3)
(3 , 5)
(5, 7)
aA
2
B
aB
1 aB
2
90. • Supposons que les gains des joueurs A et B quand ils
choisissent respectivement les actions aA
1 et aB
1 sont :
ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
• De manière similaire, supposons que :
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Fonction de meilleure réponse
Équilibre de Nash
91. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Si B choisit l’action aB
1, quelle est la meilleure réponse de
A ?
Fonction de meilleure réponse
Équilibre de Nash
92. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Si B choisit l’action aB
1, quelle est la meilleure réponse de
A ?
Fonction de meilleure réponse
Équilibre de Nash
93. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si B choisit l’action aB
1, quelle est la meilleure
réponse de A est aA
1 (car 6 > 4)
Fonction de meilleure réponse
Équilibre de Nash
94. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si B choisit l’action aB
1, la meilleure réponse de A
est aA
1 (car 6 > 4)
• Si B choisit l’action aB
2, quelle est la meilleure
réponse de A ?
Fonction de meilleure réponse
Équilibre de Nash
95. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si B choisit l’action aB
1, la meilleure réponse de A
est aA
1 (car 6 > 4)
• Si B choisit l’action aB
2, la meilleure réponse de A
est aA
2 (car 5 > 3)
Fonction de meilleure réponse
Équilibre de Nash
96. • Si B choisit aB
1 alors A choisit aA
1
• Si B choisit aB
2 alors A choisit aA
2
• La “courbe” de meilleure réponse de A est
donc :
Meilleures
réponses
de A
aA
1
aA
2
aB
2
aB
1
Actions de B
+
+
Fonction de meilleure réponse
Équilibre de Nash
97. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Fonction de meilleure réponse
Équilibre de Nash
98. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, quelle est la meilleure
réponse de B ?
Fonction de meilleure réponse
Équilibre de Nash
99. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, la meilleure réponse de B
est aB
2 (car 5 > 4)
Fonction de meilleure réponse
Équilibre de Nash
100. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, la meilleure réponse de B
est aB
2 (car 5 > 4)
• Si A choisit l’action aA
2, quelle est la meilleure
réponse de B ?
Fonction de meilleure réponse
Équilibre de Nash
101. • ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, la meilleure réponse de B
est aB
2 (car 5 > 4)
• Si A choisit l’action aA
2, la meilleure réponse de B
est aB
2 (car 7 > 3)
Fonction de meilleure réponse
Équilibre de Nash
102. • Si A choisit aA
1 alors B choisit aB
2
• Si A choisit aA
2 alors B choisit aB
2
• La courbe de meilleure réponse de B est donc :
Actions
de A aA
1
aA
2
aB
2
aB
1
Meilleures réponses de B
Fonction de meilleure réponse
Équilibre de Nash
103. aA
1
aA
2
aB
2
aB
1
Notons que aB
2 est une
action strictement
dominante pour B
• Si A choisit aA
1 alors B choisit aB
2
• Si A choisit aA
2 alors B choisit aB
2
• La courbe de meilleure réponse de B est donc :
Actions
de A
Meilleures réponses de B
Fonction de meilleure réponse
Équilibre de Nash
104. aA
1
aA
2
aB
2
aB
1
aA
1
aA
2
aB
2
aB
1
+
+
B A
Réponse de A Choix de A
Choix de B Réponse de B
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
Fonction de meilleure réponse
Équilibre de Nash
=> Superposez les courbes…
105. Réponse de A
aA
1
aA
2
aB
2
aB
1
+
+
Réponse de B
Existe-t-il un équilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
106. aA
1
aA
2
aB
2
aB
1
+
+
Oui, (aA
2, aB
2). Pourquoi ?
Réponse de A
Réponse de B
Existe-t-il un équilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
107. aA
1
aA
2
aB
2
aB
1
+
+
Oui, (aA
2, aB
2). Pourquoi ?
aA
2 est une meilleure réponse à aB
2
aB
2 est une meilleure réponse à aA
2
Réponse de A
Réponse de B
Existe-t-il un équilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
108. 6,4 3,5
5,7
4,3
aA
1
aA
2
aB
1 aB
2
Joueur B
Joueur A
aA
2 est la seule meilleure réponse à aB
2
aB
2 est la seule meilleure réponse à aA
2
Voici la forme
stratégique du jeu
Fonction de meilleure réponse
Équilibre de Nash
109. 6,4 3,5
5,7
4,3
aA
1
aA
2
aB
1 aB
2
Joueur B
Joueur A
aA
2 est la seule meilleure réponse à aB
2
aB
2 est la seule meilleure réponse à aA
2
Existe-t-il un 2eme
Equilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
110. 6,4 3,5
5,7
4,3
aA
1
aA
2
aB
1 aB
2
Joueur B
Joueur
A
Existe-t-il un 2eme
équilibre de Nash ?
Non, car aB
2 est une
action strictement
dominante pour B
aA
2 est la seule meilleure réponse à aB
2
aB
2 est la seule meilleure réponse à aA
2
Fonction de meilleure réponse
Équilibre de Nash
111. 4,2 6,5
4,4
8,3
X
Y
U V
GP2
G1
Soit le jeu suivant sous la frome normale suivante
Trouvez son équilibre de Nash par la fonction de meilleure
réponse
Exercice
Fonction de meilleure réponse
Équilibre de Nash
112. 4,2 6,5
4,3
3,4
X
Y
U V
GP2
GR1
Meilleures réponses & Équilibre de Nash
Solution
X
Y
V
U
• Si GP2 choisit U alors GP1 choisit X
Meilleure
reponse de
GR1
Action de GR2
Courbe de meilleure réponse GR1
• Si GP1 choisit X alors GP2 choisit V
Courbe de meilleure réponse GR2
X
Y
V
U
Action
de
GR1
Meilleure Rep de GR2
X
Y
Mei
Rep
GR1
Mei Rep GR2
X
Y
V
U
Si GP2 choisit V alors GP1 choisit X
Si GP1 choisit Y alors GP2 choisit U
Supperposer les
courbes
Equilibre de Nash
114. Une stratégie pure du joueur i est un plan d’action qui prescrit une
action de ce joueur pour chaque fois qu’il est susceptible de jouer.
On note par Si l’ensemble des stratégies pures du joueur i et par si
une stratégie pure de ce joueur.
Une strateégie mixte du joueur i est une distribution de probabilités
pi définie sur l’ensemble des stratégies pures du joueur i. On note
Σ i l’ensemble des stratégies mixtes du joueur i et par σj une
stratégie mixte de ce joueur i Σ i = { σ1, σ2 ….. σq}
Jeu en Stratégies Mixtes
115. Définition
Un équilibre de Nash en stratégies mixtes est un profil de stratégies
mixtes σ∗
=(σ*i , σ*-i )∈ Σ tel que pour tout i et tout σi ∈ Σ i
Π i (σ*i , σ*-i ) ≥ Π i (σi , σ*-i )
Théorème. σ∗
est un équilibre de Nash si et seulement si pour tout
i et tout si ∈ Si
Théorème.[Nash, 1950] :
Tout jeu sous forme stratégique a un équilibre de Nash en strategies mixtes.
Π i (σ*i , σ*-i ) ≥ Π i (si , σ*-i )
Jeu en Stratégies Mixtes
116. Chercher Ne pas
Chercher
Aider 3,2 -1,3
Ne pas
aider
-1,1 0,0
Chomeur
Gouvernement
Cette matrice présente le jeu en stratégie pure ( Chercher ou non --- aider ou non)
Jeu a information incomplete = jeu simultané
Le gouvernement évite d’aider les chômeurs qui ne cherchent pas ou encore n’ aide
pas les chômeurs qui chechent
Interaction stratégique: Si on regarde les meilleur réponse
Jeu en Stratégies Mixtes
117. Chercher Ne pas
Chercher
Aider 3,2 -1,3
Ne pas
aider -1,1 0,0
Chomeur
Rep.G
Rep. G
Rep.C
Rep. C
Ce jeu n a pas d’equilibre en strategie pure
On passe à des comportement qui ne sont pas ferme
aider un peu ou beaucoup , chercher des fois des fois non etc …
Donc il est possible d’avoir un équilibre à ce jeu
c’est le cœur de la problematique de la strategie mixte
Si on passe à une stratégie mixe
Jeu en Stratégies Mixtes
118. Chercher Ne pas Chercher
Aider
3,2 -1,3
Ne pas aider
-1,1 0,0
Chômeur
Prob α Prob (1-α)
Prob β
Prob 1- β
ça consiste à supposer que le chômeur cherche avec une probabilité
α comprise entre 0 et 1
Et le gouvernement aide avec une probabilité β ( entre 0 et 1)
- par exemple aider en fonction du son budget ( 30 % ou 40% ….)
La valeur de α détermine la stratégie mixte de Chômeur
La valeur de β détermine la stratégie mixte de Gouvernement
On a mis ces probabilités pour trouver l'Esperance mathématique des
joueur pour voir comment ils se comportent
Jeu en Stratégies Mixtes
119. Chercher Ne pas Chercher
Aider
3 , 2 -1 , 3
Ne pas aider
-1 , 1 0 , 0
Chomeur
Prob α Prob (1-α)
Prob β
Esp Math de Chomeur ?
( en Fonction de α et de ce que va jouer le gouvernement β)
Esp Math de Gvrnmt ?
Comment trouver l’équilible à partir de la meilleur
solution ?
Question qui se pose:
-Dire que le chômeur va chercher avec la Proba α et le Gvrnm aide avec la Proba β.
-Et surtout donner les valeur de α et β pour
Prob 1- β
Jeu en Stratégies Mixtes
120. Chercher Ne pas Chercher
Aider
3 , 2 -1 , 3
Ne pas aider
-1 , 1 0 , 0
Chomeur
Prob α Prob (1-α)
Prob β
Prob 1- β
Espérance Math du Chômeur
Esp(Π Chomeur (Cherch))= 2 β+1*(1- β)= β +1
Esp( Π chomeur (Pas cherch)= 3β +0*(1- β )= 3β
Jeu en Stratégies Mixtes
Les fonction de réaction de Chomeur : Les meilleurs réponse du Chomeur en fonction de β
Si β<1/2 Alors α =1 autrement Si le Gvrnmt n’ aide pas, le chômeur est obligé de chercher
Si β>1/2 Alors α =0 autrement Si le Gvrnmt aide, le chômeur ne cherche pas
Si β =1/2 Alors α peut prendre toutes les valeurs, le chômeur est indifférent
Valeur β pour l’equilibre β=1/2
Quand 3β > β +1 β >1/2 le chômeur choisira Ne Pas chercher
Quand 3β < β +1 β <1/2 le chômeur choisira de chercher
121. Chercher Ne pas Chercher
Aider
3 , 2 -1 , 3
Ne pas aider
-1 , 1 0 , 0
Chomeur
Gouvernement
Prob α Prob (1-α)
Prob β
Prob 1- β
Valeur α pour l’equilibre α = 1/5
Les fonction de réaction de Gvrnmt : Les meilleurs réponse du Gvrnmt en fonction de α
Si α <1/5 Alors β=0 le chômeur ne cherche pas donc le Gvrnmt n’aide pas
Si α >1/5 Alors β=1 la chômeur cherche le Gvrnmt aide
Si α =1/5 Alors β peut prendre toutes les valeurs, le Gvrnmt est indifférent
Jeu en Stratégies Mixtes
Esp Math de Gouvernmt
Esp(Π Gvrnt (aider)= 3α - (1-α) = 4 α -1
Esp( Π Gvrnt(NP aider)= -α+0*( α -1)= -α
quand 4α -1 < -α ( ie α <1/5) le Gvrn choisira d’aider
quand 4α -1 > -α ( ie α >1/5) le Gvrn choisira de ne pas aider
122. Aider =Proba β
Fonction de réaction de chômeur
( ces meilleurs réponse)= Les
valeurs α de en fonction de β
1
Chercher =Proba α
1
1/2
0
Fonction de réaction
de chômeur
Si β <1/2 Chercher (α ) =1
Si β >1/2 ne pas Chercher (α )=0
Fonction de réaction de chômeur
( ces meilleurs réponse)= Les
valeurs β de en fonction de α
Aider =Proba β
1
Chercher =Proba α
1
0
Fonction de réaction
de Gouvernement
Si α <1/5 ne pas aider (β) = 0
Si α >1/5 aider (β) =1
1/5
1/2
Jeu en Stratégies Mixtes
Σ = { Σ C h o m , Σ G v n n t } d ’ o ù
- Σ c h o m = ( σ1 1 , σ1 2 ) = ( 1/5 *chercher , 4/5 * ne pas chercher )
- Σ G v n t = ( σ2 1 , σ2 2 ) = ( 1/2 aider , 1/2 * ne pas aider)
123. Aider =Proba β
1
Chercher =Proba α
1
0
ON croise les
meilleures réponses
1/5
1/2
Fonction de réaction
de Gouvernement
Fonction de réaction
de chômeur
Equilibre en stratégies Mixte (1 /2 , 1/5)
Donc il y a une seule valeur pour laquelle il y a une double meilleure réponse c’est β
=1/2 et α=1/5 là ou se coupent les courbes nous donne l’équilibre en Stratégie mixte
Jeu en Stratégies Mixtes
Chercher Ne pas Chercher
Aider 3 , 2 -1 , 3
Ne pas aider -1 , 1 0 , 0
Chomeur
Gvrnmt
α= 1/5 1-α=4/5
β =1/2
1- β=1/2
124. Chercher Ne pas Chercher
Aider 3 , 2 -1 , 3
Ne pas aider -1 , 1 0 , 0
Chomeur
α =1/5 1-α=4/5
β=1/2
1- β=1/2
Dans ce jeu le chômeur va chercher 1 fois / 5 α=1/5 Et le Gouvernement va
aider 1 fois / 2 β =1/2 , Une fois on a trouver les α et β ce qui est intéressant
On va calculer pour ces deux joueurs la valeur de jeu dans le cade d’un équilibre en
stratégie mixte : il suffit de reprendre les espérance mathématique des deux joeurs :
Esp-chom= 2αβ + 1*α(1 – β)+ 3(1-α) β +0(1- β) (1-α) = 1,5
et Esp-Gvrn = 3αβ -1*α(1- β) –1(1-α) β +0(1- β) (1-α) = -1/5
En jouant ce jeu le chomeur espère gagner 1,5 et le Gvrnm -1/5
Par ces valeurs le chômeur et le Gvrnmt auraient pu eviter des valeur
catastrophiques (Dégâts) 0 pour le chômeur et – 1 pour le Gvrnmt
Jeu en Stratégies Mixtes
125. joueur A
1) Existe-t-il un équilibre de Nash en stratégie pure ?
2) Trouver une équilibre en stratégie mixte
En précisant la valeurs du jeux en stratégie mixte pour chaque joueur
Comparer chaque valeur avec celle du pire des cas en stratégie pure
(1,2) (0,4)
(0,5) (3,2)
U
D
L R
Considérons un nouveau jeu...
joueur B
Jeu en Stratégies Mixtes
Exercice
126. joueur A
(1,2) (0,4)
(0,5) (3,2)
U 3/5
D 2/5
L 3/4 R 1/4
joueur B
Réponse:
1) Non
2) Esperance de A = 2*Pa*Pb + 4*(1-Pa)*Pb + 5*Pa*(1-Pb) + 2*(1-
Pa)*(1-Pb)
Esperance de B = 1*Pa*Pb + 0*(1-Pa)*Pb + 0*Pa*(1-Pb) + 3*(1-
Pa)*(1-Pb)
simplifier EspA et EspB puis calculer Pb et Pa telle que les
dérivées d(EspA)/d(Pa)=0 et d(EspB)/d(Pa)=0
Proba : Pb=3/5 et proba Pa=3/4
val de B = 2*3/4*3/5 + 4*1/4*3/5 + 5*3/4*2/5 + 2*1/4*2/5
Solution
Jeu en Stratégies Mixtes