SlideShare une entreprise Scribd logo
1  sur  126
Filière (DUT) : Développement Web et Multimédia-S1
Année Universitaire : de 2020 – 2022 au 2023 – 2024
Diaporamas du cours :
Théorie de graphe & théorie de jeux
Préparé par : Idriss CHANA
Enseignant chercheur au Département Génie Informatique, EST-UMI
Meknès Email : i.chana@umi.ac.ma
Au Profit des Etudiants de La Première Année de la filière DWM inscrits en
semestre S1
Théorie des graphes et
théorie des jeux
Théorie des jeux
Plan de cours
• Définition de jeux, forme normale et extensive
• les jeux simultanés ( statiques informations imparfaites)
• les jeux séquentiels (dynamiques information parfaites)
• Résolution et équilibre du jeu:
- équilibre de Nash,
- le dilemme du prisonnier,
- Stratégie dominante,
- Jeu de la poule mouillée,
• Fonctions de meilleures réponses,
• jeu en stratégies pures et jeu en stratégies mixtes
• Un jeu se compose de :
– Un ensemble de joueurs.
– Un ensemble de stratégies/ Actions pour
chaque joueur.
– Des gains/ Play-off associés à chaque
stratégie des joueurs.
Qu’est ce qu’un jeu ?
Exemple très simple de
jeu entre 2 agents
(sous forme normale )
Jeu à 2 joueurs avec 2 stratégies possibles
• Les joueurs s’appellent A et B.
• Le joueur A a deux stratégies : “up” ou “down”.
• Le joueur B a deux stratégies : “Left” ou “Right”.
• La matrice des gains est représentée comme suit :
Exemple
Joueur B
Joueur A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Joueur B
Joueur A
Les gains du joueur A sont (ici, )
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
Les gains du joueur B sont ( , ici)
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Exemple : Si A joue Up et B joue Right alors A gagne
1 et B gagne 8
Joueur B
Joueur A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
Une situation de jeu est une paire (ex : (U,R) ) où le premier
élément (U) est la stratégie choisie par le joueur A et le
deuxième élément (R) est la stratégie choisie par le joueur B
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Quel est le résultat de ce jeu ?
Joueur B
Joueur A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
(U,R) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
Si B joue R (right)alors la meilleure réponse de A est D (down).
Ainsi les gains de A passeront de 1 à 2.
 Donc (U,R) n’est pas possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
(U,R) est-il
un résultat
possible ?
Joueur B
Joueur A
(D,R) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
Si B joue R(right) alors la meilleure réponse de A est D(down).
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
(D,R) est-il
un résultat
possible ?
Joueur A
Si B joue Right alors la meilleure réponse de A est Down.
Si A joue Down alors la meilleure réponse de
B est Right. Donc, (D,R) est possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
(D,R) est-il
un résultat
possible ?
Théorie des jeux
Joueur B
Joueur B
Joueur A
(D,L) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
Si A joue D(down), la meilleure réponse de B est R, donc (D,L)
n’est pas possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
(D,L) est-il
un résultat
possible ?
Théorie des jeux
Joueur B
Joueur A
(U,L) est-il
un résultat
possible ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
Joueur B
Joueur A
Si A joue U(up), la meilleure réponse de B est L(left).
Si B joue L (left), la meilleure réponse de A est U(up).
Donc (U,L) est possible.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
(U,L) est-il
un résultat
possible ?
Théorie des jeux
Un jeu en forme normale est décrit comme suit:
1. Un ensemble de N joueurs, J ≡ {1,2,…,N}
2. Chaque joueur i, i J a un ensemble d’actions ( Strategies) Ai qui
est l’ensemble de toutes les actions possibles pour i. Soit ai Ai, une
action ( Strategie ) particulière de Ai. On appelle ai un résultat du jeu
3. Chaque joueur a une fonction de payoff, Πi qui assigne un nombre
réel Πi(a), à chaque action du joueur i.

Théorie des jeux: notation

Joueur B
Joueur
A
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
1) J= {Joueur A, Joueur B}
2) S1 = S Joueur A= {U, D}; S2= S Joueur B= {L,R}
3) Π1 (U)= 3 ou 1 Π1 (D)= 0 ou 2
Π2 (L)= 9 ou 0 Π2 (R)= 8 ou 1
Théorie des jeux : Exercice 1
Dilemme du prisonnier
Enoncé:
Deux suspects Ali et Fahd sont arrêtés par la police, mais la police manque de
preuve pour les emprisonner. La police doit les faire avouer:
 Si les deux avouent, ils auront chacun 4 ans de prison
 si l’un avoue et l’autre nie,
 Celui qui a avoué encourera 1 an de prison
 L’aute qui a nié encourera 10 ans de prison
 si les deux nient, ils auront chacun 2 ans de prison
Questions :
1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions)
2) Représenter le jeu sous forme normale
3) Jouer le jeu: Qu’il sera le résultat de ce jeu ( nombre d’années de prison )?, Peut
on l’améliorer ? Comment ?
Fahd
avoue nie
Ali
avoue (4;4) (1;10)
nie (10;1) (2;2)
1) L’ensemble de joueurs J ={ Ali, Fahd}
L’ensemble de Stratégies ( Actions) A1 = A2 ={avoue, nie}
2) La forme normale de ce jeu est :
Solution
3) Le résultat de jeu est (avoue,avoue)  (4,4) ,
oui on peut l’améliorer si les deux prisonniers coopèrent
Théorie des jeux : Exercice 1
Dilemme du prisonnier
 Information parfaite/imparfaite
 Forme extensive
 Jeu séquentiel
 Jeu Simultané
On parle de jeu à information parfaite dans le cas de jeu sous forme extensive, où
chaque joueur a une connaissance parfaite de toute l'histoire du jeu.: On dit alors
qu'un jeu est à information complète si chaque joueur connaît lors de la prise de
décision :
• Ses possibilités d'action
• Les possibilités d'action des autres joueurs
• Les gains résultants de ces actions
Un jeu à information incomplète est aussi à information imparfaite
- Les échecs sont à information complète et parfaite
- Le jeu de Poker : est à information incomplète et imparfaite
Information parfaite ( jeu séquentiel)
Théorie des jeux: Information
parfaite/imparfaite
Forme extensive : est un arbre (graphe connexe sans cycle) représentant
les déroulements possibles du jeu.:
 à chaque Sommet non terminal est associé un joueur : arrivé à ce point du
jeu c'est à son tour de jouer.
 Chaque arc représente chacune des actions (coups autorisés par la règle)
que ce joueur peut prendre à ce point du jeu.
 à chaque sommet terminal correspond un résultat du jeu donné par vecteur
des paiements (liste des gains attribués à chaque joueur).
Théorie des jeux: Forme extensive
Définition
Théorie des jeux: Forme extensive
Représentation Graphique
Bihi
Ali
U D U D
(3;9)
L R
(0;0) (1;8) (2;1)
Théorie des jeux: Forme extensive
A et B jouent en même temps
Le trait …… Signifie que le jeu est simultané : c’est à dire Ali ne connait pas
l’action de Bihi
Bihi
Ali
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
B
A1
U
D U D
(3;9)
L R
(0;0) (1;8) (2;1)
A joue après B
Si le jeu est séquentiel et Ali connait l’action de
Bihi. la forme extensive du jeu sera comme
suit:
A2
Représentation Graphique : Exemples Trait signifiant
que le jeu est
simultané
• Enoncé : Il s’agit d’ un jeu entre deux enfants Ali et leila, les deux choisissent un
objet parmi les 3 suivant : papier, ciseau et caillou. Selon ces choix, soit l’enfant
gagne le jeu soit il n y a pas de gagnant( s’ils choisissent le même objet) .
• Papier gagne contre caillou , ciseau gagne contre papier et caillou gagne
contre ciseau. Soit 2 le gain de l’enfant qui gagne, 0 le gain de celui qui perd et
1 le gain en cas d égalité.
Questions :
1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions) de chaque joueur.
2) Représenter le jeu simultané en forme normale
3) Représenter le jeu simultané en forme extensive
4) Même question que (3) si Ali triche et observe le choix de Leila avant de jouer
5) Même question que (3) si Ali n’ observe le choix de Leila que s’elle choisit caillou
Théorie des jeux: Forme extensive
papier, ciseau et caillou
Exercice 2
Théorie des jeux: Forme extensive
Exercice 2
papier, ciseau et caillou
Solution
Définition d’un
équilibre du jeu
Les étapes de résolutions d’un jeu sont comme suit
1. Identifier les décisions de A
 Meilleure décision de A, compte tenu des décisions de B1
 Meilleure décision de A, compte tenu des décisions B2,
 Etc ….
2. Identifier les décisions de B
 Meilleure décision de B, compte des décisions A1
 Meilleure décision de B, compte des décisions A2,
 etc…
3. On caractérise la solution du jeu, si elle existe
Résolution d’un jeu et Equilibre
Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
Exemple de Résolution d’un jeu (1/5)
1. Seules les décisions
de A sont prises en
compte
2. Seules les décisions
de A sont retenues si B
choisit Qd
3. On retient la décision
qui génère le plus gros
gain
*
Résolution d’un jeu et Equilibre
Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Seules les décisions
de A sont prises en
compte
2. Seules les décisions
de A sont retenues si B
choisit Qe
3. On retient la décision
qui génère le plus gros
gain (*)
*
*
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (2/5)
Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Seules les décisions
de B sont prises en
compte
2. Seules les décisions
de B sont retenues si A
choisit Qd
3. On retient la décision
qui génère le plus gros
gain (*)
*
* *
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (3/5)
Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Seules les décisions
de B sont prises en
compte
2. Seules les décisions
de B sont retenues si A
choisit Qe
3. On retient la décision
qui génère le plus gros
gain(*)
*
* *
*
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (4/5)
Matrice
des gains
Ent. B
Qd Qe
Ent. A
Qd (2, 2) (15,0)
Qe (0,15) (10,10)
1. Un jeu a un équilibre
quand il génère une
convergence des
décisions stratégiques
2. Le couple de stratégies
(Qd;Qd) est la solution
du jeu
*
* *
*
Résolution d’un jeu et Equilibre
Exemple de Résolution d’un jeu (5/5)
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
Soient les deux société de l’aéronautique Boeing et Airbus qui décide de
Produire ou de Ne pas produire avec des play-off décrits selon un jeu
dont la forme normale est la suivante:
Résolution d’un jeu et Equilibre :
Exercice 3
Faites la résolution de ce jeu et trouver son équilibre
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Boeing sont prises
en compte
2. Seules les décisions
de Boeing sont
retenues si Airbus
choisit de produire
3. On retient la décision
qui génère le plus gros
gain
*
Résolution d’un jeu et Equilibre :
solution (1/5)
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Boeing sont prises
en compte
2. Seules les décisions
de Boeing sont
retenues si Airbus
chosit de ne pas
produire
3. On retient la décision
qui génère le plus gros
gain
*
*
Résolution d’un jeu et Equilibre :
solution (2/5)
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Airbus sont prises
en compte
2. Seules les décisions
de Airbus sont
retenues si Boeing
choisit de produire
3. On retient la décision
qui génère le plus gros
gain
*
*
*
Résolution d’un jeu et Equilibre :
solution (3/5)
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
1. Seules les décisions
de Airbus sont prises
en compte
2. Seules les décisions
de Airbus sont
retenues si Boeing
choisit de ne pas
produire
3. On retient la décision
qui génère le plus gros
gain
*
*
*
*
Résolution d’un jeu et Equilibre :
solution (4/5)
Airbus
P NP
Boeing
P (-1,-1) (10,0)
NP (0,10) (0,0)
Ce jeu a deux équilibres
(convergence des
décisions stratégiques)
 Le couple de tratégies
(P;NP) est le premier
équilibre du jeu
 Le couple de stratégies
(NP;P) est le deuxième
équilibre du jeu.
*
*
*
*
Résolution d’un jeu et Equilibre :
solution (5/5)
Joueur 2
S1 S2
Joueur 1
S1 (0,10) (10,0)
S2 (10,0) (0,10)
Exemple de jeu sans équilibre
Faites la résolution de ce jeu et trouver son équilibre
1/2
Joueur 2
S1 S2
Joueur 1
S1 (0,10) (10,0)
S2 (10,0) (0,10)
Exemple de jeu sans équilibre
*
*
*
*
2/2
Puisque il n y a pas de convergence de stratégie, ce jeu est un
jeu sans équilibre
Stratégie dominante ( Dominée)
EISD et équilibre du Nash
Notations
Stratégie Dominante/ Dominée, EISD et équilibre du Nash
Un jeu en forme normale est décrit comme suit :
 Un ensemble de N joueurs, J ≡ {1,2,…,N}
 Chaque joueur J a un ensemble m de Stratégies SJ = {sJ1,sJ2, ..sJm}
 Chaque joueur J a une fonction de payoff(gain), ΠJ qui assigne un
nombre réel ΠJ(SJ), à chaque action du joueur J.
soient :
- si un profil de stratégies {s1,…..sn} / qlq soit i, si ∊à Si
- s-i ( s indice –i ) le profil de stratégies autres que celles du joueur J :
s-i = {s1,……Si-1,Si+1, ……sN} ( N est le nombre de joueur)
 On note S l’espace des stratégies ie : S = S1xS2x ……xSN
Principe
Une stratégie n’est jamais jouée si une autre assure
un gain meilleure dans tous les cas
X Y
U (5 ,3) (4,2)
V (3,6) (7, 1)
J2
J1
Stratégie
dominée
de J2
Stratégie
dominante
de J2
Π2 (U , X ) > Π2 (U,Y )
Π2 (V , X ) > Π2 (V,Y )
Stratégie dominée/dominante
Incomparables: Pas de
stratégie dominante ni
Dominée pour J1
Π1 (U , X ) > Π1 (V,X )
Π1 (U, Y ) < Π1 (V,Y )
J2
J1
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Définition:
 Une stratégie sd est (strictement) dominée :
pour le joueur J, s il existe une stratégie si telle que pour
tous les gains générés par les stratégies autre que sd ( qu
on note par s-i ) on a :
ΠJ (si , s-i ) > ΠJ (sd , s-i )
• Une stratégie sf est faiblement dominée
pour le joueur i s il existe une stratégie s’i telle que pour tous
les gains correspondant à s-i on a
ΠJ (si , s-i ) ≥ ΠJ (sd , s-i ) ( sup. ou égal)
Equilibre en Stratégie dominante
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Player 1
u v
x 4,2 3,6
y 2,5 1,8
Player 2
s
3,1
3,0
z 8,1 4,2 6,0
Π2 (x,v ) > Π2 (x,u ) Π2 (x ,v ) > Π2 (x,s )
Π2 (y , v ) > Π2 (y,u ) Π2 (y , v ) > Π2 (y,s)
Π1 (z , u ) > Π1 (y, u)
Player 1
Player 2
Π1 (z , u ) > Π1 (x,u )
Π2 (z , v ) > Π2 (z,u) Π2 (z , v ) > Π2 (z,s)
Π1 (z , v ) > Π1 (y, v) Π1 (z , v ) > Π1 (x,v )
Π1 (z , s ) > Π1 (y, s) Π1 (z , s ) > Π1 (x,s )
% U de Player 2
% X de Player 1
% S de Player 2
% V de Player 2
% Y de Player 1
% Z de Player 1
 La stratégie Z domine
pour Player1
 La stratégie V domine
pour Player 2
4,2
L’équilibre en Stratégie Dominante existe et vaut ( z,v)
avec une utilité de  (4,2)
% = par rapport à
Joueur 2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Introduction a
`la The´orie des Jeux – p.20/77
Joueur 2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur 2
Joueur 1
u v
x 4,2 3,1
y 2,5 9,0
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur 2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Une stratégie si est (strictement) dominée pour le
joueur i si il existe une stratégie si
J
telle que pour
tous les profils s−i
Π i (si
J
, s−i ) > Π i (si , s−i ) --( > strict. Sup)
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur
2
Joueur
1
u v
x 4,2 3,1
y 2,5 9,0
Une stratégie si est faiblement dominée pour le
joueur i si il existe une stratégie si
J
telle que pour
tous les profils s−i
Π i (si
J
, s−i ) ≥ Π i (si , s−i ) -- (≥ Sup. ou egal)
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Introduction a
`la The´orie des Jeux – p.21/77
Joueur
2
Joueur
1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,2
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Joueur 2
Joueur 1
u v w
x 3,6 7,1 4,8
y 5,1 8,2 6,1
z 6,0 6,2 3,3
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
 Un jeu est dit résolvable par élimination itérative des stratégies dominées, si on
obtient un unique profil en éliminant successivement des stratégies (strictement)
dominées.
 Les profils obtenus aprés élimination itérative des stratégies (strictement)
dominées (EISSD) ne dépendent pas de l’ordre choisi pour l’élimination des
stratégies.
 Par contre, on peut obtenir des profils différents lorsque l’on choisit des ordres
différents pour l’élimination itérative de stratégies faiblement dominées (EISFD).
 Les résultats obtenus par EISSD sont donc plus robustes que ceux obtenus
par EISFD.
 Problème majeur de cette méthode: tous les jeux ne sont pas résolvable par EISD !
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Exercices :: Pour les 3 jeux sous forme normale ci-dessous
1) Y a t il un équilibre en stratégie dominante
2) Existe-t-il un équilibre en EISD ( Elimination Itérative de Stratégie Dominées )
X Y Z
X 3 , 6 5,7 4,5
Y 5 ,1 6,2 6,1
Z 6 , 0 8,9 3,6
Joueur B
Jeu 1
Dilemme de prisonniers
St Y
bas Haut
St X
bas 40,30 45,10
Haut 20,60 50,50
Jeu 2
2 sociétés
Jeu 3
Joueur
A
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Equilibre en Elimination de Stratégies Dominées
Fahd
avoue nie
Ali
avoue (-4;-4) (-1;-10)
nie (-10;-1) (-2;-2)
1) Vérifions qu’il y a un équilibre en stratégie dominante
Donc avoue est une stratégie dominante pour Ali
Pour Ali  (Πali(avoue , avoue ) > Πali(nie , avoue )
et (Πali(avoue , nie ) > Πali(nie , nie )
Pour Fahd  (Πfahd(avoue , nie ) > Πfahd(nie , nie )
et (Πfahd(avoue , avoue ) > Πfahd(nie , avoue )
Donc avoue est une stratégie dominante pour Fahd
Résultat , il y a un équilibre en
stratégie dominante  ( avoue,avoue)
Jeu1: Dilemme de prisonniers
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
Correction
Fahd
avoue nie
Ali
avoue (-4;-4) (-1;-10)
nie (-10;-1) (-2;-2)
2) Vérifions qu’il y a un équilibre par EISSD
Donc nie est une stratégie dominée pour Ali
Pour Ali  (Πali(nie , nie ) < Πali(avoue , nie )
et Πali(nie , avoue ) < (Πali(avoue , avoue )
Pour Fahd  ( Πfahd(nie , nie ) < Πfahd(avoue , nie )
et (Πfahd(nie , avoue ) < Πfahd(avoue , avoue )
Donc nie est une stratégie dominée pour Fahd
Résultat , il y a un équilibre en
EISSD  ( avoue,avoue)
Jeux Dilemme de prisonniers
Remarque : un équilibre en Stratégie Dominante est un Equilibre en EISSD,
l’inverse n’est pas vrai
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
1) Vérifions qu’il y a un équilibre en stratégie dominante
Alors : Les deux stratégies sont incomparable
il n y a pas une stratégie dominante pour Stx
Pour St X  (Πstx(bas , bas) =40) > ( Πstx(haut , bas ) =20)
et (Πstx(bas , haut ) = 45 ) < ( Πstx(haut , haut)=50 )
Pour St y  (Πsty(bas , bas ) =30) > (Πsty(haut , bas )=10)
et (Πsty (bas, haut)=60) > Πsty(haut , bas ) = 50)
Donc bas est une stratégie dominante pour Sty
Résultat , il y a pas d équilibre en
stratégie dominante pour ce jeu
Jeu 2 : 2 sociétés
St Y
bas Haut
St X
bas 40,30 45,10
Haut 20,60 50,50
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
2) Vérifions qu’il y a un équilibre en EISSD
Donc Haut est strictement dominée par bas pour Stx
Pour St X  (( Πstx(haut , bas ) =20 < Πstx(bas , bas) =40) )
Rationalité St Y ne jouera jamais Haut
Pour St y  ((Πsty(haut , bas )=10) < Πsty(bas , bas ) =30)
et (Πsty(haut , bas ) = 50) < Πsty (bas, haut)=60)
Donc haut est une stratégie dominée pour St Y
Résultat : l’ équilibre par EISD pour ce jeu est
( bas, bas )
St Y
bas Haut
St X
bas 40,30 45,10
Haut 20,60 50,50
Jeu 2 : 2 sociétés
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
1) Vérifions qu’il y a un équilibre en stratégie dominante
Pour A  (ΠA(X , X) =3) < ( ΠA(Y , X ) =20 ) < ΠA(Z , X ) =6 )
et (ΠA(X , Z) =4) > ( ΠA(Z , Z ) =3 ))
X Y Z
X 3 , 6 5,7 4,5
Y 5 ,1 6,2 6,1
Z 6 , 0 8,9 3,6
Joueur B
Joueur
A
Incomparable donc il n y a pas d équilibre en stratégie dominante
2) Vérifions qu’il y a un équilibre en EISSD
Jeu 3 :
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
J A: 5>3 , 6>5 6 > 4 donc la
stratégie X est dominée par Y pour
le joueur A
J B: 2>1 9 > 6 donc la stratégie Z est dominée par Y pour le joueur B
J A: 6>5 , 8>6 donc la stratégie Y
est dominée par Z pour le joueur A
J B: 9>0 donc la stratégie X est
dominée par Y pour le joueur B Résultat : Existance de l
Equilibre en EISSD  (z,y)
2) Vérifions qu’il y a un équilibre en EISSD
Jeu 3 :
Correction (Suite)
Equilibre en Elimination de Stratégies Dominées
Stratégie dominante/ Dominée, EISD et équilibre du Nash
• Une situation ( Profil) du jeu où chaque stratégie
est la meilleure réponse à l’autre est un équilibre
de Nash.
• L’équilibre de Nash est une situation où aucun
joueur ne peut améliorer sa situation en changeant
unilatéralement de stratégie, compte tenu des
décisions de l’autre joueur
Équilibre de Nash
u v w
x 3,0 0,3 0,4
y 2,0 1,2 2,0
z 0,3 0,2 3,0
Introduction a
`la The´orie des Jeux – p.23/77
Joueur 2
Joueur 1
(Y,V) est un equilibre de Nash
Équilibre de Nash
u v w
x 3,0 0,3 0,4
y 2,0 1,2 2,0
z 0,3 0,2 3,0
Introduction a
`la The´orie des Jeux – p.23/77
Joueur 2
Joueur 1
 Rappel : l’équilibre de Nash est une situation telle qu’aucun joueur
n’a pas intérêt à dévier (seul) de la situation obtenue.
 Un équilibre de Nash est un profil de stratégies s∗
= { s∗
1 , . . . , s∗
n }
tel que pour tout joueur i, pour toute stratégie sJ
∈ Si :
Πi (s*i , s*-i ) ≥ Πi (sJ,s*-i )
Équilibre de Nash
(Y,V) est un équilibre de Nash
 Un profil (unique) obtenu par élimination itérative de stratégies
(strictement) dominées (EISSD) est un équilibre de Nash (et c’est le
seul équilibre du jeu).
 Un jeu (en stratégies pures) peut avoir plusieurs équilibres de
Nash, comme il peut aussi n’en avoir aucun !
 Deux équilibres de Nash s∗
et sJ∗
sont équivalents si ils donnent la
même utilité à tous les joueurs, i.e.
pour tout i ∈ N Πi (s∗
) = Πi (sJ∗
).
Propriétés
Équilibre de Nash
 Question: comment choisir un équilibre particulier lorsqu’il y en a plusieurs ?
Joueur B
Joueur A
(U,L) et (D,R) sont deux “équilibres de Nash” pour ce jeu
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Équilibre de Nash
Exemple 1
joueur B
joueur A
(U,L) et (D,R) sont des équilibres de Nash pour ce jeu. Mais,
lequel va apparaître ?
Nous remarquons que (U,L) est préféré à (D,R) par les deux
joueurs. Pour autant est-ce que (U,L) va apparaître ?
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Équilibre de Nash
Exemple 1 ( suite)
deux approches pour déterminer laquelle de ces stratégies équilibrées est la plus
plausible :
1. La stabilité : Les joueurs peuvent opter pour l'équilibre de Nash qui
semble le plus stable, c'est-à-dire celui où aucune des parties n'a une forte
incitation à dévier de sa stratégie.
2. La convention : Les joueurs peuvent convenir à l'avance d'une stratégie
particulière en cas de multiples équilibres de Nash. Cette approche peut découler
de négociations, d'accords ou de règles établies à l'avance pour résoudre les
situations d'équilibre multiple.
Équilibre de Nash
Réponse : Lorsqu'un jeu contient deux équilibres de Nash ou plus , on parle
d'équilibre multiple les joueurs peuvent avoir plusieurs stratégies optimales,
l’exemple de Duopole:
Matrice des
gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
Un joueur peut-il seul
améliorer sa position ?
L’entreprise A ?
L’entreprise B ?
Puisque aucun joueur
ne peut améliorer sa
situation, il s’agit d’un
équilibre de Nash
Équilibre de Nash
Exemple 2
Efficacité de l’équilibre
L’exemple de Duopole:
Matrice des
gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
L’équilibre de Nash est
«Qd-Qd» mais n’est pas
collectif
Si le nombre d’agents est
restreint, la rationalité
individuelle n’amène pas
forcement au bien être
collectif
l’ optimal est:
Exemple 2 ( suite)
L’exemple de Duopole:
Matrice des
gains
Ent. B
Qd Qe
Ent. A
Qd 2,2 15,0
Qe 0,15 10,10
Remarquons que puisque
les gains en cas d’entente
sont supérieurs au gains
sans entente, il s’agit d’un
jeu de coordination.
Un jeu de coordination est
un jeu où les paiements
(gains) sont plus élevés
quand les joueurs peuvent
coordonner leurs stratégies.
Efficacité de l’équilibre
Exemple 2 ( suite)
Ce Jeu a t- il l’ Equilibre de Nash ?
A
B
(6,6) (1,10)
(10,1) (-20,-20)
Coopère
Trahit
Coopère Trahit
Le jeu de la poule mouillée
Oui : 2 Equilibres de Nash :
La stratégie dominante
Exercice
(Coopère, Trahir) avec un gain de (10,1) ou (Trahir, Coopère) avec un gain (1,10)
- Dans ces deux équilibres de Nash, toujours un joueur se trouve défavorisé
devant l’autre mais si on choisit tous les deux (Coopère, Coopère) après discussion
et coordination, même si ce n’est pas un équilibre de Nash on peut optimiser nos
gain collectifs.
Equilibre de Nash et Jeu
séquentiel
(sous forme extensive)
• Dans nos deux exemples, les joueurs
jouaient simultanément.
• Il existe des jeux où les joueurs jouent l’un
après l’autre : jeux séquentiels.
• Le joueur qui joue en premier est le
leader, celui qui joue en deuxième est le
follower.
Jeu séquentiel: Rappel
• Parfois, un jeu a plusieurs équilibres de
Nash et il est difficile de savoir lequel va
sortir du jeu…
• En revanche, quand un jeu est séquentiel,
il est possible de dire quel équilibre de
Nash va sortir du jeu.
Exemple
joueur B
joueur A
(U,L) et (D,R) sont deux équilibres de Nash
quand le jeu est simultané. Et, il est
impossible de savoir quel équilibre va arriver.
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
joueur B
joueur A
Supposons maintenant que le jeu est
séquentiel : A est le leader et B le follower.
Nous pouvons réécrire ce jeu sous sa forme
extensive…
L R
U
D
(3,9)
(0,0)
(1,8)
(2,1)
Théorie des jeux
U D
L L
R R
(3,9) (1,8) (0,0) (2,1)
A
B B
A jour en premier
B jour en second
Théorie des jeux
U D
L L
R R
(3,9) (1,8) (0,0) (2,1)
A
B B
(U,L) est un équilibre de Nash
(D,R) est un équilibre de Nash
Quel est celui qui va sortir du jeu?
Théorie des jeux
U D
L L
R R
(3,9) (1,8) (0,0) (2,1)
A
B B
Si A joue U alors B joue L; A gagne 3.
Si A joue D alors B joue R; A gagne 2.
Donc (U,L) est l’équilibre de Nash qui sortira
Théorie des jeux
Fonctions de
meilleures réponses
 La fonction de meilleure réponse du joueur i est la fonction Bi
qui associe à chaque combinaison de stratégies des autres
joueurs s−i les stratégies du joueur i qui maximise son utilité:
 Un équilibre de Nash est un profil s∗
tel que la stratégie du
joueur i est une meilleure réponse:
fonction de meilleure réponse
Équilibre de Nash
S*i ∈ Bi (s*−i ) pour tout i ∈ N
Bi (s−i ) = {si ∈ Si t.q. Πi (si , s−i ) ≥ Πi (sJ
i , s−i )
pour tout sJ
i ∈ Si }
• Soit un jeu 2×2; i.e., un jeu avec deux joueurs A et B, qui ont
chacun deux actions possibles
• A peut choisir entre deux actions : aA
1 et aA
2
• B peut choisir entre deux actions aB
1 et aB
2
• Il y a 4 paires d’action possibles
(aA
1, aB
1), (aA
1, aB
2), (aA
2, aB
1), (aA
2, aB
2)
• Chaque paire d’action donnera des gains différents aux joueurs
Fonction de meilleure réponse
Équilibre de Nash
A
aA
1 (6 ,4)
(4 , 3)
(3 , 5)
(5, 7)
aA
2
B
aB
1 aB
2
• Supposons que les gains des joueurs A et B quand ils
choisissent respectivement les actions aA
1 et aB
1 sont :
ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
• De manière similaire, supposons que :
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Si B choisit l’action aB
1, quelle est la meilleure réponse de
A ?
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Si B choisit l’action aB
1, quelle est la meilleure réponse de
A ?
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si B choisit l’action aB
1, quelle est la meilleure
réponse de A est aA
1 (car 6 > 4)
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si B choisit l’action aB
1, la meilleure réponse de A
est aA
1 (car 6 > 4)
• Si B choisit l’action aB
2, quelle est la meilleure
réponse de A ?
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si B choisit l’action aB
1, la meilleure réponse de A
est aA
1 (car 6 > 4)
• Si B choisit l’action aB
2, la meilleure réponse de A
est aA
2 (car 5 > 3)
Fonction de meilleure réponse
Équilibre de Nash
• Si B choisit aB
1 alors A choisit aA
1
• Si B choisit aB
2 alors A choisit aA
2
• La “courbe” de meilleure réponse de A est
donc :
Meilleures
réponses
de A
aA
1
aA
2
aB
2
aB
1
Actions de B
+
+
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, quelle est la meilleure
réponse de B ?
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, la meilleure réponse de B
est aB
2 (car 5 > 4)
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, la meilleure réponse de B
est aB
2 (car 5 > 4)
• Si A choisit l’action aA
2, quelle est la meilleure
réponse de B ?
Fonction de meilleure réponse
Équilibre de Nash
• ΠA(aA
1, aB
1) = 6 et ΠB(aA
1, aB
1) = 4
ΠA(aA
1, aB
2) = 3 et ΠB(aA
1, aB
2) = 5
ΠA(aA
2, aB
1) = 4 et ΠB(aA
2, aB
1) = 3
ΠA(aA
2, aB
2) = 5 et ΠB(aA
2, aB
2) = 7
• Si A choisit l’action aA
1, la meilleure réponse de B
est aB
2 (car 5 > 4)
• Si A choisit l’action aA
2, la meilleure réponse de B
est aB
2 (car 7 > 3)
Fonction de meilleure réponse
Équilibre de Nash
• Si A choisit aA
1 alors B choisit aB
2
• Si A choisit aA
2 alors B choisit aB
2
• La courbe de meilleure réponse de B est donc :
Actions
de A aA
1
aA
2
aB
2
aB
1
Meilleures réponses de B
Fonction de meilleure réponse
Équilibre de Nash
aA
1
aA
2
aB
2
aB
1
Notons que aB
2 est une
action strictement
dominante pour B
• Si A choisit aA
1 alors B choisit aB
2
• Si A choisit aA
2 alors B choisit aB
2
• La courbe de meilleure réponse de B est donc :
Actions
de A
Meilleures réponses de B
Fonction de meilleure réponse
Équilibre de Nash
aA
1
aA
2
aB
2
aB
1
aA
1
aA
2
aB
2
aB
1
+
+
B A
Réponse de A Choix de A
Choix de B Réponse de B
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
Fonction de meilleure réponse
Équilibre de Nash
=> Superposez les courbes…
Réponse de A
aA
1
aA
2
aB
2
aB
1
+
+
Réponse de B
Existe-t-il un équilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
aA
1
aA
2
aB
2
aB
1
+
+
Oui, (aA
2, aB
2). Pourquoi ?
Réponse de A
Réponse de B
Existe-t-il un équilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
aA
1
aA
2
aB
2
aB
1
+
+
Oui, (aA
2, aB
2). Pourquoi ?
aA
2 est une meilleure réponse à aB
2
aB
2 est une meilleure réponse à aA
2
Réponse de A
Réponse de B
Existe-t-il un équilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
Comment peut-on utiliser les courbes de meilleures
réponses pour localiser les équilibres de Nash du jeu ?
=> Superposez les courbes…
6,4 3,5
5,7
4,3
aA
1
aA
2
aB
1 aB
2
Joueur B
Joueur A
aA
2 est la seule meilleure réponse à aB
2
aB
2 est la seule meilleure réponse à aA
2
Voici la forme
stratégique du jeu
Fonction de meilleure réponse
Équilibre de Nash
6,4 3,5
5,7
4,3
aA
1
aA
2
aB
1 aB
2
Joueur B
Joueur A
aA
2 est la seule meilleure réponse à aB
2
aB
2 est la seule meilleure réponse à aA
2
Existe-t-il un 2eme
Equilibre de Nash ?
Fonction de meilleure réponse
Équilibre de Nash
6,4 3,5
5,7
4,3
aA
1
aA
2
aB
1 aB
2
Joueur B
Joueur
A
Existe-t-il un 2eme
équilibre de Nash ?
Non, car aB
2 est une
action strictement
dominante pour B
aA
2 est la seule meilleure réponse à aB
2
aB
2 est la seule meilleure réponse à aA
2
Fonction de meilleure réponse
Équilibre de Nash
4,2 6,5
4,4
8,3
X
Y
U V
GP2
G1
Soit le jeu suivant sous la frome normale suivante
Trouvez son équilibre de Nash par la fonction de meilleure
réponse
Exercice
Fonction de meilleure réponse
Équilibre de Nash
4,2 6,5
4,3
3,4
X
Y
U V
GP2
GR1
Meilleures réponses & Équilibre de Nash
Solution
X
Y
V
U
• Si GP2 choisit U alors GP1 choisit X
Meilleure
reponse de
GR1
Action de GR2
Courbe de meilleure réponse GR1
• Si GP1 choisit X alors GP2 choisit V
Courbe de meilleure réponse GR2
X
Y
V
U
Action
de
GR1
Meilleure Rep de GR2
X
Y
Mei
Rep
GR1
Mei Rep GR2
X
Y
V
U
 Si GP2 choisit V alors GP1 choisit X
 Si GP1 choisit Y alors GP2 choisit U
Supperposer les
courbes
Equilibre de Nash
Jeu en Stratégies Mixtes
 Une stratégie pure du joueur i est un plan d’action qui prescrit une
action de ce joueur pour chaque fois qu’il est susceptible de jouer.
On note par Si l’ensemble des stratégies pures du joueur i et par si
une stratégie pure de ce joueur.
 Une strateégie mixte du joueur i est une distribution de probabilités
pi définie sur l’ensemble des stratégies pures du joueur i. On note
Σ i l’ensemble des stratégies mixtes du joueur i et par σj une
stratégie mixte de ce joueur i  Σ i = { σ1, σ2 ….. σq}
Jeu en Stratégies Mixtes
Définition
Un équilibre de Nash en stratégies mixtes est un profil de stratégies
mixtes σ∗
=(σ*i , σ*-i )∈ Σ tel que pour tout i et tout σi ∈ Σ i
Π i (σ*i , σ*-i ) ≥ Π i (σi , σ*-i )
Théorème. σ∗
est un équilibre de Nash si et seulement si pour tout
i et tout si ∈ Si
Théorème.[Nash, 1950] :
Tout jeu sous forme stratégique a un équilibre de Nash en strategies mixtes.
Π i (σ*i , σ*-i ) ≥ Π i (si , σ*-i )
Jeu en Stratégies Mixtes
Chercher Ne pas
Chercher
Aider 3,2 -1,3
Ne pas
aider
-1,1 0,0
Chomeur
Gouvernement
Cette matrice présente le jeu en stratégie pure ( Chercher ou non --- aider ou non)
Jeu a information incomplete = jeu simultané
Le gouvernement évite d’aider les chômeurs qui ne cherchent pas ou encore n’ aide
pas les chômeurs qui chechent
Interaction stratégique: Si on regarde les meilleur réponse
Jeu en Stratégies Mixtes
Chercher Ne pas
Chercher
Aider 3,2 -1,3
Ne pas
aider -1,1 0,0
Chomeur
Rep.G
Rep. G
Rep.C
Rep. C
Ce jeu n a pas d’equilibre en strategie pure
On passe à des comportement qui ne sont pas ferme
aider un peu ou beaucoup , chercher des fois des fois non etc …
Donc il est possible d’avoir un équilibre à ce jeu
 c’est le cœur de la problematique de la strategie mixte
Si on passe à une stratégie mixe
Jeu en Stratégies Mixtes
Chercher Ne pas Chercher
Aider
3,2 -1,3
Ne pas aider
-1,1 0,0
Chômeur
Prob α Prob (1-α)
Prob β
Prob 1- β
ça consiste à supposer que le chômeur cherche avec une probabilité
α comprise entre 0 et 1
Et le gouvernement aide avec une probabilité β ( entre 0 et 1)
- par exemple aider en fonction du son budget ( 30 % ou 40% ….)
La valeur de α détermine la stratégie mixte de Chômeur
La valeur de β détermine la stratégie mixte de Gouvernement
On a mis ces probabilités pour trouver l'Esperance mathématique des
joueur pour voir comment ils se comportent
Jeu en Stratégies Mixtes
Chercher Ne pas Chercher
Aider
3 , 2 -1 , 3
Ne pas aider
-1 , 1 0 , 0
Chomeur
Prob α Prob (1-α)
Prob β
Esp Math de Chomeur ?
( en Fonction de α et de ce que va jouer le gouvernement β)
Esp Math de Gvrnmt ?
Comment trouver l’équilible à partir de la meilleur
solution ?
Question qui se pose:
-Dire que le chômeur va chercher avec la Proba α et le Gvrnm aide avec la Proba β.
-Et surtout donner les valeur de α et β pour
Prob 1- β
Jeu en Stratégies Mixtes
Chercher Ne pas Chercher
Aider
3 , 2 -1 , 3
Ne pas aider
-1 , 1 0 , 0
Chomeur
Prob α Prob (1-α)
Prob β
Prob 1- β
Espérance Math du Chômeur
 Esp(Π Chomeur (Cherch))= 2 β+1*(1- β)= β +1
Esp( Π chomeur (Pas cherch)= 3β +0*(1- β )= 3β
Jeu en Stratégies Mixtes
Les fonction de réaction de Chomeur : Les meilleurs réponse du Chomeur en fonction de β
Si β<1/2 Alors α =1 autrement Si le Gvrnmt n’ aide pas, le chômeur est obligé de chercher
Si β>1/2 Alors α =0 autrement  Si le Gvrnmt aide, le chômeur ne cherche pas
Si β =1/2 Alors α peut prendre toutes les valeurs, le chômeur est indifférent
Valeur β pour l’equilibre β=1/2
Quand 3β > β +1  β >1/2  le chômeur choisira Ne Pas chercher
Quand 3β < β +1  β <1/2  le chômeur choisira de chercher
Chercher Ne pas Chercher
Aider
3 , 2 -1 , 3
Ne pas aider
-1 , 1 0 , 0
Chomeur
Gouvernement
Prob α Prob (1-α)
Prob β
Prob 1- β
Valeur α pour l’equilibre α = 1/5
Les fonction de réaction de Gvrnmt : Les meilleurs réponse du Gvrnmt en fonction de α
Si α <1/5 Alors β=0 le chômeur ne cherche pas donc le Gvrnmt n’aide pas
Si α >1/5 Alors β=1 la chômeur cherche le Gvrnmt aide
Si α =1/5 Alors β peut prendre toutes les valeurs, le Gvrnmt est indifférent
Jeu en Stratégies Mixtes
Esp Math de Gouvernmt
 Esp(Π Gvrnt (aider)= 3α - (1-α) = 4 α -1
Esp( Π Gvrnt(NP aider)= -α+0*( α -1)= -α
quand  4α -1 < -α ( ie α <1/5)  le Gvrn choisira d’aider
quand  4α -1 > -α ( ie α >1/5)  le Gvrn choisira de ne pas aider
Aider =Proba β
Fonction de réaction de chômeur
( ces meilleurs réponse)= Les
valeurs α de en fonction de β
1
Chercher =Proba α
1
1/2
0
Fonction de réaction
de chômeur
Si β <1/2 Chercher (α ) =1
Si β >1/2 ne pas Chercher (α )=0
Fonction de réaction de chômeur
( ces meilleurs réponse)= Les
valeurs β de en fonction de α
Aider =Proba β
1
Chercher =Proba α
1
0
Fonction de réaction
de Gouvernement
Si α <1/5 ne pas aider (β) = 0
Si α >1/5 aider (β) =1
1/5
1/2
Jeu en Stratégies Mixtes
Σ = { Σ C h o m , Σ G v n n t } d ’ o ù
- Σ c h o m = ( σ1 1 , σ1 2 ) = ( 1/5 *chercher , 4/5 * ne pas chercher )
- Σ G v n t = ( σ2 1 , σ2 2 ) = ( 1/2 aider , 1/2 * ne pas aider)
Aider =Proba β
1
Chercher =Proba α
1
0
ON croise les
meilleures réponses
1/5
1/2
Fonction de réaction
de Gouvernement
Fonction de réaction
de chômeur
Equilibre en stratégies Mixte (1 /2 , 1/5)
Donc il y a une seule valeur pour laquelle il y a une double meilleure réponse c’est β
=1/2 et α=1/5 là ou se coupent les courbes nous donne l’équilibre en Stratégie mixte
Jeu en Stratégies Mixtes
Chercher Ne pas Chercher
Aider 3 , 2 -1 , 3
Ne pas aider -1 , 1 0 , 0
Chomeur
Gvrnmt
α= 1/5 1-α=4/5
β =1/2
1- β=1/2
Chercher Ne pas Chercher
Aider 3 , 2 -1 , 3
Ne pas aider -1 , 1 0 , 0
Chomeur
α =1/5 1-α=4/5
β=1/2
1- β=1/2
Dans ce jeu le chômeur va chercher 1 fois / 5  α=1/5 Et le Gouvernement va
aider 1 fois / 2  β =1/2 , Une fois on a trouver les α et β ce qui est intéressant
On va calculer pour ces deux joueurs la valeur de jeu dans le cade d’un équilibre en
stratégie mixte : il suffit de reprendre les espérance mathématique des deux joeurs :
Esp-chom= 2αβ + 1*α(1 – β)+ 3(1-α) β +0(1- β) (1-α) = 1,5
et Esp-Gvrn = 3αβ -1*α(1- β) –1(1-α) β +0(1- β) (1-α) = -1/5
En jouant ce jeu le chomeur espère gagner 1,5 et le Gvrnm -1/5
Par ces valeurs le chômeur et le Gvrnmt auraient pu eviter des valeur
catastrophiques (Dégâts) 0 pour le chômeur et  – 1 pour le Gvrnmt
Jeu en Stratégies Mixtes
joueur A
1) Existe-t-il un équilibre de Nash en stratégie pure ?
2) Trouver une équilibre en stratégie mixte
En précisant la valeurs du jeux en stratégie mixte pour chaque joueur
Comparer chaque valeur avec celle du pire des cas en stratégie pure
(1,2) (0,4)
(0,5) (3,2)
U
D
L R
Considérons un nouveau jeu...
joueur B
Jeu en Stratégies Mixtes
Exercice
joueur A
(1,2) (0,4)
(0,5) (3,2)
U 3/5
D 2/5
L 3/4 R 1/4
joueur B
Réponse:
1) Non
2) Esperance de A = 2*Pa*Pb + 4*(1-Pa)*Pb + 5*Pa*(1-Pb) + 2*(1-
Pa)*(1-Pb)
Esperance de B = 1*Pa*Pb + 0*(1-Pa)*Pb + 0*Pa*(1-Pb) + 3*(1-
Pa)*(1-Pb)
simplifier EspA et EspB puis calculer Pb et Pa telle que les
dérivées d(EspA)/d(Pa)=0 et d(EspB)/d(Pa)=0
Proba : Pb=3/5 et proba Pa=3/4
val de B = 2*3/4*3/5 + 4*1/4*3/5 + 5*3/4*2/5 + 2*1/4*2/5
Solution
Jeu en Stratégies Mixtes

Contenu connexe

Dernier

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Coursebenezerngoran
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 

Dernier (18)

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 

En vedette

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

En vedette (20)

Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 

Cours_théorie_de_jeux

  • 1. Filière (DUT) : Développement Web et Multimédia-S1 Année Universitaire : de 2020 – 2022 au 2023 – 2024 Diaporamas du cours : Théorie de graphe & théorie de jeux Préparé par : Idriss CHANA Enseignant chercheur au Département Génie Informatique, EST-UMI Meknès Email : i.chana@umi.ac.ma Au Profit des Etudiants de La Première Année de la filière DWM inscrits en semestre S1
  • 2. Théorie des graphes et théorie des jeux Théorie des jeux
  • 3. Plan de cours • Définition de jeux, forme normale et extensive • les jeux simultanés ( statiques informations imparfaites) • les jeux séquentiels (dynamiques information parfaites) • Résolution et équilibre du jeu: - équilibre de Nash, - le dilemme du prisonnier, - Stratégie dominante, - Jeu de la poule mouillée, • Fonctions de meilleures réponses, • jeu en stratégies pures et jeu en stratégies mixtes
  • 4. • Un jeu se compose de : – Un ensemble de joueurs. – Un ensemble de stratégies/ Actions pour chaque joueur. – Des gains/ Play-off associés à chaque stratégie des joueurs. Qu’est ce qu’un jeu ?
  • 5. Exemple très simple de jeu entre 2 agents (sous forme normale )
  • 6. Jeu à 2 joueurs avec 2 stratégies possibles • Les joueurs s’appellent A et B. • Le joueur A a deux stratégies : “up” ou “down”. • Le joueur B a deux stratégies : “Left” ou “Right”. • La matrice des gains est représentée comme suit : Exemple Joueur B Joueur A L R U D (3,9) (0,0) (1,8) (2,1)
  • 7. Joueur B Joueur A Les gains du joueur A sont (ici, ) L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 8. Joueur B Joueur A Les gains du joueur B sont ( , ici) L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 9. Exemple : Si A joue Up et B joue Right alors A gagne 1 et B gagne 8 Joueur B Joueur A L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 10. Joueur B Joueur A Une situation de jeu est une paire (ex : (U,R) ) où le premier élément (U) est la stratégie choisie par le joueur A et le deuxième élément (R) est la stratégie choisie par le joueur B L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 11. Quel est le résultat de ce jeu ? Joueur B Joueur A L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 12. Joueur B Joueur A (U,R) est-il un résultat possible ? L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 13. Joueur B Joueur A Si B joue R (right)alors la meilleure réponse de A est D (down). Ainsi les gains de A passeront de 1 à 2.  Donc (U,R) n’est pas possible. L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux (U,R) est-il un résultat possible ?
  • 14. Joueur B Joueur A (D,R) est-il un résultat possible ? L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 15. Joueur B Joueur A Si B joue R(right) alors la meilleure réponse de A est D(down). L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux (D,R) est-il un résultat possible ?
  • 16. Joueur A Si B joue Right alors la meilleure réponse de A est Down. Si A joue Down alors la meilleure réponse de B est Right. Donc, (D,R) est possible. L R U D (3,9) (0,0) (1,8) (2,1) (D,R) est-il un résultat possible ? Théorie des jeux Joueur B
  • 17. Joueur B Joueur A (D,L) est-il un résultat possible ? L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 18. Joueur B Joueur A Si A joue D(down), la meilleure réponse de B est R, donc (D,L) n’est pas possible. L R U D (3,9) (0,0) (1,8) (2,1) (D,L) est-il un résultat possible ? Théorie des jeux
  • 19. Joueur B Joueur A (U,L) est-il un résultat possible ? L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 20. Joueur B Joueur A Si A joue U(up), la meilleure réponse de B est L(left). Si B joue L (left), la meilleure réponse de A est U(up). Donc (U,L) est possible. L R U D (3,9) (0,0) (1,8) (2,1) (U,L) est-il un résultat possible ? Théorie des jeux
  • 21. Un jeu en forme normale est décrit comme suit: 1. Un ensemble de N joueurs, J ≡ {1,2,…,N} 2. Chaque joueur i, i J a un ensemble d’actions ( Strategies) Ai qui est l’ensemble de toutes les actions possibles pour i. Soit ai Ai, une action ( Strategie ) particulière de Ai. On appelle ai un résultat du jeu 3. Chaque joueur a une fonction de payoff, Πi qui assigne un nombre réel Πi(a), à chaque action du joueur i.  Théorie des jeux: notation  Joueur B Joueur A L R U D (3,9) (0,0) (1,8) (2,1) 1) J= {Joueur A, Joueur B} 2) S1 = S Joueur A= {U, D}; S2= S Joueur B= {L,R} 3) Π1 (U)= 3 ou 1 Π1 (D)= 0 ou 2 Π2 (L)= 9 ou 0 Π2 (R)= 8 ou 1
  • 22. Théorie des jeux : Exercice 1 Dilemme du prisonnier Enoncé: Deux suspects Ali et Fahd sont arrêtés par la police, mais la police manque de preuve pour les emprisonner. La police doit les faire avouer:  Si les deux avouent, ils auront chacun 4 ans de prison  si l’un avoue et l’autre nie,  Celui qui a avoué encourera 1 an de prison  L’aute qui a nié encourera 10 ans de prison  si les deux nient, ils auront chacun 2 ans de prison Questions : 1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions) 2) Représenter le jeu sous forme normale 3) Jouer le jeu: Qu’il sera le résultat de ce jeu ( nombre d’années de prison )?, Peut on l’améliorer ? Comment ?
  • 23. Fahd avoue nie Ali avoue (4;4) (1;10) nie (10;1) (2;2) 1) L’ensemble de joueurs J ={ Ali, Fahd} L’ensemble de Stratégies ( Actions) A1 = A2 ={avoue, nie} 2) La forme normale de ce jeu est : Solution 3) Le résultat de jeu est (avoue,avoue)  (4,4) , oui on peut l’améliorer si les deux prisonniers coopèrent Théorie des jeux : Exercice 1 Dilemme du prisonnier
  • 24.  Information parfaite/imparfaite  Forme extensive  Jeu séquentiel  Jeu Simultané
  • 25. On parle de jeu à information parfaite dans le cas de jeu sous forme extensive, où chaque joueur a une connaissance parfaite de toute l'histoire du jeu.: On dit alors qu'un jeu est à information complète si chaque joueur connaît lors de la prise de décision : • Ses possibilités d'action • Les possibilités d'action des autres joueurs • Les gains résultants de ces actions Un jeu à information incomplète est aussi à information imparfaite - Les échecs sont à information complète et parfaite - Le jeu de Poker : est à information incomplète et imparfaite Information parfaite ( jeu séquentiel) Théorie des jeux: Information parfaite/imparfaite
  • 26. Forme extensive : est un arbre (graphe connexe sans cycle) représentant les déroulements possibles du jeu.:  à chaque Sommet non terminal est associé un joueur : arrivé à ce point du jeu c'est à son tour de jouer.  Chaque arc représente chacune des actions (coups autorisés par la règle) que ce joueur peut prendre à ce point du jeu.  à chaque sommet terminal correspond un résultat du jeu donné par vecteur des paiements (liste des gains attribués à chaque joueur). Théorie des jeux: Forme extensive Définition
  • 27. Théorie des jeux: Forme extensive Représentation Graphique
  • 28. Bihi Ali U D U D (3;9) L R (0;0) (1;8) (2;1) Théorie des jeux: Forme extensive A et B jouent en même temps Le trait …… Signifie que le jeu est simultané : c’est à dire Ali ne connait pas l’action de Bihi Bihi Ali L R U D (3,9) (0,0) (1,8) (2,1) B A1 U D U D (3;9) L R (0;0) (1;8) (2;1) A joue après B Si le jeu est séquentiel et Ali connait l’action de Bihi. la forme extensive du jeu sera comme suit: A2 Représentation Graphique : Exemples Trait signifiant que le jeu est simultané
  • 29. • Enoncé : Il s’agit d’ un jeu entre deux enfants Ali et leila, les deux choisissent un objet parmi les 3 suivant : papier, ciseau et caillou. Selon ces choix, soit l’enfant gagne le jeu soit il n y a pas de gagnant( s’ils choisissent le même objet) . • Papier gagne contre caillou , ciseau gagne contre papier et caillou gagne contre ciseau. Soit 2 le gain de l’enfant qui gagne, 0 le gain de celui qui perd et 1 le gain en cas d égalité. Questions : 1) Donner l’ensemble de joueurs et l’ensemble de stratégies ( actions) de chaque joueur. 2) Représenter le jeu simultané en forme normale 3) Représenter le jeu simultané en forme extensive 4) Même question que (3) si Ali triche et observe le choix de Leila avant de jouer 5) Même question que (3) si Ali n’ observe le choix de Leila que s’elle choisit caillou Théorie des jeux: Forme extensive papier, ciseau et caillou Exercice 2
  • 30. Théorie des jeux: Forme extensive Exercice 2 papier, ciseau et caillou Solution
  • 32. Les étapes de résolutions d’un jeu sont comme suit 1. Identifier les décisions de A  Meilleure décision de A, compte tenu des décisions de B1  Meilleure décision de A, compte tenu des décisions B2,  Etc …. 2. Identifier les décisions de B  Meilleure décision de B, compte des décisions A1  Meilleure décision de B, compte des décisions A2,  etc… 3. On caractérise la solution du jeu, si elle existe Résolution d’un jeu et Equilibre
  • 33. Matrice des gains Ent. B Qd Qe Ent. A Qd (2, 2) (15,0) Qe (0,15) (10,10) Exemple de Résolution d’un jeu (1/5) 1. Seules les décisions de A sont prises en compte 2. Seules les décisions de A sont retenues si B choisit Qd 3. On retient la décision qui génère le plus gros gain * Résolution d’un jeu et Equilibre
  • 34. Matrice des gains Ent. B Qd Qe Ent. A Qd (2, 2) (15,0) Qe (0,15) (10,10) 1. Seules les décisions de A sont prises en compte 2. Seules les décisions de A sont retenues si B choisit Qe 3. On retient la décision qui génère le plus gros gain (*) * * Résolution d’un jeu et Equilibre Exemple de Résolution d’un jeu (2/5)
  • 35. Matrice des gains Ent. B Qd Qe Ent. A Qd (2, 2) (15,0) Qe (0,15) (10,10) 1. Seules les décisions de B sont prises en compte 2. Seules les décisions de B sont retenues si A choisit Qd 3. On retient la décision qui génère le plus gros gain (*) * * * Résolution d’un jeu et Equilibre Exemple de Résolution d’un jeu (3/5)
  • 36. Matrice des gains Ent. B Qd Qe Ent. A Qd (2, 2) (15,0) Qe (0,15) (10,10) 1. Seules les décisions de B sont prises en compte 2. Seules les décisions de B sont retenues si A choisit Qe 3. On retient la décision qui génère le plus gros gain(*) * * * * Résolution d’un jeu et Equilibre Exemple de Résolution d’un jeu (4/5)
  • 37. Matrice des gains Ent. B Qd Qe Ent. A Qd (2, 2) (15,0) Qe (0,15) (10,10) 1. Un jeu a un équilibre quand il génère une convergence des décisions stratégiques 2. Le couple de stratégies (Qd;Qd) est la solution du jeu * * * * Résolution d’un jeu et Equilibre Exemple de Résolution d’un jeu (5/5)
  • 38. Airbus P NP Boeing P (-1,-1) (10,0) NP (0,10) (0,0) Soient les deux société de l’aéronautique Boeing et Airbus qui décide de Produire ou de Ne pas produire avec des play-off décrits selon un jeu dont la forme normale est la suivante: Résolution d’un jeu et Equilibre : Exercice 3 Faites la résolution de ce jeu et trouver son équilibre
  • 39. Airbus P NP Boeing P (-1,-1) (10,0) NP (0,10) (0,0) 1. Seules les décisions de Boeing sont prises en compte 2. Seules les décisions de Boeing sont retenues si Airbus choisit de produire 3. On retient la décision qui génère le plus gros gain * Résolution d’un jeu et Equilibre : solution (1/5)
  • 40. Airbus P NP Boeing P (-1,-1) (10,0) NP (0,10) (0,0) 1. Seules les décisions de Boeing sont prises en compte 2. Seules les décisions de Boeing sont retenues si Airbus chosit de ne pas produire 3. On retient la décision qui génère le plus gros gain * * Résolution d’un jeu et Equilibre : solution (2/5)
  • 41. Airbus P NP Boeing P (-1,-1) (10,0) NP (0,10) (0,0) 1. Seules les décisions de Airbus sont prises en compte 2. Seules les décisions de Airbus sont retenues si Boeing choisit de produire 3. On retient la décision qui génère le plus gros gain * * * Résolution d’un jeu et Equilibre : solution (3/5)
  • 42. Airbus P NP Boeing P (-1,-1) (10,0) NP (0,10) (0,0) 1. Seules les décisions de Airbus sont prises en compte 2. Seules les décisions de Airbus sont retenues si Boeing choisit de ne pas produire 3. On retient la décision qui génère le plus gros gain * * * * Résolution d’un jeu et Equilibre : solution (4/5)
  • 43. Airbus P NP Boeing P (-1,-1) (10,0) NP (0,10) (0,0) Ce jeu a deux équilibres (convergence des décisions stratégiques)  Le couple de tratégies (P;NP) est le premier équilibre du jeu  Le couple de stratégies (NP;P) est le deuxième équilibre du jeu. * * * * Résolution d’un jeu et Equilibre : solution (5/5)
  • 44. Joueur 2 S1 S2 Joueur 1 S1 (0,10) (10,0) S2 (10,0) (0,10) Exemple de jeu sans équilibre Faites la résolution de ce jeu et trouver son équilibre 1/2
  • 45. Joueur 2 S1 S2 Joueur 1 S1 (0,10) (10,0) S2 (10,0) (0,10) Exemple de jeu sans équilibre * * * * 2/2 Puisque il n y a pas de convergence de stratégie, ce jeu est un jeu sans équilibre
  • 46. Stratégie dominante ( Dominée) EISD et équilibre du Nash
  • 47. Notations Stratégie Dominante/ Dominée, EISD et équilibre du Nash Un jeu en forme normale est décrit comme suit :  Un ensemble de N joueurs, J ≡ {1,2,…,N}  Chaque joueur J a un ensemble m de Stratégies SJ = {sJ1,sJ2, ..sJm}  Chaque joueur J a une fonction de payoff(gain), ΠJ qui assigne un nombre réel ΠJ(SJ), à chaque action du joueur J. soient : - si un profil de stratégies {s1,…..sn} / qlq soit i, si ∊à Si - s-i ( s indice –i ) le profil de stratégies autres que celles du joueur J : s-i = {s1,……Si-1,Si+1, ……sN} ( N est le nombre de joueur)  On note S l’espace des stratégies ie : S = S1xS2x ……xSN
  • 48. Principe Une stratégie n’est jamais jouée si une autre assure un gain meilleure dans tous les cas X Y U (5 ,3) (4,2) V (3,6) (7, 1) J2 J1 Stratégie dominée de J2 Stratégie dominante de J2 Π2 (U , X ) > Π2 (U,Y ) Π2 (V , X ) > Π2 (V,Y ) Stratégie dominée/dominante Incomparables: Pas de stratégie dominante ni Dominée pour J1 Π1 (U , X ) > Π1 (V,X ) Π1 (U, Y ) < Π1 (V,Y ) J2 J1 Stratégie dominante/ Dominée, EISD et équilibre du Nash Définition:  Une stratégie sd est (strictement) dominée : pour le joueur J, s il existe une stratégie si telle que pour tous les gains générés par les stratégies autre que sd ( qu on note par s-i ) on a : ΠJ (si , s-i ) > ΠJ (sd , s-i ) • Une stratégie sf est faiblement dominée pour le joueur i s il existe une stratégie s’i telle que pour tous les gains correspondant à s-i on a ΠJ (si , s-i ) ≥ ΠJ (sd , s-i ) ( sup. ou égal)
  • 49. Equilibre en Stratégie dominante Stratégie dominante/ Dominée, EISD et équilibre du Nash Player 1 u v x 4,2 3,6 y 2,5 1,8 Player 2 s 3,1 3,0 z 8,1 4,2 6,0 Π2 (x,v ) > Π2 (x,u ) Π2 (x ,v ) > Π2 (x,s ) Π2 (y , v ) > Π2 (y,u ) Π2 (y , v ) > Π2 (y,s) Π1 (z , u ) > Π1 (y, u) Player 1 Player 2 Π1 (z , u ) > Π1 (x,u ) Π2 (z , v ) > Π2 (z,u) Π2 (z , v ) > Π2 (z,s) Π1 (z , v ) > Π1 (y, v) Π1 (z , v ) > Π1 (x,v ) Π1 (z , s ) > Π1 (y, s) Π1 (z , s ) > Π1 (x,s ) % U de Player 2 % X de Player 1 % S de Player 2 % V de Player 2 % Y de Player 1 % Z de Player 1  La stratégie Z domine pour Player1  La stratégie V domine pour Player 2 4,2 L’équilibre en Stratégie Dominante existe et vaut ( z,v) avec une utilité de  (4,2) % = par rapport à
  • 50. Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 51. Introduction a `la The´orie des Jeux – p.20/77 Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 52. Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 53. Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Une stratégie si est (strictement) dominée pour le joueur i si il existe une stratégie si J telle que pour tous les profils s−i Π i (si J , s−i ) > Π i (si , s−i ) --( > strict. Sup) Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 54. Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Une stratégie si est faiblement dominée pour le joueur i si il existe une stratégie si J telle que pour tous les profils s−i Π i (si J , s−i ) ≥ Π i (si , s−i ) -- (≥ Sup. ou egal) Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 55. Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 56. Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 57. Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 58. Introduction a `la The´orie des Jeux – p.21/77 Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 59. Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,3 Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 60.  Un jeu est dit résolvable par élimination itérative des stratégies dominées, si on obtient un unique profil en éliminant successivement des stratégies (strictement) dominées.  Les profils obtenus aprés élimination itérative des stratégies (strictement) dominées (EISSD) ne dépendent pas de l’ordre choisi pour l’élimination des stratégies.  Par contre, on peut obtenir des profils différents lorsque l’on choisit des ordres différents pour l’élimination itérative de stratégies faiblement dominées (EISFD).  Les résultats obtenus par EISSD sont donc plus robustes que ceux obtenus par EISFD.  Problème majeur de cette méthode: tous les jeux ne sont pas résolvable par EISD ! Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 61. Exercices :: Pour les 3 jeux sous forme normale ci-dessous 1) Y a t il un équilibre en stratégie dominante 2) Existe-t-il un équilibre en EISD ( Elimination Itérative de Stratégie Dominées ) X Y Z X 3 , 6 5,7 4,5 Y 5 ,1 6,2 6,1 Z 6 , 0 8,9 3,6 Joueur B Jeu 1 Dilemme de prisonniers St Y bas Haut St X bas 40,30 45,10 Haut 20,60 50,50 Jeu 2 2 sociétés Jeu 3 Joueur A Stratégie dominante/ Dominée, EISD et équilibre du Nash Equilibre en Elimination de Stratégies Dominées
  • 62. Fahd avoue nie Ali avoue (-4;-4) (-1;-10) nie (-10;-1) (-2;-2) 1) Vérifions qu’il y a un équilibre en stratégie dominante Donc avoue est une stratégie dominante pour Ali Pour Ali  (Πali(avoue , avoue ) > Πali(nie , avoue ) et (Πali(avoue , nie ) > Πali(nie , nie ) Pour Fahd  (Πfahd(avoue , nie ) > Πfahd(nie , nie ) et (Πfahd(avoue , avoue ) > Πfahd(nie , avoue ) Donc avoue est une stratégie dominante pour Fahd Résultat , il y a un équilibre en stratégie dominante  ( avoue,avoue) Jeu1: Dilemme de prisonniers Equilibre en Elimination de Stratégies Dominées Stratégie dominante/ Dominée, EISD et équilibre du Nash Correction
  • 63. Fahd avoue nie Ali avoue (-4;-4) (-1;-10) nie (-10;-1) (-2;-2) 2) Vérifions qu’il y a un équilibre par EISSD Donc nie est une stratégie dominée pour Ali Pour Ali  (Πali(nie , nie ) < Πali(avoue , nie ) et Πali(nie , avoue ) < (Πali(avoue , avoue ) Pour Fahd  ( Πfahd(nie , nie ) < Πfahd(avoue , nie ) et (Πfahd(nie , avoue ) < Πfahd(avoue , avoue ) Donc nie est une stratégie dominée pour Fahd Résultat , il y a un équilibre en EISSD  ( avoue,avoue) Jeux Dilemme de prisonniers Remarque : un équilibre en Stratégie Dominante est un Equilibre en EISSD, l’inverse n’est pas vrai Correction (Suite) Equilibre en Elimination de Stratégies Dominées Stratégie dominante/ Dominée, EISD et équilibre du Nash
  • 64. 1) Vérifions qu’il y a un équilibre en stratégie dominante Alors : Les deux stratégies sont incomparable il n y a pas une stratégie dominante pour Stx Pour St X  (Πstx(bas , bas) =40) > ( Πstx(haut , bas ) =20) et (Πstx(bas , haut ) = 45 ) < ( Πstx(haut , haut)=50 ) Pour St y  (Πsty(bas , bas ) =30) > (Πsty(haut , bas )=10) et (Πsty (bas, haut)=60) > Πsty(haut , bas ) = 50) Donc bas est une stratégie dominante pour Sty Résultat , il y a pas d équilibre en stratégie dominante pour ce jeu Jeu 2 : 2 sociétés St Y bas Haut St X bas 40,30 45,10 Haut 20,60 50,50 Correction (Suite) Equilibre en Elimination de Stratégies Dominées Stratégie dominante/ Dominée, EISD et équilibre du Nash
  • 65. 2) Vérifions qu’il y a un équilibre en EISSD Donc Haut est strictement dominée par bas pour Stx Pour St X  (( Πstx(haut , bas ) =20 < Πstx(bas , bas) =40) ) Rationalité St Y ne jouera jamais Haut Pour St y  ((Πsty(haut , bas )=10) < Πsty(bas , bas ) =30) et (Πsty(haut , bas ) = 50) < Πsty (bas, haut)=60) Donc haut est une stratégie dominée pour St Y Résultat : l’ équilibre par EISD pour ce jeu est ( bas, bas ) St Y bas Haut St X bas 40,30 45,10 Haut 20,60 50,50 Jeu 2 : 2 sociétés Correction (Suite) Equilibre en Elimination de Stratégies Dominées Stratégie dominante/ Dominée, EISD et équilibre du Nash
  • 66. 1) Vérifions qu’il y a un équilibre en stratégie dominante Pour A  (ΠA(X , X) =3) < ( ΠA(Y , X ) =20 ) < ΠA(Z , X ) =6 ) et (ΠA(X , Z) =4) > ( ΠA(Z , Z ) =3 )) X Y Z X 3 , 6 5,7 4,5 Y 5 ,1 6,2 6,1 Z 6 , 0 8,9 3,6 Joueur B Joueur A Incomparable donc il n y a pas d équilibre en stratégie dominante 2) Vérifions qu’il y a un équilibre en EISSD Jeu 3 : Correction (Suite) Equilibre en Elimination de Stratégies Dominées Stratégie dominante/ Dominée, EISD et équilibre du Nash
  • 67. J A: 5>3 , 6>5 6 > 4 donc la stratégie X est dominée par Y pour le joueur A J B: 2>1 9 > 6 donc la stratégie Z est dominée par Y pour le joueur B J A: 6>5 , 8>6 donc la stratégie Y est dominée par Z pour le joueur A J B: 9>0 donc la stratégie X est dominée par Y pour le joueur B Résultat : Existance de l Equilibre en EISSD  (z,y) 2) Vérifions qu’il y a un équilibre en EISSD Jeu 3 : Correction (Suite) Equilibre en Elimination de Stratégies Dominées Stratégie dominante/ Dominée, EISD et équilibre du Nash
  • 68. • Une situation ( Profil) du jeu où chaque stratégie est la meilleure réponse à l’autre est un équilibre de Nash. • L’équilibre de Nash est une situation où aucun joueur ne peut améliorer sa situation en changeant unilatéralement de stratégie, compte tenu des décisions de l’autre joueur Équilibre de Nash
  • 69. u v w x 3,0 0,3 0,4 y 2,0 1,2 2,0 z 0,3 0,2 3,0 Introduction a `la The´orie des Jeux – p.23/77 Joueur 2 Joueur 1 (Y,V) est un equilibre de Nash Équilibre de Nash
  • 70. u v w x 3,0 0,3 0,4 y 2,0 1,2 2,0 z 0,3 0,2 3,0 Introduction a `la The´orie des Jeux – p.23/77 Joueur 2 Joueur 1  Rappel : l’équilibre de Nash est une situation telle qu’aucun joueur n’a pas intérêt à dévier (seul) de la situation obtenue.  Un équilibre de Nash est un profil de stratégies s∗ = { s∗ 1 , . . . , s∗ n } tel que pour tout joueur i, pour toute stratégie sJ ∈ Si : Πi (s*i , s*-i ) ≥ Πi (sJ,s*-i ) Équilibre de Nash (Y,V) est un équilibre de Nash
  • 71.  Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées (EISSD) est un équilibre de Nash (et c’est le seul équilibre du jeu).  Un jeu (en stratégies pures) peut avoir plusieurs équilibres de Nash, comme il peut aussi n’en avoir aucun !  Deux équilibres de Nash s∗ et sJ∗ sont équivalents si ils donnent la même utilité à tous les joueurs, i.e. pour tout i ∈ N Πi (s∗ ) = Πi (sJ∗ ). Propriétés Équilibre de Nash  Question: comment choisir un équilibre particulier lorsqu’il y en a plusieurs ?
  • 72. Joueur B Joueur A (U,L) et (D,R) sont deux “équilibres de Nash” pour ce jeu L R U D (3,9) (0,0) (1,8) (2,1) Équilibre de Nash Exemple 1
  • 73. joueur B joueur A (U,L) et (D,R) sont des équilibres de Nash pour ce jeu. Mais, lequel va apparaître ? Nous remarquons que (U,L) est préféré à (D,R) par les deux joueurs. Pour autant est-ce que (U,L) va apparaître ? L R U D (3,9) (0,0) (1,8) (2,1) Équilibre de Nash Exemple 1 ( suite)
  • 74. deux approches pour déterminer laquelle de ces stratégies équilibrées est la plus plausible : 1. La stabilité : Les joueurs peuvent opter pour l'équilibre de Nash qui semble le plus stable, c'est-à-dire celui où aucune des parties n'a une forte incitation à dévier de sa stratégie. 2. La convention : Les joueurs peuvent convenir à l'avance d'une stratégie particulière en cas de multiples équilibres de Nash. Cette approche peut découler de négociations, d'accords ou de règles établies à l'avance pour résoudre les situations d'équilibre multiple. Équilibre de Nash Réponse : Lorsqu'un jeu contient deux équilibres de Nash ou plus , on parle d'équilibre multiple les joueurs peuvent avoir plusieurs stratégies optimales,
  • 75. l’exemple de Duopole: Matrice des gains Ent. B Qd Qe Ent. A Qd 2,2 15,0 Qe 0,15 10,10 Un joueur peut-il seul améliorer sa position ? L’entreprise A ? L’entreprise B ? Puisque aucun joueur ne peut améliorer sa situation, il s’agit d’un équilibre de Nash Équilibre de Nash Exemple 2
  • 76. Efficacité de l’équilibre L’exemple de Duopole: Matrice des gains Ent. B Qd Qe Ent. A Qd 2,2 15,0 Qe 0,15 10,10 L’équilibre de Nash est «Qd-Qd» mais n’est pas collectif Si le nombre d’agents est restreint, la rationalité individuelle n’amène pas forcement au bien être collectif l’ optimal est: Exemple 2 ( suite)
  • 77. L’exemple de Duopole: Matrice des gains Ent. B Qd Qe Ent. A Qd 2,2 15,0 Qe 0,15 10,10 Remarquons que puisque les gains en cas d’entente sont supérieurs au gains sans entente, il s’agit d’un jeu de coordination. Un jeu de coordination est un jeu où les paiements (gains) sont plus élevés quand les joueurs peuvent coordonner leurs stratégies. Efficacité de l’équilibre Exemple 2 ( suite)
  • 78. Ce Jeu a t- il l’ Equilibre de Nash ? A B (6,6) (1,10) (10,1) (-20,-20) Coopère Trahit Coopère Trahit Le jeu de la poule mouillée Oui : 2 Equilibres de Nash : La stratégie dominante Exercice (Coopère, Trahir) avec un gain de (10,1) ou (Trahir, Coopère) avec un gain (1,10) - Dans ces deux équilibres de Nash, toujours un joueur se trouve défavorisé devant l’autre mais si on choisit tous les deux (Coopère, Coopère) après discussion et coordination, même si ce n’est pas un équilibre de Nash on peut optimiser nos gain collectifs.
  • 79. Equilibre de Nash et Jeu séquentiel (sous forme extensive)
  • 80. • Dans nos deux exemples, les joueurs jouaient simultanément. • Il existe des jeux où les joueurs jouent l’un après l’autre : jeux séquentiels. • Le joueur qui joue en premier est le leader, celui qui joue en deuxième est le follower. Jeu séquentiel: Rappel
  • 81. • Parfois, un jeu a plusieurs équilibres de Nash et il est difficile de savoir lequel va sortir du jeu… • En revanche, quand un jeu est séquentiel, il est possible de dire quel équilibre de Nash va sortir du jeu. Exemple
  • 82. joueur B joueur A (U,L) et (D,R) sont deux équilibres de Nash quand le jeu est simultané. Et, il est impossible de savoir quel équilibre va arriver. L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 83. joueur B joueur A Supposons maintenant que le jeu est séquentiel : A est le leader et B le follower. Nous pouvons réécrire ce jeu sous sa forme extensive… L R U D (3,9) (0,0) (1,8) (2,1) Théorie des jeux
  • 84. U D L L R R (3,9) (1,8) (0,0) (2,1) A B B A jour en premier B jour en second Théorie des jeux
  • 85. U D L L R R (3,9) (1,8) (0,0) (2,1) A B B (U,L) est un équilibre de Nash (D,R) est un équilibre de Nash Quel est celui qui va sortir du jeu? Théorie des jeux
  • 86. U D L L R R (3,9) (1,8) (0,0) (2,1) A B B Si A joue U alors B joue L; A gagne 3. Si A joue D alors B joue R; A gagne 2. Donc (U,L) est l’équilibre de Nash qui sortira Théorie des jeux
  • 88.  La fonction de meilleure réponse du joueur i est la fonction Bi qui associe à chaque combinaison de stratégies des autres joueurs s−i les stratégies du joueur i qui maximise son utilité:  Un équilibre de Nash est un profil s∗ tel que la stratégie du joueur i est une meilleure réponse: fonction de meilleure réponse Équilibre de Nash S*i ∈ Bi (s*−i ) pour tout i ∈ N Bi (s−i ) = {si ∈ Si t.q. Πi (si , s−i ) ≥ Πi (sJ i , s−i ) pour tout sJ i ∈ Si }
  • 89. • Soit un jeu 2×2; i.e., un jeu avec deux joueurs A et B, qui ont chacun deux actions possibles • A peut choisir entre deux actions : aA 1 et aA 2 • B peut choisir entre deux actions aB 1 et aB 2 • Il y a 4 paires d’action possibles (aA 1, aB 1), (aA 1, aB 2), (aA 2, aB 1), (aA 2, aB 2) • Chaque paire d’action donnera des gains différents aux joueurs Fonction de meilleure réponse Équilibre de Nash A aA 1 (6 ,4) (4 , 3) (3 , 5) (5, 7) aA 2 B aB 1 aB 2
  • 90. • Supposons que les gains des joueurs A et B quand ils choisissent respectivement les actions aA 1 et aB 1 sont : ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 • De manière similaire, supposons que : ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 Fonction de meilleure réponse Équilibre de Nash
  • 91. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 Si B choisit l’action aB 1, quelle est la meilleure réponse de A ? Fonction de meilleure réponse Équilibre de Nash
  • 92. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 Si B choisit l’action aB 1, quelle est la meilleure réponse de A ? Fonction de meilleure réponse Équilibre de Nash
  • 93. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si B choisit l’action aB 1, quelle est la meilleure réponse de A est aA 1 (car 6 > 4) Fonction de meilleure réponse Équilibre de Nash
  • 94. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si B choisit l’action aB 1, la meilleure réponse de A est aA 1 (car 6 > 4) • Si B choisit l’action aB 2, quelle est la meilleure réponse de A ? Fonction de meilleure réponse Équilibre de Nash
  • 95. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si B choisit l’action aB 1, la meilleure réponse de A est aA 1 (car 6 > 4) • Si B choisit l’action aB 2, la meilleure réponse de A est aA 2 (car 5 > 3) Fonction de meilleure réponse Équilibre de Nash
  • 96. • Si B choisit aB 1 alors A choisit aA 1 • Si B choisit aB 2 alors A choisit aA 2 • La “courbe” de meilleure réponse de A est donc : Meilleures réponses de A aA 1 aA 2 aB 2 aB 1 Actions de B + + Fonction de meilleure réponse Équilibre de Nash
  • 97. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 Fonction de meilleure réponse Équilibre de Nash
  • 98. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si A choisit l’action aA 1, quelle est la meilleure réponse de B ? Fonction de meilleure réponse Équilibre de Nash
  • 99. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si A choisit l’action aA 1, la meilleure réponse de B est aB 2 (car 5 > 4) Fonction de meilleure réponse Équilibre de Nash
  • 100. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si A choisit l’action aA 1, la meilleure réponse de B est aB 2 (car 5 > 4) • Si A choisit l’action aA 2, quelle est la meilleure réponse de B ? Fonction de meilleure réponse Équilibre de Nash
  • 101. • ΠA(aA 1, aB 1) = 6 et ΠB(aA 1, aB 1) = 4 ΠA(aA 1, aB 2) = 3 et ΠB(aA 1, aB 2) = 5 ΠA(aA 2, aB 1) = 4 et ΠB(aA 2, aB 1) = 3 ΠA(aA 2, aB 2) = 5 et ΠB(aA 2, aB 2) = 7 • Si A choisit l’action aA 1, la meilleure réponse de B est aB 2 (car 5 > 4) • Si A choisit l’action aA 2, la meilleure réponse de B est aB 2 (car 7 > 3) Fonction de meilleure réponse Équilibre de Nash
  • 102. • Si A choisit aA 1 alors B choisit aB 2 • Si A choisit aA 2 alors B choisit aB 2 • La courbe de meilleure réponse de B est donc : Actions de A aA 1 aA 2 aB 2 aB 1 Meilleures réponses de B Fonction de meilleure réponse Équilibre de Nash
  • 103. aA 1 aA 2 aB 2 aB 1 Notons que aB 2 est une action strictement dominante pour B • Si A choisit aA 1 alors B choisit aB 2 • Si A choisit aA 2 alors B choisit aB 2 • La courbe de meilleure réponse de B est donc : Actions de A Meilleures réponses de B Fonction de meilleure réponse Équilibre de Nash
  • 104. aA 1 aA 2 aB 2 aB 1 aA 1 aA 2 aB 2 aB 1 + + B A Réponse de A Choix de A Choix de B Réponse de B Comment peut-on utiliser les courbes de meilleures réponses pour localiser les équilibres de Nash du jeu ? Fonction de meilleure réponse Équilibre de Nash => Superposez les courbes…
  • 105. Réponse de A aA 1 aA 2 aB 2 aB 1 + + Réponse de B Existe-t-il un équilibre de Nash ? Fonction de meilleure réponse Équilibre de Nash Comment peut-on utiliser les courbes de meilleures réponses pour localiser les équilibres de Nash du jeu ? => Superposez les courbes…
  • 106. aA 1 aA 2 aB 2 aB 1 + + Oui, (aA 2, aB 2). Pourquoi ? Réponse de A Réponse de B Existe-t-il un équilibre de Nash ? Fonction de meilleure réponse Équilibre de Nash Comment peut-on utiliser les courbes de meilleures réponses pour localiser les équilibres de Nash du jeu ? => Superposez les courbes…
  • 107. aA 1 aA 2 aB 2 aB 1 + + Oui, (aA 2, aB 2). Pourquoi ? aA 2 est une meilleure réponse à aB 2 aB 2 est une meilleure réponse à aA 2 Réponse de A Réponse de B Existe-t-il un équilibre de Nash ? Fonction de meilleure réponse Équilibre de Nash Comment peut-on utiliser les courbes de meilleures réponses pour localiser les équilibres de Nash du jeu ? => Superposez les courbes…
  • 108. 6,4 3,5 5,7 4,3 aA 1 aA 2 aB 1 aB 2 Joueur B Joueur A aA 2 est la seule meilleure réponse à aB 2 aB 2 est la seule meilleure réponse à aA 2 Voici la forme stratégique du jeu Fonction de meilleure réponse Équilibre de Nash
  • 109. 6,4 3,5 5,7 4,3 aA 1 aA 2 aB 1 aB 2 Joueur B Joueur A aA 2 est la seule meilleure réponse à aB 2 aB 2 est la seule meilleure réponse à aA 2 Existe-t-il un 2eme Equilibre de Nash ? Fonction de meilleure réponse Équilibre de Nash
  • 110. 6,4 3,5 5,7 4,3 aA 1 aA 2 aB 1 aB 2 Joueur B Joueur A Existe-t-il un 2eme équilibre de Nash ? Non, car aB 2 est une action strictement dominante pour B aA 2 est la seule meilleure réponse à aB 2 aB 2 est la seule meilleure réponse à aA 2 Fonction de meilleure réponse Équilibre de Nash
  • 111. 4,2 6,5 4,4 8,3 X Y U V GP2 G1 Soit le jeu suivant sous la frome normale suivante Trouvez son équilibre de Nash par la fonction de meilleure réponse Exercice Fonction de meilleure réponse Équilibre de Nash
  • 112. 4,2 6,5 4,3 3,4 X Y U V GP2 GR1 Meilleures réponses & Équilibre de Nash Solution X Y V U • Si GP2 choisit U alors GP1 choisit X Meilleure reponse de GR1 Action de GR2 Courbe de meilleure réponse GR1 • Si GP1 choisit X alors GP2 choisit V Courbe de meilleure réponse GR2 X Y V U Action de GR1 Meilleure Rep de GR2 X Y Mei Rep GR1 Mei Rep GR2 X Y V U  Si GP2 choisit V alors GP1 choisit X  Si GP1 choisit Y alors GP2 choisit U Supperposer les courbes Equilibre de Nash
  • 114.  Une stratégie pure du joueur i est un plan d’action qui prescrit une action de ce joueur pour chaque fois qu’il est susceptible de jouer. On note par Si l’ensemble des stratégies pures du joueur i et par si une stratégie pure de ce joueur.  Une strateégie mixte du joueur i est une distribution de probabilités pi définie sur l’ensemble des stratégies pures du joueur i. On note Σ i l’ensemble des stratégies mixtes du joueur i et par σj une stratégie mixte de ce joueur i  Σ i = { σ1, σ2 ….. σq} Jeu en Stratégies Mixtes
  • 115. Définition Un équilibre de Nash en stratégies mixtes est un profil de stratégies mixtes σ∗ =(σ*i , σ*-i )∈ Σ tel que pour tout i et tout σi ∈ Σ i Π i (σ*i , σ*-i ) ≥ Π i (σi , σ*-i ) Théorème. σ∗ est un équilibre de Nash si et seulement si pour tout i et tout si ∈ Si Théorème.[Nash, 1950] : Tout jeu sous forme stratégique a un équilibre de Nash en strategies mixtes. Π i (σ*i , σ*-i ) ≥ Π i (si , σ*-i ) Jeu en Stratégies Mixtes
  • 116. Chercher Ne pas Chercher Aider 3,2 -1,3 Ne pas aider -1,1 0,0 Chomeur Gouvernement Cette matrice présente le jeu en stratégie pure ( Chercher ou non --- aider ou non) Jeu a information incomplete = jeu simultané Le gouvernement évite d’aider les chômeurs qui ne cherchent pas ou encore n’ aide pas les chômeurs qui chechent Interaction stratégique: Si on regarde les meilleur réponse Jeu en Stratégies Mixtes
  • 117. Chercher Ne pas Chercher Aider 3,2 -1,3 Ne pas aider -1,1 0,0 Chomeur Rep.G Rep. G Rep.C Rep. C Ce jeu n a pas d’equilibre en strategie pure On passe à des comportement qui ne sont pas ferme aider un peu ou beaucoup , chercher des fois des fois non etc … Donc il est possible d’avoir un équilibre à ce jeu  c’est le cœur de la problematique de la strategie mixte Si on passe à une stratégie mixe Jeu en Stratégies Mixtes
  • 118. Chercher Ne pas Chercher Aider 3,2 -1,3 Ne pas aider -1,1 0,0 Chômeur Prob α Prob (1-α) Prob β Prob 1- β ça consiste à supposer que le chômeur cherche avec une probabilité α comprise entre 0 et 1 Et le gouvernement aide avec une probabilité β ( entre 0 et 1) - par exemple aider en fonction du son budget ( 30 % ou 40% ….) La valeur de α détermine la stratégie mixte de Chômeur La valeur de β détermine la stratégie mixte de Gouvernement On a mis ces probabilités pour trouver l'Esperance mathématique des joueur pour voir comment ils se comportent Jeu en Stratégies Mixtes
  • 119. Chercher Ne pas Chercher Aider 3 , 2 -1 , 3 Ne pas aider -1 , 1 0 , 0 Chomeur Prob α Prob (1-α) Prob β Esp Math de Chomeur ? ( en Fonction de α et de ce que va jouer le gouvernement β) Esp Math de Gvrnmt ? Comment trouver l’équilible à partir de la meilleur solution ? Question qui se pose: -Dire que le chômeur va chercher avec la Proba α et le Gvrnm aide avec la Proba β. -Et surtout donner les valeur de α et β pour Prob 1- β Jeu en Stratégies Mixtes
  • 120. Chercher Ne pas Chercher Aider 3 , 2 -1 , 3 Ne pas aider -1 , 1 0 , 0 Chomeur Prob α Prob (1-α) Prob β Prob 1- β Espérance Math du Chômeur  Esp(Π Chomeur (Cherch))= 2 β+1*(1- β)= β +1 Esp( Π chomeur (Pas cherch)= 3β +0*(1- β )= 3β Jeu en Stratégies Mixtes Les fonction de réaction de Chomeur : Les meilleurs réponse du Chomeur en fonction de β Si β<1/2 Alors α =1 autrement Si le Gvrnmt n’ aide pas, le chômeur est obligé de chercher Si β>1/2 Alors α =0 autrement  Si le Gvrnmt aide, le chômeur ne cherche pas Si β =1/2 Alors α peut prendre toutes les valeurs, le chômeur est indifférent Valeur β pour l’equilibre β=1/2 Quand 3β > β +1  β >1/2  le chômeur choisira Ne Pas chercher Quand 3β < β +1  β <1/2  le chômeur choisira de chercher
  • 121. Chercher Ne pas Chercher Aider 3 , 2 -1 , 3 Ne pas aider -1 , 1 0 , 0 Chomeur Gouvernement Prob α Prob (1-α) Prob β Prob 1- β Valeur α pour l’equilibre α = 1/5 Les fonction de réaction de Gvrnmt : Les meilleurs réponse du Gvrnmt en fonction de α Si α <1/5 Alors β=0 le chômeur ne cherche pas donc le Gvrnmt n’aide pas Si α >1/5 Alors β=1 la chômeur cherche le Gvrnmt aide Si α =1/5 Alors β peut prendre toutes les valeurs, le Gvrnmt est indifférent Jeu en Stratégies Mixtes Esp Math de Gouvernmt  Esp(Π Gvrnt (aider)= 3α - (1-α) = 4 α -1 Esp( Π Gvrnt(NP aider)= -α+0*( α -1)= -α quand  4α -1 < -α ( ie α <1/5)  le Gvrn choisira d’aider quand  4α -1 > -α ( ie α >1/5)  le Gvrn choisira de ne pas aider
  • 122. Aider =Proba β Fonction de réaction de chômeur ( ces meilleurs réponse)= Les valeurs α de en fonction de β 1 Chercher =Proba α 1 1/2 0 Fonction de réaction de chômeur Si β <1/2 Chercher (α ) =1 Si β >1/2 ne pas Chercher (α )=0 Fonction de réaction de chômeur ( ces meilleurs réponse)= Les valeurs β de en fonction de α Aider =Proba β 1 Chercher =Proba α 1 0 Fonction de réaction de Gouvernement Si α <1/5 ne pas aider (β) = 0 Si α >1/5 aider (β) =1 1/5 1/2 Jeu en Stratégies Mixtes Σ = { Σ C h o m , Σ G v n n t } d ’ o ù - Σ c h o m = ( σ1 1 , σ1 2 ) = ( 1/5 *chercher , 4/5 * ne pas chercher ) - Σ G v n t = ( σ2 1 , σ2 2 ) = ( 1/2 aider , 1/2 * ne pas aider)
  • 123. Aider =Proba β 1 Chercher =Proba α 1 0 ON croise les meilleures réponses 1/5 1/2 Fonction de réaction de Gouvernement Fonction de réaction de chômeur Equilibre en stratégies Mixte (1 /2 , 1/5) Donc il y a une seule valeur pour laquelle il y a une double meilleure réponse c’est β =1/2 et α=1/5 là ou se coupent les courbes nous donne l’équilibre en Stratégie mixte Jeu en Stratégies Mixtes Chercher Ne pas Chercher Aider 3 , 2 -1 , 3 Ne pas aider -1 , 1 0 , 0 Chomeur Gvrnmt α= 1/5 1-α=4/5 β =1/2 1- β=1/2
  • 124. Chercher Ne pas Chercher Aider 3 , 2 -1 , 3 Ne pas aider -1 , 1 0 , 0 Chomeur α =1/5 1-α=4/5 β=1/2 1- β=1/2 Dans ce jeu le chômeur va chercher 1 fois / 5  α=1/5 Et le Gouvernement va aider 1 fois / 2  β =1/2 , Une fois on a trouver les α et β ce qui est intéressant On va calculer pour ces deux joueurs la valeur de jeu dans le cade d’un équilibre en stratégie mixte : il suffit de reprendre les espérance mathématique des deux joeurs : Esp-chom= 2αβ + 1*α(1 – β)+ 3(1-α) β +0(1- β) (1-α) = 1,5 et Esp-Gvrn = 3αβ -1*α(1- β) –1(1-α) β +0(1- β) (1-α) = -1/5 En jouant ce jeu le chomeur espère gagner 1,5 et le Gvrnm -1/5 Par ces valeurs le chômeur et le Gvrnmt auraient pu eviter des valeur catastrophiques (Dégâts) 0 pour le chômeur et  – 1 pour le Gvrnmt Jeu en Stratégies Mixtes
  • 125. joueur A 1) Existe-t-il un équilibre de Nash en stratégie pure ? 2) Trouver une équilibre en stratégie mixte En précisant la valeurs du jeux en stratégie mixte pour chaque joueur Comparer chaque valeur avec celle du pire des cas en stratégie pure (1,2) (0,4) (0,5) (3,2) U D L R Considérons un nouveau jeu... joueur B Jeu en Stratégies Mixtes Exercice
  • 126. joueur A (1,2) (0,4) (0,5) (3,2) U 3/5 D 2/5 L 3/4 R 1/4 joueur B Réponse: 1) Non 2) Esperance de A = 2*Pa*Pb + 4*(1-Pa)*Pb + 5*Pa*(1-Pb) + 2*(1- Pa)*(1-Pb) Esperance de B = 1*Pa*Pb + 0*(1-Pa)*Pb + 0*Pa*(1-Pb) + 3*(1- Pa)*(1-Pb) simplifier EspA et EspB puis calculer Pb et Pa telle que les dérivées d(EspA)/d(Pa)=0 et d(EspB)/d(Pa)=0 Proba : Pb=3/5 et proba Pa=3/4 val de B = 2*3/4*3/5 + 4*1/4*3/5 + 5*3/4*2/5 + 2*1/4*2/5 Solution Jeu en Stratégies Mixtes