Systèmes multi-agents

Systèmes Multi-Agents
Badiâa Dellal-Hedjazi USTHB – Département d’Informatique
Intelligence Artificielle
1

Système multi-agent
Un système multi-agent est un système distribué composé d’un ensemble d’agents.
2

Motivations (1)
1) Problèmes de nature distribuée:
Distribution géographique du problème.
Ex. Système de contrôle aérien
Distribution fonctionnelle des sous tâches
Ex. Fabrication de produits industriels.
Distribution des connaissances et méthodes de traitement
Ex. Extraction de connaissances de sources distribuées
Distribution informatique
Ex. développement de machines parallèles ;
3

Motivations (2)
2) Résolution de problèmes complexes
Ex. Contrôle de Smart Grid
(Réseau électrique intelligent)
3) Intégration de plusieurs expertises incomplètes
ou peu fiables pour une expertise plus robuste
4) Faire coopérer des systèmes pré-existants, hétérogènes et distribués :
Sources d’information dans le web, workflow inter-organisationnel. 4

Système multi-agent
Définition: On appelle système multi-agent (ou SMA), un système
composé des éléments suivants:
1. Un environnement E, c’est-à-dire un espace disposant
généralement d’une métrique.
2. Un ensemble d’objets O. Ces objets sont situés, c’est-à-dire
que, pour tout objet, il est possible, à un moment donné,
d’associer une position dans E. Ces objets sont passifs, c’est-à-dire
qu’ils peuvent être perçus, créés, détruits et modifiés par les
agents.
3. Un ensemble A d’agents, qui sont des objets particuliers (A
inclus dans O), lesquels représentent les entités actives du
système.
4. Un ensemble de relations R qui unissent des objets (et donc
des agents) entre eux.
5. Un ensemble d’opérations Op permettant aux agents de A de
percevoir, produire, consommer, transformer et manipuler des
objets de O.
6. Des opérateurs chargés de représenter l’application de ces
opérations et la réaction du monde à cette tentative de
modification, que l’on appellera les lois de l’univers. 5
J.Ferber 1995

Opérateurs et Lois de l’univers: Exemple
Opérateurs (actions)
Ouvrir robinet , Remplir verre d’eau, …
Opérateur remplirVerreSousRobinet
Pre: robinet(r),verre(v),sous(v,r),
coule(r,Eau), vide(v)
Del: vide(v)
Add: rempli(v,Eau)
Lois de l’univers :
Prendre en considération:
- Temps
- Débit (volume d’eau écoulée / temps)
6

Caractéristiques des SMA
Un système multi-agent s’intéresse au comportement d’une collection
d’agents visant à atteindre un but global ou un ensemble de buts.
Un SMA est caractérisé par:
• chaque agent a des informations ou des capacités de résolution de
problèmes limitées (point de vue partiel);
• il n'y a aucun contrôle global du système;
• les données sont décentralisées;
• le calcul est asynchrone.
7

Conception de SMA
Conception des agents  construction d’agents à
comportement indépendant, autonome pour accomplir
leurs buts .
Conception de la société 
Construction d’agents capables d'interagir (coopération,
compétition) avec d'autres agents pour accomplir leurs
taches.
8

Communications entre agents
1) Avec communication
Communication directe
• Par envoi de messages
• Par mémoire partagée (tableau noir)
Communication indirecte
Spécifique aux SMA réactifs (bio-inspirés):
• privilégie une communication par signaux, via l’environnement. (colonies de fourmis)
2) Sans communication
Se base sur l’inférence des actions des autres.
• Utilisation de la théorie des jeux avec matrices de gain (ex. investisseurs dans marchés financiers).
• Observer les autres agents (apprentissage)
9

Communications SMA: Tableau noir (blackboard)
Avantages :
• peu de pertes informations
• correction des erreurs très rapide
• Adaptée si nombre de messages important
Inconvénients :
• risque d'accumulation de données inutiles
• contraintes de vocabulaire
• dépend du domaine d'application
10
• Les agents s’échangent en déposant (écrivent) sur la mémoire partagée (tableau noir) les informations ou connaissances
correspondants aux états partiels ou résultats intermédiaires d’un problème en cours de résolution.
• Un dispositif de contrôle gère les conflits d’accès.

Communications SMA: Par envoi de messages
Avantages :
• liberté d'expression
• souplesse de la communication
• parallélisation
• indépendante du domaine d'application
Inconvénients :
• pertes d'informations
• correction d'erreurs difficiles
• saturation des communications
11
Communication avec accusé de réception: Ex. Dans le cas de traitements collaboratifs nécessitant une synchronisation.

Organisation
Organisation apriori : Hiérarchique , de marché, de société, en coalition, …..
Organisation par émergence : Structure de l’organisation apparait suite aux interactions
entre agents
12

Interactions entre agents
Un système multi-agent est un ensemble d’agents interagissant selon des modes de coopération ou de compétition.
• Coordination: Eviter les interactions nuisibles
ou exploiter les interactions bénéfiques.
• Coopération : travailler ensemble à la
résolution d’un but commun
• Négociation : parvenir à un accord
acceptable pour toutes les parties
concernées (Résolution de conflits)
13

Coopération
Destinée aux types de problèmes où :
• un agent seul est incapable de résoudre le problème.
• Les informations dont dispose un agent incertaines et /ou
erronées.
- Coopération intentionnelle (ou cognitive)
- Coopération réactive
14

Coopération intentionnelle
15
Les agents (nœuds RdP) construisent des plans partiels et incomplets qu'ils
partagent ensuite avec leurs voisins afin d'identifier des améliorations potentielles.

Coopération réactive : Emergence
1) La première fourmi trouve la source de
nourriture (F), via un chemin quelconque
(a), puis revient au nid (N) en laissant
derrière elle une piste de phéromone (b).
2) Les fourmis empruntent indifféremment les
quatre chemins possibles, mais le
renforcement de la piste rend plus attractif
le chemin le plus court.
3) Les fourmis empruntent le chemin le plus
court, les portions longues des autres
chemins perdent leur piste de phéromones.
Colonie de fourmis : Stigmergie
16

Colonie de fourmis : Recherche du plus court chemin
Problème du voyageur de commerce
Le problème du voyageur de commerce:
• Problème d'optimisation
• Liste de villes, et distances entre toutes les paires de villes
• Détermine un plus court chemin qui visite chaque ville une
et une seule fois et qui termine dans la ville de départ.
17
1 : Au début, tous les chemins sont explorés (dépôt de pistes de phéromones);
2 : Le chemin le plus court est plus renforcé en phéromones que les autres;
3 : L’évaporation des phéromones permet d’éliminer les moins bonnes solutions.
1 2 3

Colonie de fourmis : Clustering : Tri du couvain
Couvain : constitué par les oeufs, les larves et les nymphes.
18

Planification
–Planification centralisée: un agent central établit un plan d’actions pour
l’ensemble des agents,
Exemple: Robot dans une usine
• La centralisation de la planification peut coûter cher si l’agent superviseur est
défaillant
–Planification distribuée: les agents se communiquent leurs plans partiels pour
détecter et résoudre les problèmes
• Approche onéreuse en communications
Planification distribuée – fusion de plans Planification complètement distribuée 19

20
Centralized planning for distributed plans
 Operators
 move(b,x,y) move b from x to y  movetotable(b,x)
Precond: on(b,x)  clear(b)  clear(y) Precond: on(b,x)  clear(b)
Postcond: on(b,y)  clear(x)  Postcond: ob(b,T)  clear(x)  on(b,x)
on(b,x)  clear(y)
A
B D
C E
F
Sinit
C
A
E
B F
D
Sfinal
I'm Bill
Agent1
I'm Tom
Agent2
on(A,B) on(C,D) on(E,F)
on(B,T) on(D,T) on(F,T)
on(B,A) on(F,D)
on(A,E) on(D,C)
on(E,T) on(C,T)
on(B,A)
S1: move(B,T,A)
on(B,T) clear(B) clear(A)
movetotable(A,B) move(A,B,y)
S2: move(A,B,E)
clear(A) clear(E) on(A,B)
…………..
………….
on(E,T)
S3: movetotable(E,F)
1. Given a goal description,
a set of operators,
and an initial state description
generate a partial order plan
work backward from each “on” goal
Slide tiré de Sobah Abbas Peterson

21
S1: move(B,T,A) To satisfy the preconditions, we have:
S2: move(A,B,E) S2 < S1, S3 < S4
S3:movetotable(E,F) S6 < S4, S6 < S5
S4: move(F,T,D) Also
S5: move(D,T,C) S2 threat to S3  S3 < S2
S6: movetotable(C,D) S4 threat to S5  S5 < S4
Then the partial ordering is: S3 < S2 < S1
S6 < S5 < S4
S3 < S4
Any total ordering that satisfies this partial ordering is a good plan for one agent
2. Decompose the plan into sub problems so
as to minimize order relations across plans
3. Insert synchronization
4. Allocate sub plans to agents
Slide tiré de Sobah Abbas Peterson
What if we have 2 agents?
DECOMPOSITION
Subplan1 S3 < S2 < S1
Subplan2 S6 < S5 < S4
and S3 < S4
Agent1 S3 < send(clear(F)) < S2 < S1
Agent2 S6 < S5 < wait(clear(F)) < S4

Négociation
Est un processus d’échange de compromis pour parvenir à un accord.
22
Négociation
Non-coopérative
Compétitive
(enchères)
Organisationnelle
(coalitions)
Coopérative
Les agents non-coopératifs font seuls leur choix, sans consulter les
autres agents, pour satisfaire leur propre but par maximisation d’une
fonction utilité.
Les agents coopératifs négocient dans le but de maximiser la
satisfaction globale du système
• La résolution de conflits (agents compétitifs).
• Résolution coopérative de problèmes distribués (agents coopératifs).

Négociation
La négociation comprend:
• Un langage de communication
• Un protocole de négociation
• Un processus de décision par lequel un agent décide sa position, les concessions,
les critères pour un accord (théorie des jeux, argumentation), etc.
Protocole un à un : un acheteur - un vendeur ;
Protocole un à plusieurs : plusieurs vendeurs - un acheteur ;
Protocole plusieurs à plusieurs : plusieurs vendeurs - plusieurs acheteurs.
Négociation compétitive : Théorie des jeux (Enchères)
Négociation coopérative : Allocation des tâches (Contract –Net)
Négociation Organisationnelle : Formation de coalitions (Alliances) 23

Négociation compétitive
• Enchère: Questions:
–Quelle est la meilleure stratégie pour un acheteur ?
–Quel est le protocole qui assure le plus grand bénéfice au vendeur ?
• Résultats donnés par la théorie des jeux:
– Enchère de Vickrey : La stratégie dominante pour un agent à valeur
privée est d’offrir sa vraie valeur
– Enchère anglaise : La meilleure stratégie est de rajouter la plus
petite somme possible et s’arrêter quand le prix dépasse sa valeur
24

Enchère de Vickrey
• Tous les agents proposent une offre privée
• La meilleure offre remporte l’objet au prix de la 2ième meilleure offre
25

Enchère de Vickrey : Exemple
Vente fausse émeraude
Agent acheteur i pense que le juste prix est 1000 euros et sa question est:
Dois-je proposer 900 euros (stratégie A) ou 1000 euros (mon juste prix, stratégie B)?
1er cas: La 2ième offre après la mienne était de 800 euros, j’obtiens l’émeraude à ce
prix suivant le système Vickrey,
2ième cas: La 2ième offre est de 950 euros. En stratégie A, j’ai perdu l’objet alors qu’il
est adjugé en dessous de mon juste prix. En stratégie B j’obtiens l’objet à 950
euros .Ce qui reste un avantage par rapport à mon juste prix.
3ième cas: Il y’a une offre > à 1000 euros. Dans les 2 stratégies je perd l’objet.
Donc: La stratégie B est au total plus avantageuse que la stratégie.
Conclusion: Le système Vickrey conduit les acteurs à proposer leur juste prix.26

Négociation Coopérative : Par allocation de tâches
(Contract-Net)
27

Négociation organisationnelle: E-ALLIANCE
28
Négociation de sous-traitance de tâches (job) en créant une organisation virtuelle

Processus de négociation : E-ALLIANCE
Objet négociation: Taille job, prix, délai…
Cadre négociation: Durée, nombre participants, règles de déroulement des négociations (tactique, protocole,…).
29

Exercice
• Thermostat avec détecteur de température.
• Calendrier électronique.
• Courrier électronique trié par expéditeur.
• Courrier électronique trié par importance.
• Système de contrôle du trafic routier.
30
Sont-ils des agents ou SMA?

Systèmes multi-agents

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

Systèmes multi-agents