JIMMY PERRON




Modélisation d’un modèle cognitif de mémoire dans un système
                   multi-agent temps réel


...
-2-


Résumé
Le présent travail s’inscrit dans un projet visant la simulation d’un grand nombre d’agents
dans un environne...
-3-


Préface et Remerciements
Dès le début de cette recherche, nous étions un peu impressionnés par le grand défi qu’un
s...
-4-


Table des matières

1     Introduction Générale ___________________________________________________ 9
    1.1   Cont...
-5-


      3.6.5   Passage vers la mémoire à long terme _______________________________ 96
      3.6.6   L’élément mémori...
-6-


Table des figures
Figure 2.1 : Fonction de rétention de Ebbinghaus _________________________________ 17
Figure 2.2 :...
-7-


Figure 3.34 : Valeurs modifiables dans le modèle de mémoire ______________________ 105
Figure 3.35 : Structure du mo...
____________________________________

             Chapitre 1


             Introduction
________________________________...
-9-



1 Introduction Générale

Depuis plusieurs années, les recherches sur la réalité et la simulation virtuelle ont beau...
-10-



1.1    Contexte

Il existe plusieurs techniques pour représenter des phénomènes de foule dans un
environnement [AJ...
-11-


modèle modélisant la dynamique individuelle des individus appelé social force model a été
proposé [Helbing & Molnar...
-12-


    cause de certaines réactions de l’agent. Certains objets, agents ou actions perçus
    peuvent engendrer des ém...
-13-


Voici donc les mécanismes que Thalmann décrit comme étant essentiels pour une
modélisation cohérente d’un humain vi...
-14-



1.3    Démarche et présentation du mémoire

La première étape de ces recherches a été l’exploration d’ouvrages en ...
-15-




____________________________________

              Chapitre 2


  Recherches antérieures sur la mémoire
________...
-16-



2 Recherches antérieures sur la mémoire

L’objectif d’une partie du projet MAGS est de développer un modèle de per...
-17-


complètement absent. Il n’était pas rare d’utilisé le terme de l’apprentissage pour parler de la
mémorisation d’un ...
-18-


L’apport d’Ebbinghaus est surtout au niveau de la méthodologie expérimentale pour l’étude
des phénomènes de la mémo...
-19-




        Temps
         (a) Combinaison initiale

         Présentation de la séquence :         CS              U...
-20-




                                                       Acquisition

                      16



                 ...
-21-



                                                                Extinction

                          14



      ...
-22-


qu’il soit capable de sortir de la boite très rapidement. Ce type d’apprentissage à été qualifié
par Thorndike comm...
-23-




E = (H x D x K) - I


Le but de cette équation (la réponse « E ») était de prédire le potentiel de réaction. Ce p...
-24-


Lorsque l’on fait une rétrospective de la théorie de Hull, on s’aperçoit que les efforts ont été
incomplets et impa...
-25-



                                     Expérience de Tolman

                  12
                  10              ...
-26-


Newell et Simon montrent que la simulation par ordinateur peut utiliser la puissance de cette
technologie pour effe...
-27-


   3- Si l’opérateur est applicable, l’appliquer. Sinon, définir un sous-but qui rendra
       l’opérateur applicab...
-28-


Ils amenèrent l’idée que la mémoire était constituée de deux unités de stockage : la mémoire à
court terme et la mé...
-29-




                                                             Répétition


                                Mémoire...
-30-



2.2    Théories de la mémoire

L’histoire des recherches sur la mémoire est relativement jeune et évidemment très ...
-31-


comparerait à l’image résiduelle d’un éclair dans la nuit. En 1983, Haber [Haber, 1983] remit
en question l’idée pu...
-32-


mémoire perceptuelle et la mémoire à long terme. Cette section considère donc les
phénomènes et les mécanismes de l...
-33-



2.2.2.2    Regroupement (Chunking) et capacité

L’organisation de la mémoire à court terme est effectuée d’une faç...
-34-



2.2.2.3      Rétention et oubli

La mémoire semble s’effacer au fil du temps. Plusieurs expériences déterminent qu...
-35-


l’interférence [Dosher, 1999 ; Dosher & Ma, 1998 ; Lewandowsky & Murdock, 1989; Rubin
& Wenzel, 1996; Wickelgren, 1...
-36-


Évidemment, la théorie fût critiquée mais l’idée de base de la différence d’encodage entre les
deux mémoires fût re...
-37-




Le système central, quant à lui, est la composante la plus complexe et la moins comprise de la
mémoire de travail...
-38-


Il existe plusieurs organisations et subdivisions de la mémoire à long terme mais la plus
courante dans la littérat...
-39-


Lorsqu’on s’attarde aux mécanismes de la mémoire à long terme, on s’apperçoit que ce sont
sensiblement les mêmes qu...
-40-


conception de notre modèle de mémoire. Cela nous permettra de nous concentrer sur les
relations entre les théories ...
-41-




2.3.2 MINERVA 2

Le but premier du développement de MINERVA2 [Hintzman, 1988] était d’expliquer les
phénomènes de...
-42-


que l’apprentissage n’est pas seulement l’acquisition de nouvelles connaissances mais aussi la
façon de récupérer c...
-43-



2.3.3.2    Théorie qualitative de SOAR
Nous allons maintenant nous concentrer sur la théorie qualitative de l’appr...
-44-


   plusieurs pièces en seulement quelques chunks. Le débutant, quant à lui, considère
   simplement une pièce par c...
-45-




                     Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]


Les propriétés de la mémoire dont S...
-46-


sollicité dans le contexte courant. Pour être en mesure d’estimer cette valeur, les mécanismes
d’apprentissage doiv...
-47-


montre bien l’importance des systèmes périphériques en proposant un ensemble de
processeurs moteurs et perceptuels....
-48-



2.3.6 3CAPS

Enfin, le modèle 3CAPS [Just & Carpenter, 1992] avance que les limitations du système
cognitif sont l...
-49-




____________________________________

             Chapitre 3


       Notre modèle de mémoire
__________________...
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Prochain SlideShare
Chargement dans…5
×

Modèle cognitif de mémoire dans un environnement virtuel

4 218 vues

Publié le

Le document est le mémoire de maîtrise de M. Jimmy Perron sous la direction de Bernard Moulin du laboratoire d'informatique cognitive de l'université Laval. La recherche présente le développement d'un modèle de mémorisation réaliste pour des agents/entités virtuels évoluant dans un environnement géographique.

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
4 218
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Modèle cognitif de mémoire dans un environnement virtuel

  1. 1. JIMMY PERRON Modélisation d’un modèle cognitif de mémoire dans un système multi-agent temps réel Mémoire présenté à la Faculté des études supérieures de l’Université Laval pour l’obtention du grade de maître ès sciences (M.Sc.) Département d’informatique FACULTÉ DES SCIENCES ET GÉNIE UNIVERSITÉ LAVAL Août 2003  Jimmy Perron, 2003
  2. 2. -2- Résumé Le présent travail s’inscrit dans un projet visant la simulation d’un grand nombre d’agents dans un environnement urbain 3D virtuel. En fait, le système MAGS (Multi-Agent GeoSimulation) est une plateforme multi-agent en temps réel pouvant s’appliquer à plusieurs domaines : simulation de foule, simulation de consommateurs dans des centres commerciaux, simulation d’évacuations, etc. Les fondements du simulateur sont issus des approches cognitives, ce qui implique que les agents sont dotés de comportements évolués basés sur leurs besoins et objectifs. Cela implique aussi que les agents doivent être munis d’un outil supplémentaire proposant des mécanismes de perception et de mémorisation de l’environnement. Ce mémoire présente donc un modèle détaillé de perception et de mémorisation de l’environnement virtuel 3D. Ses mécanismes sont cohérents avec les études réalisées dans le domaine des sciences cognitives sur la mémoire. Notre modèle de Perception-Mémoire permet d’individualiser les agents en dotant chaque agent d’une mémoire individuelle du monde virtuel qu’il parcourt. Il est, de plus, en mesure d’effectuer la perception et la mémorisation de plusieurs centaines d’agents en temps réel dans la plateforme MAGS.
  3. 3. -3- Préface et Remerciements Dès le début de cette recherche, nous étions un peu impressionnés par le grand défi qu’un système semblable représentait. Finalement, deux ans après, une première version de MAGS (Multi-Agent GeoSimulation) vit le jour. Cette première version était le fruit d’un grand travail de la part de toute notre équipe. Le présent travail est une contribution à ce système dont l’instigateur est M. Bernard Moulin. Son expertise, son talent de leader, de gestionnaire et de coordonnateur de recherche ont fait que ce projet est maintenant une chose concrète. Suivant cela, je désire sincèrement remercier M. Moulin pour son implication, sa confiance et sa détermination à nous initier à la recherche. Il a été un guide extraordinaire dans tout le déroulement du projet, en plus de nous inspirer dans des périodes souvent complexes. Deuxièmement, je tiens à souligner l’implication du RDDC Val-Cartier dans le projet MAGS. Ils ont permis la réalisation du projet en appuyant l’équipe tant du point de vue technique (équipement) que du point de vue financier, en fournissant un soutien boursier aux étudiants impliqués. Ils ont toujours été convaincus du bien-fondé et de l’apport que cette recherche pouvait amener et pour cela, je les remercie. De plus, je tiens à remercier tous mes proches qui m’ont, d’une façon ou d’une autre, supporté dans cette aventure. Étant donné l’ampleur du projet, le temps consacré à ceux qui me sont chers a été considérablement limité. Ils ont quand même su comprendre et m’ont soutenu dans cette démarche en faisant tout ce qu’ils pouvaient pour m’aider. Pour cette raison, et bien d’autres, je les remercie et je veux qu’ils sachent qu’ils ont eu un grand rôle à jouer dans l’aboutissement de cette étape. Jimmy Perron
  4. 4. -4- Table des matières 1 Introduction Générale ___________________________________________________ 9 1.1 Contexte _________________________________________________________ 10 1.2 Objectifs _________________________________________________________ 13 1.3 Démarche et présentation du mémoire ________________________________ 14 2 Recherches antérieures sur la mémoire_____________________________________ 16 2.1 Historique des recherches sur la mémoire _____________________________ 16 2.2 Théories de la mémoire _____________________________________________ 30 2.2.1 Mémoire perceptuelle ___________________________________________ 30 2.2.2 Mémoire à court terme___________________________________________ 31 2.2.3 Mémoire de travail______________________________________________ 36 2.2.4 Mémoire à long terme ___________________________________________ 37 2.3 Les modèles de mémoire ____________________________________________ 39 2.3.1 Le modèle SAM________________________________________________ 40 2.3.2 MINERVA 2 __________________________________________________ 41 2.3.3 Modèle de mémoire de SOAR_____________________________________ 41 2.3.4 Modèle de mémoire de l’architecture ACT-R _________________________ 45 2.3.5 EPIC_________________________________________________________ 46 2.3.6 3CAPS _______________________________________________________ 48 2.4 Conclusion sur l’état de l’art sur la mémoire ___________________________ 48 3 Modèle de mémoire développé dans le contexte de MAGS ______________________ 50 3.1 Fonctionnalités nécessaires et contraintes du modèle ____________________ 51 3.1.1 Fonctionnalités_________________________________________________ 51 3.1.2 Contraintes ____________________________________________________ 53 3.2 Environnement de MAGS___________________________________________ 55 3.3 Mécanisme de perception ___________________________________________ 60 3.3.1 Algorithme de Perception de l’environnement ________________________ 62 3.3.2 Algorithme de parcours des cellules de Palmer________________________ 63 3.3.3 Calcul des lignes de vue ( troisième dimension ) ______________________ 64 3.3.4 Aspect temps réel, cohérence cognitive et résultats ____________________ 69 3.3.5 Conclusion sur la perception ______________________________________ 71 3.4 Mémoire perceptuelle ______________________________________________ 72 3.5 Filtre ____________________________________________________________ 73 3.6 Mémoire de travail_________________________________________________ 80 3.6.1 Fondements de la mémoire de travail dans MAGS _____________________ 81 3.6.2 Structure de la mémoire de travail__________________________________ 82 3.6.3 Capacité de la mémoire de travail __________________________________ 84 3.6.4 Répétition et Rétention __________________________________________ 86
  5. 5. -5- 3.6.5 Passage vers la mémoire à long terme _______________________________ 96 3.6.6 L’élément mémorisé ____________________________________________ 97 3.6.7 Conclusion sur la mémoire de travail _______________________________ 99 3.7 Mémoire à long terme ______________________________________________ 99 3.7.1 Structure_____________________________________________________ 100 3.7.2 Rétention ____________________________________________________ 100 3.8 Conclusion sur le modèle de mémoire de MAGS _______________________ 102 4 Intégration du modèle de mémoire dans MAGS _____________________________ 108 4.1 Mémoire perceptuelle _____________________________________________ 112 4.2 Mémoire de travail________________________________________________ 112 4.3 Mémoire à long terme _____________________________________________ 117 4.4 Contrôle et flux de données_________________________________________ 117 5 Résultats et conclusion _________________________________________________ 121 5.1 Performances des mécanismes du modèle de mémoire MAGS____________ 121 5.1.1 Perception ___________________________________________________ 123 5.1.2 Mécanisme de Filtre____________________________________________ 125 5.1.3 Mécanisme de Rétention ________________________________________ 126 5.2 Analyse générale du modèle de mémoire______________________________ 127 5.3 Discussion et conclusion sur le modèle de mémoire _____________________ 131 6 Bibliographie_________________________________________________________ 136
  6. 6. -6- Table des figures Figure 2.1 : Fonction de rétention de Ebbinghaus _________________________________ 17 Figure 2.2 : Procedure d'expérimentation de Pavlov _______________________________ 19 Figure 2.3 : Acquisition d'une réponse conditionnée _______________________________ 20 Figure 2.4 : Processus d'extinction dans le conditionnement classqiue _________________ 21 Figure 2.5 : Courbe d'apprentissage de Thorndike_________________________________ 22 Figure 2.6 : Résultat de l'expérience de Tolman ___________________________________ 25 Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin __________________________ 29 Figure 2.8 : Résultat du rapport de Sperling______________________________________ 31 Figure 2.9 : Représentation de la mémoire de travail de Baddeley ____________________ 36 Figure 2.10 : Taxonomie de la mémoire selon Squire (1993) _________________________ 37 Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]__________________________ 45 Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997] ___________________________ 47 Figure 3.1 : Mémorisation d’une relation ________________________________________ 51 Figure 3.2 : La carte des élévations ____________________________________________ 55 Figure 3.3 : Carte des élévations d'une partie de la ville de Québec ___________________ 56 Figure 3.4 : Plan (x,z) représenté par le segment A de la carte précédente ______________ 57 Figure 3.5 : LocationMap ____________________________________________________ 58 Figure 3.6 : Exemple d'accès aux agents ________________________________________ 59 Figure 3.7 : Perception dans une « height map » __________________________________ 60 Figure 3.8 : Carte de visibilité Franklin [1999] ___________________________________ 61 Figure 3.9 : Test de visibilité __________________________________________________ 63 Figure 3.10 : Algorithme de visibilité de Palmer __________________________________ 64 Figure 3.11 : Test de visiblité à l'aide d'une ligne de vue ____________________________ 65 Figure 3.12 : Triangles semblables _____________________________________________ 66 Figure 3.13 : coupe en ( x, z ) _________________________________________________ 67 Figure 3.14 : Algorithme de perception de MAGS _________________________________ 68 Figure 3.15 : Test de visibilité _________________________________________________ 69 Figure 3.16 : Mémoire perceptuelle d’un agent ___________________________________ 72 Figure 3.17 : Filtre _________________________________________________________ 74 Figure 3.18 : Identification d’objets par attributs__________________________________ 77 Figure 3.19 : Mécanismes de la mémoire de travail ________________________________ 82 Figure 3.20 : Organisation de la mémoire de travail dans MAGS _____________________ 84 Figure 3.21 : Mémoire de travail ______________________________________________ 86 Figure 3.22 : Force de la trace en mémoire d'un élément____________________________ 88 Figure 3.23 : Structure d’un élément____________________________________________ 89 Figure 3.24 : 15 répétitions en 15 unités de temps _________________________________ 90 Figure 3.25 : Évolution de la trace de Restaurant1 ________________________________ 91 Figure 3.26 : Évolution de la force de la trace de Restaurant1 dans la mémoire de travail _ 92 Figure 3.27 : Évolution de la force de la trace en mémoire après 6 répétitions___________ 93 Figure 3.29 : Fonction d'activation_____________________________________________ 94 Figure 3.30 : Fonction d'activation_____________________________________________ 95 Figure 3.31 : Structure d'un élément ____________________________________________ 98 Figure 3.32 : Mémoire à long terme ___________________________________________ 101 Figure 3.33 : Modèle de mémoire _____________________________________________ 103
  7. 7. -7- Figure 3.34 : Valeurs modifiables dans le modèle de mémoire ______________________ 105 Figure 3.35 : Structure du modèle de mémoire ___________________________________ 106 Figure 4.1 : Composantes principales de MAGS _________________________________ 108 Figure 4.2 : Description d'un agent____________________________________________ 110 Figure 4.3 : Diagramme de classes du modèle de mémoire _________________________ 111 Figure 4.4 : Méthode de filtrage ______________________________________________ 113 Figure 4.5 : Algorithme de filtrage de la mémoire de travail ________________________ 114 Figure 4.6 : Algorithme pour l'ajout d'un élément dans la mémoire de travail __________ 115 Figure 4.7 : Algorithme de rétention de la mémoire de travail_______________________ 116 Figure 4.8 : Accès à un élément du "chunk" Faim ________________________________ 116 Figure 4.9 : Diagramme de séquence lors de l’appel de TMemoryState->Update() ______ 118 Figure 5.1 : Temps d'un cycle du système MAGS _________________________________ 122 Figure 5.2 : Résultat du mécanisme de perception ________________________________ 123 Figure 5.3 : Temps de calcul de la perception par rapport au rayon de perception ______ 124 Figure 5.4 : Visualisation de la zone de perception d’un agent ______________________ 124 Figure 5.5 : Résultats du modèle de mémoire (grille)______________________________ 127 Figure 5.6 : Résultats du modèle de mémoire (graphique) __________________________ 127 Figure 5.7 : Temps de calcul des composantes de MAGS___________________________ 129 Figure 5.8 : Visualisation d'une simulation______________________________________ 130 Figure 5.9 : Carte de mémoire d'un agent à un instant donné _______________________ 131
  8. 8. ____________________________________ Chapitre 1 Introduction ____________________________________
  9. 9. -9- 1 Introduction Générale Depuis plusieurs années, les recherches sur la réalité et la simulation virtuelle ont beaucoup évolué. Certains phénomènes qui ne peuvent être reproduits en réalité entrent dans le domaine d’application de la simulation virtuelle. Ces phénomènes, comme par exemple la panne d’un moteur dans un avion, sont souvent impossibles ou trop risqués à reproduire. Les spécialistes effectuent alors des simulations pour entraîner les pilotes à faire face à ces situations. Dans le domaine précis de l’aéronautique, ce genre de simulateur existe et ils sont très utilisés. Mais qu’arrive-t-il lorsque certains stratèges doivent prendre des décisions pour la sécurité ou l’aménagement du site d’une manifestation ? Il est impossible de reproduire physiquement les comportements d’une foule lors d’une manifestation. Il faut donc être en mesure de pouvoir simuler, à l’aide d’un outil informatique, des phénomènes de foule. L’idée d’un simulateur de foule dans un environnement urbain 3D est alors née. Le but de ce simulateur est de permettre à ses utilisateurs d’orienter certaines décisions suivant les résultats obtenus à partir de la simulation d’un phénomène de foule. La simulation doit avoir lieu dans un environnement urbain virtuel en trois dimensions. Évidemment, le projet est très ambitieux puisque les simulations en temps réel contenant des milliers de personnes virtuelles ne sont pas choses courantes. De plus, le prototype du simulateur doit fonctionner sur un ordinateur de type PC sous un environnement Windows. C’est suite à cela que le développement du prototype du système MAGS commença. Le projet MAGS (Multi-Agent Geo-Simulation) a pour objectif le développement d’une plateforme générale pour la création de simulations multi-agent dans des espaces géographiques virtuels. La plateforme devra supporter des milliers d’agents ayant des aptitudes cognitives spatiales et comportementales (perception, mémoire, comportements, etc.). De plus, les agents devront interagir directement avec l’environnement virtuel dans lequel ils prennent place. L’application courante de la plateforme MAGS vise à simuler les phénomènes de foule dans un environnement urbain 3D.
  10. 10. -10- 1.1 Contexte Il existe plusieurs techniques pour représenter des phénomènes de foule dans un environnement [AJ, 1954], [Ashford, 1976], [Yuhaski, 1989], [Lovas, 1993]. Il y a premièrement les systèmes à base de particules où chaque particule représente un agent. L’interaction entre les particules se fait à l’aide des propriétés d’attraction, de répulsion et à l’aide de la gestion des collisions qui sont prédéterminées pour chaque particule [Langton, 1997]. Ces systèmes physiques modélisent bien les phénomènes de foule où une foule dense se trouve dans un environnement très restreint (évacuation d’un stade, modélisation du trafic [RIC, 1996]). Il y a ensuite les systèmes de modélisation des fluides qui ont été utilisés pour la première fois par Henderson [Henderson, 1974]. Dans ce cas précis, la foule est caractérisée par certaines propriétés physiques (densité, vitesse, énergie, etc.) et elle est considérée comme un tout se déplaçant dans un environnement souvent représenté sous forme de grille. Une autre technique se sert des automates cellulaires pour modéliser les interactions entre plusieurs agents (foule, trafic) [Helbing, 1999]. Traditionnellement, les chercheurs et les spécialistes du domaine de la simulation ont toujours traité les phénomènes de foule comme étant modélisables par des systèmes physiques ou mathématiques. Une étude au Wembley Stadium a montré que les modèles basés sur la mécanique des fluides étaient faux. Les analyses révèlent que les « patterns » de la foule n’étaient presque en aucun point semblables à un liquide. Suite à cette étude, un mathématicien irlandais du nom de Keith Still a développé une série d’équations connues sous le nom de « orchid fractal ». La théorie de Still se base sur l’aspect chaotique du comportement d’une foule. Ses résultats ont été utilisés pour développer un système commercial d’aide à la décision sur la planification des effets de foule [Still, 2003]. Ces systèmes, modélisés par des équations mathématiques, permettent de modéliser certains phénomènes très spécialisés mais ils ne peuvent pas être étendus à d’autres applications plus complexes. Ces dernières années, les chercheurs vont un peu plus loin en considérant des variables psychologiques pour caractériser chaque individu dans une foule [Helbing, 1998]. Le concept de self-organization effects est, maintenant, de plus en plus étudié. Suivant cela, un
  11. 11. -11- modèle modélisant la dynamique individuelle des individus appelé social force model a été proposé [Helbing & Molnar & Schweitzer, 1994], [Gipps, 1985]. Malgré le terme « social » dans le nom du modèle, celui-ci est quand même mathématiquement représenté. Il ne prend pas en considération les variables psychologiques individuellement. La force sociale est plutôt une représentation des différentes influences qui agissent sur le comportement de l’individu. Un autre laboratoire, « Virtual reality lab » dirigé par Daniel Thalmann, explore depuis plusieurs années la vie artificielle dans un environnement virtuel. Thalmann identifie les mécanismes à modéliser pour être en mesure d’implémenter ce qu’il appelle un humain virtuel ou un acteur [Thalmann, 2000]. Thalmann identifie cinq composantes nécessaires qu’un humain virtuel doit posséder. Voici les cinq composantes décrites par Thalmann. • Perception : La perception est la conscience que l’on a de l’environnement qui nous entoure. La façon dont un agent perçoit son monde se traduit en y intégrant les mécanismes de la vision, de l’audition, du toucher, de l’ouïe et du goût. La perception est responsable de l’interaction entre l’agent et l’environnement pour qu’il puisse se déplacer, manipuler des objets, et ainsi pouvoir réagir à la rétroaction provenant de l’environnement et des autres agents. Une approche basée sur la vision offre une méthode universelle pour transmettre de l’information à partir de l’environnement vers l’agent dans le contexte de la recherche de chemins, de l’évitement d’obstacles, de la représentation interne des connaissances avec les mécanismes d’apprentissage et d’oubli [Renault et al., 1990]. Dans le domaine de la simulation multi-agents, un agent est souvent défini comme une entité évoluant dans un environnement qu’elle peut percevoir et dans lequel elle peut agir [Franklin & Graesser, 1997]. La perception est donc essentielle à un humain virtuel ou un agent pour que ses comportements soient en fonction de son environnement immédiat. • Émotions : Les émotions sont des états affectifs intenses caractérisés par une brusque perturbation physique et mentale [Bérubé, 1991]. Les émotions peuvent donc être la
  12. 12. -12- cause de certaines réactions de l’agent. Certains objets, agents ou actions perçus peuvent engendrer des émotions chez l’agent. Ainsi, les émotions ressenties par un agent sont causées par la perception de son environnement [Thalmann, 2000]. • Comportements : Le module comportemental est évidemment très important lors de la modélisation des mécanismes d’un agent virtuel. C’est par ce mécanisme qu’est représenté le processus de prise de décision qui pousse l’agent à effectuer une action. Le comportement doit décider, à partir d’entrées (émotions, perceptions, souvenirs), l’action résultante sur l’environnement ou sur soi-même. Le comportement peut être vu d’une façon hiérarchique. Le modèle comportemental décompose un comportement complexe en sous-comportements beaucoup plus simples jusqu’à ce qu’un comportement élémentaire soit atteint [Pelletier, 2003]. • Actions : Lorsque le module comportemental a décidé quelle est l’action à exécuter, il doit avoir la possibilité de le faire. De la même façon qu’un humain ne peut pas voler, certaines actions doivent être modélisées et d’autres non pour respecter la cohérence de l’univers à simuler. Les actions permettent l’interaction avec l’environnement et les autres agents. Ainsi, les agents sont en mesure de communiquer et de modifier leur entourage, ce qui garde la dynamique de la simulation très active. • Mémoire : La mémoire est la capacité de stocker et de récupérer de l’information provenant de la perception de l’agent. Le comportement d’un agent variera en fonction de son expérience passée. S’il a déjà utilisé un objet, il n’aura pas à réapprendre tout le processus de son utilisation. De la même façon, s’il se souvient d’un endroit en particulier, il n’aura pas à consulter une carte pour s’orienter. Ce sont des exemples simples qui démontrent que les modèles où la mémorisation est absente sont des modèles peu convaincants puisqu’il n’y a aucune adaption des agents.
  13. 13. -13- Voici donc les mécanismes que Thalmann décrit comme étant essentiels pour une modélisation cohérente d’un humain virtuel dans une simulation virtuelle. 1.2 Objectifs Lorsque l’on examine attentivement les mécanismes de Thalmann décrits précédemment, l’un d’eux semble être à la base de tous les autres. Il s’agit, bien sûr, de la perception. Privé de la perception, un agent serait incapable d’interagir, de raisonner et d’agir sur son environnement, ce qui est contraire à la définition de Franklin et Graesser [Franklin & Graesser, 1997]. Il existe certaines techniques pour modéliser la perception dans un environnement virtuel, mais ces techniques ne sont pas adaptées au contexte de notre projet. Il nous faut un mécanisme permettant à des milliers d’acteurs de percevoir l’environnement dynamiquement et en temps réel. C’est donc un grand pas de doter les humains virtuels de la perception mais ils doivent également être en mesure de mémoriser ce qu’ils ont perçu. La mémoire est aussi un des mécanismes que Thalmann décrit pour la modélisation d’un acteur virtuel. Cependant, à notre connaissance, il n’existe, dans la littérature, aucun modèle qui rendre compte avec précision des mécanismes de perception et de mémoire dans un contexte temps réel. Quelques recherches en psychologie décrivent les grandes lignes et les caractéristiques d’un modèle de mémoire, mais sans plus. De plus, ces recherches ne sont pas appliquées au domaine de la simulation virtuelle et nous devons être en mesure d’implanter ces concepts afin de les matérialiser. Notre objectif dans ce mémoire est donc de définir et d’implanter un modèle complet de perception et de mémoire dans le contexte d’une simulation multi-agent en temps réel. Nous allons conceptualiser un modèle de mémoire, caractériser ses mécanismes, détailler et implanter le modèle dans un système de simulation en temps réel. Ces travaux sont motivés par le fait qu’aucun modèle de perception et de mémoire ne présente un niveau de détails satisfaisant pour pouvoir être adapté et implanté dans un contexte de simulation multi-agent. La finalité de ce mémoire devrait donc conduire à un modèle de mémoire efficace dont les fonctionnalités reflètent celles de la mémoire humaine.
  14. 14. -14- 1.3 Démarche et présentation du mémoire La première étape de ces recherches a été l’exploration d’ouvrages en sciences cognitives sur les sujets de la perception, de la mémoire et de l’apprentissage. L’objectif était d’avoir une idée claire sur le fonctionnement des mécanismes du cerveau humain. Évidemment, ces recherches bibliographiques en psychologie nous ont amené aux limites de la connaissance que les chercheurs ont des processus cognitifs. Nous avons quand même répertorié des avancées intéressantes qui nous ont permis d’établir un modèle relativement cohérent par rapport aux mécanismes humains compte tenu évidemment du contexte dans lequel il est développé. Les résultats de ces recherches bibliographiques sont présentés dans le chapitre 2. Par la suite, nous avons proposé un modèle complet de perception et de mémoire basé sur les concepts présentés précédemment. Pour chacun des concepts proposés, nous avons défini et implanté tous les mécanismes que le modèle comprenait. Pour ce faire nous avons, encore une fois, effectué une revue scientifique pour découvrir que la documentation sur la perception et la mémorisation dans un contexte d’une simulation virtuelle multi-agent en temps réel n’était pas très abondante. Cependant, avec les sources trouvées, nous avons pu construire une base solide pour finalement développer nos propres mécanismes de perception et de mémorisation qui sont présentés dans le chapitre 3. Une fois ces mécanismes définis, nous les avons introduits dans la simulation multi-agent (chapitre 4) pour vérifier le bien fondé de notre modélisation et ainsi obtenir des résultats concrets sur la faisabilité et la performance d’une telle approche (chapitre 5).
  15. 15. -15- ____________________________________ Chapitre 2 Recherches antérieures sur la mémoire ____________________________________
  16. 16. -16- 2 Recherches antérieures sur la mémoire L’objectif d’une partie du projet MAGS est de développer un modèle de perception et de mémorisation pour un système multi-agent. Nous cherchons donc à simuler, le plus exactement possible, les mécanismes humains qui interviennent dans des situations de mémorisation de l’environnement. Il est évident que, pour y arriver, il est essentiel de comprendre les mécanismes cognitifs impliqués dans ce qui nous préoccupe : la perception et la mémoire. Le but de ce chapitre est donc d’explorer le domaine de la psychologie cognitive afin d’identifier les concepts généraux reliés à la mémoire humaines. La première étape consiste à parcourir l’évolution historique des dernières décennies à la recherche des avancées qui ont marqué l’histoire de la recherche sur la mémoire. Ensuite, nous nous attarderons plus précisément sur les concepts et les mécanismes qui interviennent dans la mémorisation. Finalement, nous étudierons les différents modèles de mémoire développés jusqu’ici. 2.1 Historique des recherches sur la mémoire La recherche scientifique en psychologie n’est apparue que dans la moitié du 19e siècle. C’est donc une science très jeune qui a rapidement évolué surtout grâce aux nouveaux outils technologiques développés durant les dernières décennies. Depuis le commencement, l’apprentissage a été un important champ de recherche pour les scientifiques. L’une des raisons qui ont poussé les recherches a été la théorie de l’évolution de Darwin parue en 1859 [Darwin, 1859]. Les chercheurs voulaient savoir comment se fait l’adaptation d’un membre individuel d’une espèce donnée pendant sa vie. Il fallait donc comprendre la relation entre l’adaptation générale d’une espèce et l’apprentissage individuel de l’individu. Cette question est encore aujourd’hui très présente dans les différents sujets d’études. Depuis ce temps, les théories de l’apprentissage ont occupé les chercheurs pendant plus d’un siècle avant qu’ils ne s’intéressent plus sérieusement aux caractéristiques de la mémorisation en tant que concept indépendant. L’apprentissage et la mémoire sont des concepts qui ont été beaucoup entremêlés au commencement des recherches. Le terme mémorisation était presque
  17. 17. -17- complètement absent. Il n’était pas rare d’utilisé le terme de l’apprentissage pour parler de la mémorisation d’un élément. L’une des raisons était que la mémorisation d’un élément, indiquait que nous avions appris cet élément. En fait, nous savons aujourd’hui que mémoire et apprentissage sont des mécanismes très différents. Donc il ne faut pas être surpris si le terme apprentissage revient souvent dans les études sur la mémorisation du début du siècle. Nous allons ici nous intéresser à l’histoire et à l’évolution du concept de mémorisation afin de mieux comprendre l’orientation des recherches actuelles. Hermann Ebbinghaus (1850-1909) Ebbinghaus a été le premier à effectuer une étude rigoureuse de la mémoire humaine, qu’il publie en 1885 : Über das Gedächtnis (« Concerning memory »). Ebbinghaus se prend lui- même comme cobaye dans ses expériences. Dans l’une de ses expériences, il devait apprendre une liste de 13 syllabes aléatoires pour ensuite les répéter dans le même ordre et sans erreurs. Il mesurait ensuite le temps nécessaire pour réapprendre la liste. Ebbinghaus était intéressé par la facilité de l’apprentissage lorsque les concepts ont déjà été appris (le délai entre les deux apprentissages était pris en considération). Dans l’exemple de la liste, il a gagné 64.3% de temps entre les deux apprentissages (1156 sec (1ère fois) – 467 sec (2ième fois) / 1156 = 64.3%). Avec ces résultats, il a obtenu ce qu’il appelle la courbe de rétention (Figure 2.1). Fonction de rétention 60 55 Temps gagné % 50 45 40 35 30 25 20 0 200 400 600 800 Heures de délai entre les apprentissages Figure 2.1 : Fonction de rétention de Ebbinghaus
  18. 18. -18- L’apport d’Ebbinghaus est surtout au niveau de la méthodologie expérimentale pour l’étude des phénomènes de la mémoire. Il a proposé la courbe de rétention et la courbe d’apprentissage qui sont des outils encore très utilisés de nos jours. Ivan Petrovich Pavlov (1849-1936) À l’origine, Pavlov travaillait sur la physiologie de la digestion, ce qui lui valut le prix nobel de médecine en 1904. Une partie de ses recherches consistait à mesurer le taux de salivation des chiens lorsqu’il introduisait de la nourriture dans leurs mâchoires. Il a, par la suite, découvert qu’après un certain nombre d’essais, les mesures exactes n’étaient plus possibles parce que les chiens salivaient dès que Pavlov entrait dans la pièce. C’est à ce moment qu’il commenca l’étude de ce phénomène connu maintenant sous le nom de conditionnement classique [Pavlov, 1927]. La technique de base commence avec un stimulus non-conditionné (« unconditionned stimulus » ou US) qui invoque une réponse non-conditionnée (« unconditionned response » ou UR). Par exemple, la nourriture est un US et la salivation est un UR. Ensuite, le US est combiné avec un stimulus conditionné (CS) comme une cloche. Après un certain nombre d’essais, le CS est capable d’invoquer lui-même une réponse chez le cobaye. Lorsqu’une réponse se produit suite au CS, on appelle cette réaction une réponse conditionnée (CR). La Figure 2.2 illustre bien le conditionnement classique de Pavlov.
  19. 19. -19- Temps (a) Combinaison initiale Présentation de la séquence : CS US (cloche) (Nourriture) Réponse : UR (Salivation) (b) Réponse conditionnée Présentation de la séquence : CS US (cloche) (Nourriture) Réponse : CR UR (Salivation) (Salivation) (c) Extinction Présentation de la séquence : CS (cloche) Réponse : CR (Salivation) Figure 2.2 : Procedure d'expérimentation de Pavlov Nous ne discuterons pas davantage du conditionnement dans ce document. Cependant quelques phénomènes de bases établis par Pavlov (1927) ont quand même leur importance : 1- Acquisition : L’amplitude de la réponse conditionnée peut être exprimée comme une fonction du nombre d’essais de la combinaison du US et du CS. La Figure 2.3 montre que le CS augmente avec le nombre de répétitions de l’expérience.
  20. 20. -20- Acquisition 16 14 12 Salivation CS 10 8 Salivation CS 6 4 2 0 0 2 4 6 8 10 12 14 Nombre de répétitions de l'expérience Figure 2.3 : Acquisition d'une réponse conditionnée 2- Extinction : Qu’arrive-t-il lorsque le stimulus non conditionné (US) n’est plus combiné avec le stimulus conditionné (CS) ? La réponse conditionnée va diminuer si on augmente le nombre d’essais pour laquelle aucun US n’est présenté. Ce processus est connu sous le nom d’extinction. La fonction d’extinction du conditionnement est similaire à la fonction de rétention de la mémoire (Figure 2.4). Il y a cependant une différence entre les deux méthodes puisque la fonction de rétention est obtenue en faisant intervenir des délais d’attentes sans présenter de stimulus.
  21. 21. -21- Extinction 14 12 Salivation CS 10 8 Salivation CS 6 4 2 0 0 2 4 6 8 10 12 Nombre de répétitions de l'expérience Figure 2.4 : Processus d'extinction dans le conditionnement classqiue 3- Reprise spontanée : Quelquefois après une série d’extinctions, le CS est présenté de nouveau sans le US. L’amplitude de la réponse montre souvent des signes de reprise. 4- Ordonnancement temporel : Pavlov a remarqué que le conditionnement fonctionne beaucoup mieux lorsque le CS (cloche) est présenté avant le US (nourriture). Pavlov a donc catégorisé le conditionnement classique comme étant réflexif et automatique. Les recherches actuelles tendent cependant à décrire le phénomène avec une vue beaucoup plus cognitive. Encore aujourd’hui le conditionnement est souvent pointé comme étant un processus simple et à la base de l’apprentissage. Edward L. Thorndike (1874-1949) Thorndike étudiait une situation d’apprentissage quelque peu différente. Il enfermait un chat dans une boite et le chat devait apprendre comment sortir de la boite pour accéder à la nourriture qui était à l’extérieur. La boite était munie d’un petit levier qu’il fallait actionner pour ouvrir la porte et ainsi se libérer. Thorndike s’intéressait à la rapidité d’apprentissage du chat pour sortir suite à de nombreux essais dans la boite. Ses observations ont conduit au fait qu’au début, le chat se comportait au hasard bougeant d’un coin à l’autre de la boite sans savoir quoi faire jusqu’à ce que, par chance, il actionne le levier pour sortir. Plus le nombre d’essais augmentait, plus la durée du comportement hasardeux du chat diminuait, jusqu’à ce
  22. 22. -22- qu’il soit capable de sortir de la boite très rapidement. Ce type d’apprentissage à été qualifié par Thorndike comme étant un apprentissage par essais et erreurs (« trial-and-error learning ») illustré par la Figure 2.5. Courbe d'apprentissage 70 60 Temps pour sortir (sec) 50 40 Temps 30 20 10 0 0 5 10 15 20 25 Nombre de répétitions de l'expérience Figure 2.5 : Courbe d'apprentissage de Thorndike Le processus d’apprentissage étudié par Thorndike s’appelle le conditionnement instrumental. Comme dans Pavlov, une réponse est apprise suite à un stimulus. Ce qui diffère c’est que dans la boite de Thorndike, le stimulus est la boite et la réponse est l’action permettant d’ouvrir la boite. Il serait intuitif de penser que le stimulus est la nourriture à l’extérieur mais Thorndike explique que celle-ci joue un rôle de renforcement plutôt que de stimulus. Ainsi, Thorndike pense que « un lien stimulus-réponse sera formé à chaque fois qu’un renforcement suit la réponse en présence du stimulus » [Thorndike, 1898]. Clark L. Hull (1884-1952) De 1930 à 1970, la psychologie américaine a été dominée par une série de grandes théories de l’apprentissage. Parmi ces théories, la plus influente fût sûrement celle de Hull appelée théorie du comportement. L’idée de base de Hull était de développer une théorie systématique permettant d’expliquer tous les comportements. La théorie finale de Hull [Hull, 1952] comportait plusieurs équations qui se résument en celle-ci :
  23. 23. -23- E = (H x D x K) - I Le but de cette équation (la réponse « E ») était de prédire le potentiel de réaction. Ce potentiel est déterminé par la probabilité, la vitesse et la force avec lesquels un comportement répondra à un stimulus. Ainsi, les réponses potentielles pour un rat enfermé dans un labyrinthe sont de tourner à gauche, de tourner à droite ou de s’arrêter. La réponse avec le potentiel de réaction le plus fort sera la réponse adoptée par le rat. Selon la théorie de Hull, le potentiel de réaction serait une fonction des facteurs H, D, K et I. H - Force de l’habitude (Habit Strength). H représente la force de l’association construite entre le stimulus et la réponse des essais précédents. D - Energie (Drive). Selon Hull, les comportements ne sont pas seulement le résultat d’une habitude comme le suggère Thorndike. Hull propose que l’état d’énergie d’un organisme soit un agent énergisant pour l’habitude. Si l’énergie est à zéro, toute la force du monde lié à l’habitude ne produira aucune réponse. K - Motivation (Incentive Motivation). L’habitude et l’énergie ne sont pas suffisantes pour expliquer les comportements. Un rat entraîné dans un labyrinthe pour chercher de la nourriture va s’arrêter s’il sait que la nourriture a été enlevée. Si la quantité de nourriture diminue, les performances du rat déclinent. La motivation est donc une mesure de la quantité et du délai de la récompense. I – Inhibition. L’inhibition reflète la fatigue et l’effet d’extinction des essais pour lesquels la récompense n’est plus présentée. Ce que Hull met en évidence dans sa théorie, c’est la relation existant entre l’apprentissage et la motivation. L’apprentissage ne suffit pas à créer des comportements; il doit aussi y avoir de la motivation.
  24. 24. -24- Lorsque l’on fait une rétrospective de la théorie de Hull, on s’aperçoit que les efforts ont été incomplets et imparfaits. Cela devenait de plus en plus apparent avec le développement de logiciels informatiques capables de prédire de tels comportements basés sur ces théories. Il n’en demeure pas moins que les recherches de Hull demeurent toujours une référence dans les théories récentes de l’apprentissage et de la mémoire. Edward C. Tolman (1886-1959) Les théories de l’apprentissage comme celles de Hull ou de Thorndike ont fait l’objet de plusieurs critiques dans la communauté scientifique. La critique la plus influente fût celle d’Edward Tolman. La première démonstration implique l’apprentissage latent, précédemment mentionné par Thorndike avec « law of effect ». L’expérience de base de Tolman et Honzik consiste en un labyrinthe ayant 14 points où le rat devait effectuer un choix. Trois groupes de rats ont été utilisés pendant 17 jours parcourant 1 fois par jour le labyrinthe. Le premier groupe de rat avait toujours de la nourriture à la fin du parcours tandis que le deuxième groupe n’avait aucune récompense. Le troisième groupe, quant à lui, s’est vu présenter de la nourriture seulement après le 11ième jour de l’expérience. La Figure 2.6 présente la performance des trois groupes tout au long de l’expérience.
  25. 25. -25- Expérience de Tolman 12 10 Aucune 8 récompense Erreurs Toujours une 6 récompense 4 Récompense après 2 11 jours 0 0 5 10 15 20 Jours Figure 2.6 : Résultat de l'expérience de Tolman L’expérience indique le nombre de mauvais choix effectués par les rats tout au long du parcours pour atteindre la sortie du labyrinthe. Le groupe ayant eu de la nourriture le 11ième jour a dramatiquement augmenté ses performances le 12ième jour jusqu’à surpasser le groupe qui a toujours été renforcé. Selon Tolman, les rats non renforcés (pas de nourriture) apprennent quand même tout le labyrinthe. Cependant, leur apprentissage est en latence; lorsqu’un but fut introduit, ils ont transformé leur apprentissage en performance. Ainsi, pour Tolman, le renforcement n’est pas nécessaire à l’apprentissage mais il est nécessaire pour la performance. Newell & Simon (1961) Lorsque le behaviorisme commença à éprouver des difficultés expérimentales dues à la complexité de l’être humain, une nouvelle méthode pour la construction de théorie vit le jour. Cette méthode, basée sur la simulation par ordinateur, a beaucoup attiré l’attention des chercheurs en psychologie. L’approche a été développée par Allen Newell et Herbert Simon, deux collaborateurs à l’université Carnegie Mellon qui oeuvraient dans le domaine de l’intelligence artificielle (IA).
  26. 26. -26- Newell et Simon montrent que la simulation par ordinateur peut utiliser la puissance de cette technologie pour effectuer des prédictions de théories scientifiques complexes. La technique de simulation a bouleversé la nature théorique de la psychologie. Newell et Simon font plus que de la simulation: influencés par le développement de l’IA, ils mettent en relation la cognition humaine et l’ordinateur. C’est à partir de ce moment qu’émerge la métaphore de l’ordinateur qui a vraiment été difficilement acceptée par les psychologues. Pour eux, le cerveau humain est très différent d’un ordinateur et cette théorie basée sur l’analogie de la cognition et d’un ordinateur semble être une erreur [Rumelhart & McClelland, 1986]. Par la suite, Newell et Simon développèrent plusieurs simulations pour des problèmes d’apprentissage et de cognition. Cependant, ce n’est pas ce qui a forgé leur place dans l’histoire: leur grande contribution s’est faite au niveau de la résolution de problèmes. La plus grande difficulté des théories précédentes était de déterminer la relation entre la connaissance (ce que l’organisme apprend par expérience) et les comportements. Quelques théories comme celles de Thorndike et Hull combinent ces deux concepts et ne font aucune différence entre la connaissance et les comportements. Newell et Simon montrent comment la connaissance peut être séparée de la partie comportementale. Suivant cette voie, ils montrent que la théorie du comportement appliquée rigoureusement pourrait permettre des constructions mentales. Cette démonstration met en pièces le doute contre le mentalisme que Watson avait énoncé dans les années 50. Suite à cela, Newell et Simon établissent les bases d’une révolution cognitive transformant ainsi tous les champs de la psychologie y compris l’apprentissage. Ce qu’il faut retenir du travail de Newell et Simon, c’est ce qu’ils appelaient le GPS (General Problem Solver) [Newell & Simon, 1972]. Le GPS est une simulation par ordinateur utilisant le déploiement de la connaissance en résolution de problèmes de la façon suivante. 1- Identifier la différence majeure entre la situation courante et le but à atteindre; il faut se concentrer sur le but. 2- Choisir une action susceptible d’éliminer cette différence (opérateur)
  27. 27. -27- 3- Si l’opérateur est applicable, l’appliquer. Sinon, définir un sous-but qui rendra l’opérateur applicable et reprendre à l’étape 1. Newell et Simon (1972) donnent cet exemple tiré de la vie de tous les jours pour expliquer leur analyse. 1- But : Je veux amener mon fils à l’école. Quelle est la différence entre ce que j’ai et ce que je veux? C’est la distance. 2- Opérateur : Qu’est-ce qui change la distance? Mon automobile. 3- Applicable ? Mon automobile ne fonctionne pas! Nouveau but : Que faut-il pour qu’elle fonctionne? une nouvelle batterie. 1- But : Me procurer une nouvelle batterie.... 2- ... L’exemple complet se trouve dans leur ouvrage de 1972 mais le concept important de la théorie est celui de sous-buts. À l’aide des sous-buts, il est possible d’organiser des comportements cohérents en réponse à des situations très complexes. Ceci représente une avancée majeure par rapport au concept de réponses de Skinner. Newell et Simon montrent donc que la simulation par ordinateur peut être utilisée pour modéliser des processus cognitifs complexes. De plus, ils montrent qu’à l’aide de leur approche GPS, il est possible de convertir la connaissance en comportements. Modèle de mémoire de Atkinson & Shiffrin, 1968 C’est en 1968 que Richard Atkinson et Richard Shiffrin publiaient une théorie sur la mémoire humaine. Cette théorie amena une vision nouvelle sur la nature de la mémoire humaine qui, jusqu’ici, avait été un peu négligée au profit des théories de l’apprentissage. Leurs travaux marquaient l’arrivée de l’ère moderne, qui influença tous les développements futurs dans l’étude de l’apprentissage animal et humain.
  28. 28. -28- Ils amenèrent l’idée que la mémoire était constituée de deux unités de stockage : la mémoire à court terme et la mémoire à long terme. La mémoire à court terme est considérée comme une mémoire temporaire ne pouvant contenir qu’une petite quantité d’information. L’exemple classique de ce type de mémoire est lorsque l’on veut se rappeler d’un numéro de téléphone: un numéro de sept chiffres se retient bien, mais une difficulté s’ajoute lorsque l’indicatif régional de trois chiffres est ajouté. C’est donc une mémoire temporaire et fragile car, si la personne subit une légère distraction, elle oubliera rapidement le numéro. La façon de retenir l’information dans la mémoire à court terme est de se la répéter encore et encore. Ce processus de répétition de l’information est appelé « rehearsal ». La mémoire à long terme, à l’opposé, est reconnue pour être un endroit où la connaissance repose de façon permanente; de plus, elle ne présente pas de limitation apparente de capacité. L’idée de base de la distinction de ces deux types de mémoire existe depuis un certain nombre d’années. Broadbent (1957) a été l’un des premiers à les décrire. Atkinson et Shiffrin rassemblèrent ces idées en une théorie précise, exprimée sous forme d’un modèle mathématique et d’un modèle de simulation informatique. La Figure 2.7 illustre la base de leur théorie. L’information arrive à la mémoire à court terme par le biais du processus de perception. Ensuite pour que l’information soit transférée dans la mémoire à long terme, il faut répéter cette information. À chaque répétition il y a une chance que l’information se déplace vers la mémoire à long terme. Ainsi, l’augmentation du nombre de répétitions d’une information augmente la probabilité de rétention de celle-ci dans la mémoire à long terme. Étant donné l’espace limité dans la mémoire à court terme, la répétition d’une nouvelle information entraîne la perte d’une autre information.
  29. 29. -29- Répétition Mémoire à Mémoire à Information Tranfert court terme long terme Déplacé Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin Suite à la théorie innovatrice de Atkinson et Shiffrin faisant la distinction entre la mémoire à court terme et la mémoire à long terme, de grandes questions soulevèrent la communauté scientifique. La structure, l’organisation et les conditions de récupération de l’information sont des avenues importantes qui n’ont pas été mentionnées. Le fait que maintenant les psychologues proposent de nouvelles théories suite aux échecs des théories précédentes représente un avancement considérable. La section 2.1 a montré que la psychologie s’est déplacée au-delà des arguments verbaux pour se préciser et ainsi produire des modèles qui peuvent être testés donc maintenues ou rejetés. Nous avons pu comprendre les enjeux des recherches en psychologie en nous positionnant correctement sur les concepts importants de la mémoire humaine.
  30. 30. -30- 2.2 Théories de la mémoire L’histoire des recherches sur la mémoire est relativement jeune et évidemment très complexe. Les dernières décennies ont beaucoup développé les méthodes expérimentales (voir section précédente) et, suivant cela, les théories cognitives ont commencé à émerger. Il est évident que les « preuves » de ces théories sont empiriques, mais celles-ci constituent néanmoins une avancée dans le domaine de la recherche en psychologie. Voici donc les principales théories concernant successivement la mémoire perceptuelle, la mémoire à court terme, la mémoire de travail et la mémoire à long terme. Nous allons, pour chacun de ces types de mémoires, détailler les phénomènes et les mécanismes qui leur sont rattachés dans le but de comprendre leur fonctionnement. 2.2.1 Mémoire perceptuelle La première question à se poser est la suivante : comment l’information présente dans l’environnement s’enregistre-t-elle dans une mémoire permanente? Le système perceptuel, comme celui de la vision ou de l’audition, transforme les signaux arrivant aux capteurs (œil, oreille, etc.) en représentation perceptuelle. Cette représentation doit être stockée quelque part assez longtemps pour pouvoir être analysée et ainsi créer la représentation correspondante. Beaucoup de recherches se sont orientées dans le but d’étudier les propriétés de ces endroits temporaires qui stockent l’information de la vision ou de l’audition. L’une des premières expériences concluantes sur le sujet fût celle de Sperling [Sperling, 1960] qui traça une courbe du nombre d’items mémorisés dans la mémoire visuelle selon le temps d’exposition de l’information (Figure 2.8). La conclusion fût qu’après avoir enlevé le stimulus visuel, la mémoire visuelle du sujet contenait toute l’information mais celle-ci s’effaçait très rapidement. En 1967, Neisser [Neisser, 1967] supposa que la mémoire visuelle reflétait l’activation neuronale responsable du système visuel. Sakitt [Sakitt, 1976], quant à elle, énonça l’idée que la mémoire était située dans les photorécepteurs de la rétine. Elle montra que les propriétés de la mémoire visuelle étaient très semblables aux propriétés sensitives présentes dans l’utilisation d’une vision nocturne. Selon cette analyse, la mémoire visuelle se
  31. 31. -31- comparerait à l’image résiduelle d’un éclair dans la nuit. En 1983, Haber [Haber, 1983] remit en question l’idée puisque l’humain ne perçoit pas le monde seulement par des flashs. Coltheart (1983) lui répondit que la majorité de l’information acquise est obtenue dans les premières 50 ms de fixation (les yeux étant presque toujours en mouvement pour scruter les objets). Sperling Mean number of letters 3,5 3 2,5 recalled 2 1,5 1 0,5 0 0 0,2 0,4 0,6 0,8 1 Delay of Tone, (Sec) Figure 2.8 : Résultat du rapport de Sperling Plusieurs chercheurs ont donc élaboré des théories sur la structure et les propriétés de cette mémoire visuelle. Cependant, il n’y a aucun concensus établi sur la nature de celle-ci; la seule chose sur laquelle ils s’entendent tous, c’est qu’elle existe ! 2.2.2 Mémoire à court terme La mémoire à court terme a été très critiquée au cours du temps. Personne ne semblait en accord avec les différentes théories proposées. Il faut rappeler que la mémoire à court terme a été introduite uniquement pour expliquer les différences notables que la théorie de la mémoire à long terme n’expliquait pas. Les données empiriques recueillies au cours des années ont permis d’identifier certains phénomènes reliés à la mémoire en générale. Il était très difficile de comprendre et d’expliquer toutes ces données si l’introduction d’une mémoire à court terme n’était pas faite entre la
  32. 32. -32- mémoire perceptuelle et la mémoire à long terme. Cette section considère donc les phénomènes et les mécanismes de la mémoire à court terme en tentant de comprendre les théories et les différents problèmes associés. 2.2.2.1 Effets de la répétition Les premières études montrèrent que plus une information était répétée, plus elle était mémorisée [Rundus, 1971]. Ce résultat venait confirmer le modèle de Atkinson & Shiffrin proposé en 1968. Cependant, l’étude de Glenberg, Smith et Green en 1977 [Glenberg, 1977] ne pût corroborer cette théorie suite à l’une de leur expérience. Les sujets devaient mémoriser un nombre de quatre chiffres pendant 2 secondes pour ensuite répéter un mot pendant 2, 6 ou 18 secondes et finalement redire le nombre précédemment appris. Le nombre d’essais de l’expérience fût de 64. Après l’expérience, les chercheurs demandèrent aux sujets de se rappeler du mot qui avait été répété. Les sujets pensaient que l’expérience portait sur la mémorisation du nombre et non du mot. Les résultats furent donc désastreux : 11, 7 et 12 % de réussite pour 2, 6 et 18 secondes de répétition respectivement. Cette étude montre qu’il n’y aurait pas de relations entre le nombre de répétitions et la mémorisation. Une autre expérience de Craik et Watkins (1973) montrait qu’aucune relation ne pouvait être faite entre le nombre de répétitions et la probabilité de se rappeler l’information. Si le fait de répéter l’information n’influence pas la mémoire, alors quel est le phénomène qui détermine notre mémorisation ? Rundus [Rundus, 1971] trouva une relation entre le nombre de répétitions et la mémoire mais, à la lumière des expériences précédentes, nous savons qu’il y a une variante. En 1972, Craik et Lockart [Craik & Lockart, 1972] proposaient une théorie voulant que pour mémoriser correctement, l’information doit être répétée à un niveau de profondeur acceptable. En d’autres termes, la répétition passive n’améliore pas la mémorisation. La théorie a été passablement critiquée en raison du concept de profondeur qui était trop vague. Il n’en reste pas moins que selon les expériences, la répétition à elle seule n’augmente pas la mémorisation. Cela vient confirmer le modèle de Atkinson et Shiffrin selon lequel l’information se transfère dans la mémoire à long terme par la répétition verbale.
  33. 33. -33- 2.2.2.2 Regroupement (Chunking) et capacité L’organisation de la mémoire à court terme est effectuée d’une façon bien précise, sous forme de regroupements ou « chunks ». Essayez de lire la série « A T W B I Y T G Q W E», pour ensuite la répéter. Si vous n’avez aucune erreur, c’est que vous disposez d’une mémoire immédiate très efficace sinon, vous risquez de faire 2 ou 3 erreurs. Par contre, si vous faites la même expérience avec la série « N O N E F F I C A C E », vous allez remarquer qu’elle se retient beaucoup plus facilement. En fait, ces deux séries de 11 lettres ne se classent pas de la même façon dans la mémoire à court terme. La première série comprend 11 lettres n’ayant aucun lien entre elles, il est donc difficile d’effectuer des regroupements. La seconde série, par contre, peut être regroupée en 2 « chunks », soit « NON » et « EFFICACE » ce qui facilite la mémorisation. La mémoire à court terme peut retenir environ 7 chunks ± 2 [Miller, 1956]. Il est possible d’emmagasiner beaucoup d’information dans la mémoire perceptuelle et beaucoup d’information dans la mémoire à long terme. Cependant, le transfert de toute cette information d’une mémoire à l’autre est difficile puisqu’il faut la traiter dans la mémoire à court terme qui a une capacité très limitée. Il y a donc une énorme limitation sur la quantité d’éléments que nous pouvons mémoriser [Miller, 1956 ; p.95]. Évidemment, la solution à la limite de capacité de la mémoire à court terme se trouve dans la caractéristique qui est de regrouper l’information: cela nous permet de mémoriser beaucoup plus d’éléments. Cependant, la capacité de regrouper des éléments dépend directement des stimuli en relation avec l’observateur. Certains stimuli sont plus facilement groupables chez certaines personnes parce qu’elles ont une expérience différente en rapport avec le matériel présenté. Par exemple, un anglophone aura plus de difficulté qu’un francophone pour retenir une série de mots en français. La mémoire à court terme a donc une capacité de stockage ou de traitement limitée à environ sept « chunks ». La façon de regrouper l’information en « chunks » est aussi l’une des principales caractéristiques de la mémoire à court terme et cela permet d’augmenter la quantité d’information retenue.
  34. 34. -34- 2.2.2.3 Rétention et oubli La mémoire semble s’effacer au fil du temps. Plusieurs expériences déterminent que la perte de la mémoire est une fonction du temps. Nous avons précédemment présenté les travaux d’Ebbinghaus portant sur la fonction de rétention. La fonction de rétention démontrait comment la performance de la mémoire diminuait avec le temps. Toutes les fonctions de rétention ont sensiblement le même comportement: initialement, l’oubli est rapide mais la courbe s’estompe aussi rapidement. Mais est-ce que la perte d’information n’est fonction que du temps ? Il existe deux grandes théories pour expliquer l’oubli dans la mémoire à court terme. La première théorie suppose que la trace de l’information qui est en mémoire décroit avec le temps (decay hypothesis). La seconde hypothèse suppose que l’oubli survient suite à l’ajout de nouvelles informations stockées en mémoire. Cela causerait donc de l’interférence sur les informations déjà présentes dans la mémoire à court terme (interference hypothesis). Si l’hypothèse selon laquelle l’information s’efface progressivement en mémoire est juste, la variable déterminante pour savoir si oui ou non l’information est récupérable est le temps écoulé. Plus le délai est long, plus l’oubli est fort et vice versa. Par contre, si l’oubli est le résultat de l’interférence entre les informations, le facteur déterminant devrait être la nature de l’information qui survient au moment présent. Plus il y a de liens entre les informations présentes dans la mémoire à court terme, plus l’interférence augmente ce qui résulte en une augmentation de l’oubli. Évidemment, les recherches [Baddeley, 1998, 1996] montrent qu’il ne s’agit pas de l’une ou l’autre des hypothèses mais bien d’une combinaison des deux. Beaucoup d’études ont été effectuées sur les circonstances du phénomène de l’oubli dans la mémoire à court terme [Brown & Hulme, 1995 ; Kieras, Meyer, Mueller & Seymour, 1998]. C’est un domaine très complexe ou aucune conclusion claire n’a été proposée. C’est pourquoi nous mentionnons le phénomène sans trop nous y attarder. Des modèles récents de la mémoire de travail et de la mémoire à court terme proposent des fonctions de rétention liées au temps d’extinction et à
  35. 35. -35- l’interférence [Dosher, 1999 ; Dosher & Ma, 1998 ; Lewandowsky & Murdock, 1989; Rubin & Wenzel, 1996; Wickelgren, 1970]. Cependant, ces modèles sont très difficiles à utiliser dans le contexte de notre projet car les fonctions ont besoin d’informations très précises sur l’acquisition et l’encodage des éléments dans la mémoire, ce que nous n’avons pas. 2.2.2.4 Différence d’encodage Un argument permettant de séparer la mémoire à court et à long terme fût la différence d’encodage de l’information dans ces deux dernières. Il semblait que l’encodage dans la mémoire à court terme était de nature sensorielle. Une expérience classique de Kintsch et Buschke (1969) montra la distinction entre ces deux mémoires. L’expérience consistait à présenter visuellement 16 mots aux sujets au rythme d’un mot toutes les deux secondes. Ensuite ils demandèrent aux sujets de répéter tous les mots dans la liste qui suivaient un mot en particulier. L’hypothèse était que les sujets répétaient les derniers mots de la liste dans leur mémoire à court terme. Suivant cela, les sujets devraient avoir de bons résultats lorsque les derniers mots de la liste sont demandés puisqu’ils sont répétés. Ce résultat fût observé tel qu’attendu et ce phénomène fût appelé recency effect. La mémorisation du reste de la liste dépend de la mémoire à long terme. Kintsch et Bushke raisonnèrent sur le fait que la mémoire à court terme était de type verbal. Il y aurait de l’interférence acoustique si les mots de la liste avaient une sonorité semblable (exemple : sea et see). Si on demandait au sujet de répéter les mots suivant see, il pourrait répéter les mots suivant sea. Les problèmes devraient être plus nombreux vers la fin de la liste étant donné l’encodage acoustique de la mémoire à court terme. Quant aux mots du début de la liste, ils devraient se produire une confusion sémantique si des synonymes sont présents (sea et ocean). La raison est que les premiers mots de la liste sont dans la mémoire à long terme, qui se veut une mémoire sémantique. Les hypothèses de Kintsch et Bushke furent vérifiées et ces chercheurs conclurent qu’il y avait une différence d’encodage entre la mémoire à court terme et la mémoire à long terme.
  36. 36. -36- Évidemment, la théorie fût critiquée mais l’idée de base de la différence d’encodage entre les deux mémoires fût respectée. 2.2.3 Mémoire de travail Il existe une multitude de mémoires permettant de maintenir provisoirement l’information disponible. Il y a le système sensoriel qui retient brièvement l’information qu’il reçoit pour que l’organisme ait une chance de l’encoder dans une mémoire permanente. L’information peut aussi être maintenue dans des tampons sensoriels par la répétition (slave rehearsal processes) [Baddeley, 1986]. Toutes ces mémoires transitoires sont utilisées pour guider le traitement de l’information. Pour être juste dans nos propos, il faut donc parler de ces types de mémoire comme étant la mémoire de travail. La mémoire de travail amenée par Baddeley diffère de la mémoire à court terme sur les points suivants. Premièrement, la mémoire de travail se compose de trois composantes servant au traitement parallèle de l’information. Il y a le système central (central executive) qui est un contrôleur d’attention soutenu par deux systèmes esclaves : le phonological loop et le visuo-spatial sketch pad. Visuo- Phonological Spatial Central Loop sketch pad executive Figure 2.9 : Représentation de la mémoire de travail de Baddeley Le système phonological loop comprend un endroit de stockage de l’information ainsi qu’un mécanisme de répétitions (rehearsal process). Ce système semble être impliqué dans l’apprentissage à long terme phonologique comme dans l’acquisition de nouveaux mots par exemple. Le deuxième système esclave, visuo-spatial sketch pad, est un système qui stocke et manipule des images visuelles. Il est impliqué dans l’apprentissage et la mémorisation par imagerie.
  37. 37. -37- Le système central, quant à lui, est la composante la plus complexe et la moins comprise de la mémoire de travail. Ce système contrôle les deux systèmes esclaves tout en assurant un lien avec la mémoire à long terme. Le système central aurait aussi une capacité de traitement de l’information limitée ce qui expliquerait le phénomène du nombre magique de Miller. 2.2.4 Mémoire à long terme Selon une citation célèbre de Edridge-Green (1900), « la mémoire est la fonction la plus importante de notre cerveau… Sans la mémoire, toute l’expérience acquise serait inutile. » Cela énonce bien l’utilité et l’importance de la mémoire en général. Cependant, la mémoire à long terme reflète encore mieux cette citation, car c’est avec cette structure que la mémorisation permanente est effectuée. Cette section traite de la mémoire à long terme, de sa structure et de ses mécanismes. 2.2.4.1 Structure Ces dernières années, les chercheurs ont tenté de catégoriser les différentes fonctions de la mémoire à long terme. Le résultat fût la subdivision de la mémoire à long terme en plusieurs catégories. Mémoire à long terme Déclarative Non Déclarative Faits Événements Aprentissage Habileté Conditionnement non associatif Figure 2.10 : Taxonomie de la mémoire selon Squire (1993)
  38. 38. -38- Il existe plusieurs organisations et subdivisions de la mémoire à long terme mais la plus courante dans la littérature est la taxonomie de Squire (1993). Comme le montre la Figure 2.10, la grande distinction si situe entre la mémoire déclarative (mémoire explicite) et la mémoire non déclarative (mémoire implicite). La mémoire déclarative stocke la connaissance de la mémoire à long terme pouvant être récupérée de façon consciente. En d’autres termes, le fait de récupérer l’information dans la mémoire déclarative veut dire que cette information est consciente et que vous savez qu’elle est disponible. De l’autre côté, la mémoire non déclarative ou implicite stocke la connaissance qui peut influencer le comportement sans une implication consciente de votre part. Notre revue bibliographique ne traite que de la mémoire déclarative étant donné la nature du projet que nous développons. Il n’est pas, à ce stade-ci, pertinent d’explorer la façon dont le cerveau stocke l’information implicite, puisque notre système ne considère pas directement ce genre de distinction. Le but de nos recherches est de développer un modèle de mémoire déclaratif pour la mémorisation d’événements, d’objets, d’états ou de localisation spatiale. Nous ne traitons pas de conditionnement ou d’apprentissage à ce stade-ci du projet. Il n’est donc pas nécessaire de s’attarder sur les théories de la mémoire implicite. La mémoire déclarative ou explicite se compose de deux structures : la mémoire épisodique et la mémoire sémantique. Si vous vous demandez quel est le nom de famille de votre mère, vous faites appel à de l’information dans la mémoire épisodique. Lorsque vous récupérez cette information, vous être conscient de celle-ci et vous pouvez verbalement énoncer ce nom. La mémoire épisodique sert aussi à stocker l’histoire. C’est l’habileté mentale à revivre certaines situations pour en extraire des informations et pour anticiper sur le futur [Wheeler, Struss & Tulving, 1997]. En revanche, si je vous demande ce qu’est un nom de famille, vous irez chercher l’information dans la mémoire sémantique qui contient votre connaissance générale du monde. La question vous demande de relier des concepts et des idées, incluant votre connaissance sur la façon d’exprimer ces concepts et ces idées dans un langage donné. Lorsque l’information est récupérée, elle devient explicite : le concept est maintenant devenu conscient et vous pouvez y faire appel.
  39. 39. -39- Lorsqu’on s’attarde aux mécanismes de la mémoire à long terme, on s’apperçoit que ce sont sensiblement les mêmes que ceux présents dans la mémoire à court terme. Il y a le phénomène de la répétition qui aide la mémorisation d’un élément. La théorie de Craik et Lockhart sur l’attention s’applique de la même façon que dans la mémoire à court terme. L’organisation de l’information est aussi semblable et considère des regroupements de ce qui est mémorisé (chunking). La fonction de rétention réagit de la même façon dans la mémoire à long terme que dans la mémoire à court terme. Les hypothèses sur celle-ci sont aussi les mêmes : interférence et diminution graduelle de la trace (decay hypothesis). Cependant, l’information semble s’oublier moins rapidement que dans la mémoire à court terme. Est-ce la fonction de rétention qui est différente ou est-ce la force de la trace dans la mémoire à long terme qui est supérieure ? Est-ce que l’interférence joue un rôle moins dominant étant donné la capacité illimitée de la mémoire à long terme ? Toutes ces questions ont amené certains chercheurs [McKoon & Ratcliff, 1986; Tulving, 1989] à s’interroger sur la raison d’être de la mémoire à court terme puisque tous les mécanismes de la mémoire à long terme sont suffisants pour expliquer le comportement de la mémoire à court terme [Anderson, 1993]. C’est ainsi qu’ils ont proposé une hypothèse selon laquelle la mémoire à long terme ne serait qu’une seule et même structure composée de plusieurs mécanismes de traitement. 2.3 Les modèles de mémoire Nous avons étudié différentes théories portant sur la mémoire en explorant les propriétés des mémoires (structure, rétention, encodage, etc.). Il est maintenant temps de regarder ce que la théorie a produit concernant les modèles de la mémoire. Il faut bien comprendre que, en psychologie, il existe une différence entre les théories et les modèles. Les théories sont des avenues proposées pour expliquer un phénomène expérimental sur un sujet bien précis (par exemple la théorie de la rétention de la mémoire à court terme). Les modèles, de leur côté, rassemblent toutes ces théories pour former un tout cohérent qui devrait valider et prédire les phénomènes associés aux mécanismes de mémoire. Jusqu’ici, nous n’avons vu que des théories sur la mémoire à l’exception du modèle de Atkinson & Shiffrin qui a été présenté pour sa distinction historique. Les modèles n’ont pas une place très proéminente dans la recherche expérimentale en psychologie. Cependant, ils seront très utiles dans l’étude et la
  40. 40. -40- conception de notre modèle de mémoire. Cela nous permettra de nous concentrer sur les relations entre les théories et la modélisation des mécanismes de mémoire tout en explorant les différentes façons de représenter des mécanismes cognitifs. 2.3.1 Le modèle SAM Étant donné que l’architecte principal de SAM fut Richard Shiffrin, il n’est pas étonnant de retrouver plusieurs propriétés du modèle de double stockage [Atkinson & Shiffrin, 1968]. La mémoire à court terme est vue comme un tampon à capacité limitée permettant deux choses. Premièrement, elle affecte quel item sera stocké dans la mémoire à long terme et deuxièmement, elle est utilisée pour assembler les requêtes pour l’accès à la mémoire à long terme (semblable à la mémoire de travail). La mémoire à long terme, quant à elle, est modélisée comme étant un ensemble illimité d’interconnexions entre concepts. L’information dans cette mémoire se veut permanente et non effaçable. Tout ce qui se rapproche du phénomène de l’oubli n’est qu’un échec lors de la récupération des données. Le concept clé de l’architecture de SAM est l’image. Une image est un ensemble d’interconnexions contenant de l’information sur l’item lui-même, sur le contexte dans lequel l’item a été appris, et sur les relations avec les autres images. Le processus d’association se fait dans la mémoire à court terme. Lorsque la capacité du tampon est excédée, une règle de remplacement détermine quel objet sera perdu. La première version de SAM en 1981 proposait que chaque item dans le tampon avait la même probabilité d’être remplacé. Dans les versions suivantes [Gillund & Shiffrin, 1984], la règle remplaçait l’item le plus vieux dans le tampon. Le concept de répétition est également présent afin d’augmenter la force des associations dans la mémoire. La force d’une association entre deux items ou entre un item et son contexte dépend du temps que ces deux objets passeront ensemble dans la mémoire à court terme. Suite à cela, un modèle assez complet de récupération et de reconnaissance est élaboré dans Gillund & Shiffrin 1984. Même si SAM est en mesure d’expliquer une grande variété de phénomènes psychologiques, il fait quand même l’objet de quelques critiques. Par exemple, le modèle ne prend pas en considération l’attention ou le niveau de traitement de l’information (conscience).
  41. 41. -41- 2.3.2 MINERVA 2 Le but premier du développement de MINERVA2 [Hintzman, 1988] était d’expliquer les phénomènes de la mémoire épisodique et de la mémoire sémantique. Étant donné que ces mémoires ont un niveau d’abstraction assez élevé, il fallait émettre plusieurs hypothèses au départ : 1. Seulement les traces épisodiques sont stockées en mémoire, 2. La répétition crée plusieurs traces d’un même item en mémoire, 3. Une requête contacte simultanément toutes les traces en mémoire, 4. Chaque trace est activée selon la similarité de la requête de récupération. Le point 2 soulève une affirmation importante car MINERVA2 suggère que la répétition augmente la force de la trace en mémoire non pas par renforcement, mais bien par redondance, en produisant des copies multiples en mémoire. Ceci diffère des autres modèles dans lesquels c’est la force de la trace de l’item qui est augmenté. L’affirmation de ces hypothèses vient donc élever le niveau du modèle au-delà de l’application que nous désirons en faire. Il n’est donc pas très pertinent pour nous d’étudier plus en détails ce modèle. C’est un modèle intéressant mais la nature même des problèmes qu’il aborde n’est pas d’une grande importance pour nos agents qui sont dans un contexte particulier. C’est pourquoi nous n’aborderons pas non plus certains modèles comme TODAM [Murdock, 1997], REM [Shiffrin & Steyvers, 1997] ou les modèles connectionismes. 2.3.3 Modèle de mémoire de SOAR Le modèle de mémoire de SOAR [Newell, 1990] propose trois mécanismes reliés à la mémoire, soit l’acquisition, la récupération et l’accès. La définition de l’apprentissage du modèle est intimement reliée à la mémoire. Selon Newell, l’apprentissage fait référence au mécanisme d’acquisition de la mémoire mais aussi à celui de la récupération. Newell prétend
  42. 42. -42- que l’apprentissage n’est pas seulement l’acquisition de nouvelles connaissances mais aussi la façon de récupérer ces nouvelles connaissances. 2.3.3.1 Hypothèses de SOAR Pour débuter, étudions les différentes hypothèses que SOAR fait à propos de la mémoire et de l’apprentissage. 1- La première hypothèse est l’unité fonctionnelle de la mémoire à long terme (functionnal unity of long-term memory). Tous les modules de la mémoire à long terme devraient consister en une mémoire de reconnaissance. Cette mémoire devrait être uniforme et devrait contenir toute la connaissance, qu’elle soit épisodique, sémantique ou procédurale. Cela n’implique cependant pas un encodage unique pour toute la connaissance stockée dans la mémoire à long terme. Plusieurs niveaux peuvent être utilisés avec, pour chacun d’eux, des mécanismes différents. Par exemple, un ordinateur est fondamentalement composé de circuits manipulant des 0 et des 1. Cependant, les niveaux plus abstraits ne traitent pas nécessairement des 0 et des 1. Ils peuvent posséder différents mécanismes exploitant pourtant ce même système. Il en est de même pour le cerveau humain qui est fondamentalement composé de neurones. Ces neurones peuvent former différents systèmes s’exploitant de manière très différente même si la structure physique de base est la même. 2- La deuxième hypothèse concerne l’apprentissage par chunks (chunking-learning hypothesis). Dans SOAR, tout l’apprentissage à long terme s’effectue par regroupement (chunking). L’unité de l’apprentissage est le morceau ou chunk. Newell admet que le « chunking » n’est pas le seul mécanisme de l’intelligence mais il est, selon lui, suffisant pour supporter toutes les directions de l’hypothèse de l’apprentissage par « chunks ». 3- La troisième considération de Newell est la fonctionnalité de la mémoire à court terme. Une architecture ne serait pas complète sans l’intégration d’une mémoire à court terme servant à fermer la boucle entre tous les éléments d’une mémorisation. SOAR appelle cette mémoire la mémoire de travail. Par sa nature, cette mémoire est temporaire et change au rythme des opérations du système.
  43. 43. -43- 2.3.3.2 Théorie qualitative de SOAR Nous allons maintenant nous concentrer sur la théorie qualitative de l’apprentissage de SOAR. Cette théorie est intéressante puisqu’elle vient mettre en relation plusieurs théories de la mémoire que nous avons vues précédemment. 1- Tout ce qui est appris provient d’une activité qui consistait à accomplir un but (goal- oriented activity). C’est probablement la caractéristique la plus importante du mécanisme de chunking. Pour apprendre (ou mémoriser), l’organisme doit avoir un objectif à atteindre. Il n’a pas le but d’apprendre puisque l’apprentissage n’est pas délibéré. Nous acquérons seulement la connaissance nous permettant d’accomplir notre but. 2- Une des propriétés les plus intéressantes pour nous est celle concernant l’apprentissage par répétition. La répétition est le mécanisme par lequel l’information est retenue dans la mémoire à court terme. Dans le modèle de Atkinson et Shiffrin, la répétition était considérée comme le seul mécanisme permettant à l’information dans la mémoire à court terme de se transférer dans la mémoire à long terme. Comme nous l’avons vu, cette hypothèse a été critiqué par la théorie Craik et Lockhart (depth-of-processing). Suite à cela, SOAR indique que la répétition a des effets positifs sur la rétention de la mémoire si ce qui est répété est d’intérêt. Si aucune tâche n’est effectuée et que la répétition n’est qu’un comportement passif, alors l’acquisition à long terme ne pourra pas s’effectuer. SOAR est donc en accord avec la théorie de Craik et Lockhart. 3- La dernière propriété concerne le regroupement (chunking) qui serait, pour plusieurs, la façon dont la mémoire est organisée. Newell se base sur les résultats de DeGroot en 1965 et de Chase & Simon en 1973 sur la perception d’un jeu d’échecs. Une personne doit examiner un jeu d’échecs pendant 5 secondes et ensuite reproduire de mémoire la position de toutes les pièces. Un maître d’échecs fait un excellent travail (en moyenne 23 sur 25 pièces sont placées correctement) tandis que les résultats du débutant sont vraiment désastreux (en moyenne 3 ou 4 sur 25). En fait, ce test de mémoire perceptuelle est le test le plus rapide pour déterminer la compétence aux échecs. Le modèle qui explique ce phénomène le fait en termes de regroupements. Le maître d’échec acquiert, à travers son expérience, la capacité d’effectuer des liens fonctionnels et spatiaux entre les pièces du jeu. Le regroupement permet au maître de caractériser un arrangement complexe de
  44. 44. -44- plusieurs pièces en seulement quelques chunks. Le débutant, quant à lui, considère simplement une pièce par chunk, ce qui lui permet d’acquérir seulement la position de quelques pièces. Ces propriétés concernent la mémoire en général, mais quelle est exactement l’opinion de Newell concernant la mémoire à court terme et les mécanismes de transfert vers la mémoire à long terme? Le modèle SOAR ne considère pas vraiment la mémoire à court terme étant donné la confusion qui règne concernant son existence physique [Crowder, 1976]. SOAR considère plutôt une mémoire temporaire servant à exécuter la tâche courante (mémoire de travail). Il est donc nécessaire de remplacer la connaissance contenue dans la mémoire de travail lorsque la tâche courante change. Ce remplacement peut être effectué de plusieurs façons : par un déplacement d’informations, par un déplacement des processus manipulant ces informations ou par une modification du chemin d’accès. Le phénomène de rétention est représenté assez simplement : l’information reste accessible dans la mémoire de travail tant que la tâche courante n’est pas achevée. L’architecture de la mémoire de SOAR se compose donc de différents modules jouant chacun un rôle important. La mémoire de travail est intimement liée à la perception, aux réactions motrices et à l’accès à l’information nécessaire pour résoudre une tâche (Figure 2.11).
  45. 45. -45- Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990] Les propriétés de la mémoire dont SOAR rend compte sont, selon Newell, assez cohérentes par rapport aux caractéristiques observées chez l’être humain. Il se base sur des observations empiriques, mais il prend aussi en considération une connaissance assez complète de la littérature en psychologie. Il y a quand même un aspect important de la mémoire qui n’est pas modélisé : l’oubli de la connaissance dans la mémoire de production (mémoire à long terme). 2.3.4 Modèle de mémoire de l’architecture ACT-R Le modèle de mémoire de ACT-R [Anderson, 1990] possède deux systèmes de mémoire à long terme : la mémoire procédurale et la mémoire déclarative. Plusieurs mécanismes sont associés à ces mémoires permettant ainsi d’ajouter et de maintenir l’information. ACT-R est basé sur la théorie de l’analyse rationnelle de Anderson. Suivant cela, le système cognitif est entièrement optimisé en fonction de son environnement. Un premier exemple du rôle de l’analyse rationnelle est la mémoire déclarative. Les éléments de la mémoire déclarative sont appelés chunks et sont l’équivalent des chunks de SOAR. Chaque chunk possède une valeur d’activation représentant la probabilité que le chunk soit
  46. 46. -46- sollicité dans le contexte courant. Pour être en mesure d’estimer cette valeur, les mécanismes d’apprentissage doivent garder toujours un œil attentif sur l’environnement. Deux facteurs sont pris en compte : combien de fois le chunk a été utilisé dans le passé et combien de temps s’est écoulé depuis sa dernière utilisation. Ensuite, ACT-R possède une mémoire procédurale où la connaissance est représentée par des règles de production. Chaque règle est associée à un ou plusieurs paramètres. ACT-R définit une pile de buts (Goal-Stack) servant à empiler dynamiquement des chunks pour des usages temporaires. Comme le nom l’indique, seulement le chunk du dessus de la pile est accessible à un moment donné. Ce mécanisme est similaire à la mémoire de travail des théories cognitives ainsi qu’à celle définie par SOAR. Les mécanismes de l’architecture de la mémoire de ACT-R sont définis par des formules mathématiques et explicites, ce qui permet une modélisation plus directe comparativement au modèle de Newell. Suivant cela, une équation de l’accumulation de la force de rétention suite à la pratique a été proposée par Anderson & Fincham (1999). La force de la trace en mémoire est caractérisée comme suit : F = ∑ ti-d où ti est le temps écoulé de la ie pratique depuis l’acquisition de l’information. La constante « d » représente le taux d’apprentissage pouvant varier d’une personne à l’autre. Donc, la somme de tous les temps écoulés des pratiques de la donnée depuis son acquisition est calculée pour former la force de la trace en mémoire de l’élément mémorisé. 2.3.5 EPIC SOAR et ACT-R sont des architectures qui se concentrent sur la cognition centrale, c’est à dire les mécanismes liés directement à la mémoire et à l’apprentissage. EPIC (Executive- Process Interactive Control) [Kieras & Meyer, 1997] insiste plutôt sur l’importance de la cognition périphérique, c’est-à-dire tous les mécanismes qui interagissent avec l’environnement (perception, actions, etc.). Les auteurs affirment que la cognition périphérique est un facteur déterminant pour la performance d’une tâche. La Figure 2.12
  47. 47. -47- montre bien l’importance des systèmes périphériques en proposant un ensemble de processeurs moteurs et perceptuels. Le module perceptuel envoie les informations qu’il reçoit directement à la mémoire de travail de façon complètement asynchrone. La particularité de cette architecture est que plusieurs buts peuvent être représentés de façon non hiérarchique. De plus, plusieurs buts peuvent être actifs dans le même cycle (traitement parallèle) en autant qu’ils n’utilisent pas la même ressource périphérique. Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997] EPIC suppose ainsi que les contraintes et limitations de l’architecture sont dues à la structure des organes sensoriels et moteurs. Ce sont ces organes qui limitent l’apport et la transmission de l’information.
  48. 48. -48- 2.3.6 3CAPS Enfin, le modèle 3CAPS [Just & Carpenter, 1992] avance que les limitations du système cognitif sont liées de la capacité de la mémoire de travail. 3CAPS définit trois types de mémoires, soit la mémoire de travail, la mémoire procédurale et la mémoire déclarative. Selon la théorie de la capacité, si le maximum d’éléments est atteint dans la mémoire de travail, les processus de production activent moins d’éléments que ce dont ils ont besoin. Cela a pour effet d’oublier des éléments prématurément. Le modèle 3CAPS interprète ce phénomène comme une source de différences individuelles. L’architecture de 3CAPS ne prend cependant pas en compte l’apprentissage. 2.4 Conclusion sur l’état de l’art sur la mémoire À ce stade-ci, il est important de discerner les grandes composantes d’un modèle de mémoire et d’identifier les principales fonctionnalités de ces mêmes composantes. C’est donc ce que nous avons fait dans ce chapitre en présentant l’historique, les théories et les modèles associés à la mémoire. Plusieurs théories, phénomènes et modèles n’ont pas été présentés dans cette courte revue bibliographique sur la mémoire. Les recherches dans ce domaine sont actuellement très actives et beaucoup d’incertitude persiste dans en psychologie cognitive. Bien que nous ayons omis plusieurs travaux, toutes les références bibliographiques présentées donneront un excellent point de départ pour les recherches plus précises dans ce domaine. Notre but n’est pas de rapporter toutes les recherches sur la mémoire des dernières décennies, mais simplement de cibler les principaux phénomènes et mécanismes qui seront utiles dans le développement d’un modèle de mémoire dans le cadre de notre projet multi-agent.
  49. 49. -49- ____________________________________ Chapitre 3 Notre modèle de mémoire ____________________________________

×