SlideShare une entreprise Scribd logo
1  sur  145
JIMMY PERRON




Modélisation d’un modèle cognitif de mémoire dans un système
                   multi-agent temps réel




                               Mémoire
                                présenté
                  à la Faculté des études supérieures
                         de l’Université Laval
                           pour l’obtention
                du grade de maître ès sciences (M.Sc.)




                    Département d’informatique
                FACULTÉ DES SCIENCES ET GÉNIE
                      UNIVERSITÉ LAVAL



                             Août 2003




                        Jimmy Perron, 2003
-2-


Résumé
Le présent travail s’inscrit dans un projet visant la simulation d’un grand nombre d’agents
dans un environnement urbain 3D virtuel. En fait, le système MAGS (Multi-Agent
GeoSimulation) est une plateforme multi-agent en temps réel pouvant s’appliquer à plusieurs
domaines : simulation de foule, simulation de consommateurs dans des centres commerciaux,
simulation d’évacuations, etc. Les fondements du simulateur sont issus des approches
cognitives, ce qui implique que les agents sont dotés de comportements évolués basés sur leurs
besoins et objectifs. Cela implique aussi que les agents doivent être munis d’un outil
supplémentaire proposant des mécanismes de perception et de mémorisation de
l’environnement.


Ce mémoire présente donc un modèle détaillé de perception et de mémorisation de
l’environnement virtuel 3D. Ses mécanismes sont cohérents avec les études réalisées dans le
domaine des sciences cognitives sur la mémoire. Notre modèle de Perception-Mémoire permet
d’individualiser les agents en dotant chaque agent d’une mémoire individuelle du monde
virtuel qu’il parcourt. Il est, de plus, en mesure d’effectuer la perception et la mémorisation de
plusieurs centaines d’agents en temps réel dans la plateforme MAGS.
-3-


Préface et Remerciements
Dès le début de cette recherche, nous étions un peu impressionnés par le grand défi qu’un
système semblable représentait. Finalement, deux ans après, une première version de MAGS
(Multi-Agent GeoSimulation) vit le jour. Cette première version était le fruit d’un grand
travail de la part de toute notre équipe. Le présent travail est une contribution à ce système
dont l’instigateur est M. Bernard Moulin. Son expertise, son talent de leader, de gestionnaire et
de coordonnateur de recherche ont fait que ce projet est maintenant une chose concrète.
Suivant cela, je désire sincèrement remercier M. Moulin pour son implication, sa confiance et
sa détermination à nous initier à la recherche. Il a été un guide extraordinaire dans tout le
déroulement du projet, en plus de nous inspirer dans des périodes souvent complexes.


Deuxièmement, je tiens à souligner l’implication du RDDC Val-Cartier dans le projet MAGS.
Ils ont permis la réalisation du projet en appuyant l’équipe tant du point de vue technique
(équipement) que du point de vue financier, en fournissant un soutien boursier aux étudiants
impliqués. Ils ont toujours été convaincus du bien-fondé et de l’apport que cette recherche
pouvait amener et pour cela, je les remercie.


De plus, je tiens à remercier tous mes proches qui m’ont, d’une façon ou d’une autre, supporté
dans cette aventure. Étant donné l’ampleur du projet, le temps consacré à ceux qui me sont
chers a été considérablement limité. Ils ont quand même su comprendre et m’ont soutenu dans
cette démarche en faisant tout ce qu’ils pouvaient pour m’aider. Pour cette raison, et bien
d’autres, je les remercie et je veux qu’ils sachent qu’ils ont eu un grand rôle à jouer dans
l’aboutissement de cette étape.




Jimmy Perron
-4-


Table des matières

1     Introduction Générale ___________________________________________________ 9
    1.1   Contexte _________________________________________________________ 10
    1.2   Objectifs _________________________________________________________ 13
    1.3   Démarche et présentation du mémoire ________________________________ 14
2     Recherches antérieures sur la mémoire_____________________________________ 16
    2.1   Historique des recherches sur la mémoire _____________________________ 16
    2.2     Théories de la mémoire _____________________________________________ 30
       2.2.1    Mémoire perceptuelle ___________________________________________ 30
       2.2.2    Mémoire à court terme___________________________________________ 31
       2.2.3    Mémoire de travail______________________________________________ 36
       2.2.4    Mémoire à long terme ___________________________________________ 37
    2.3      Les modèles de mémoire ____________________________________________ 39
       2.3.1     Le modèle SAM________________________________________________ 40
       2.3.2     MINERVA 2 __________________________________________________ 41
       2.3.3     Modèle de mémoire de SOAR_____________________________________ 41
       2.3.4     Modèle de mémoire de l’architecture ACT-R _________________________ 45
       2.3.5     EPIC_________________________________________________________ 46
       2.3.6     3CAPS _______________________________________________________ 48
    2.4   Conclusion sur l’état de l’art sur la mémoire ___________________________ 48
3     Modèle de mémoire développé dans le contexte de MAGS ______________________ 50
    3.1      Fonctionnalités nécessaires et contraintes du modèle ____________________ 51
       3.1.1     Fonctionnalités_________________________________________________ 51
       3.1.2     Contraintes ____________________________________________________ 53
    3.2   Environnement de MAGS___________________________________________ 55
    3.3     Mécanisme de perception ___________________________________________ 60
       3.3.1   Algorithme de Perception de l’environnement ________________________ 62
       3.3.2   Algorithme de parcours des cellules de Palmer________________________ 63
       3.3.3   Calcul des lignes de vue ( troisième dimension ) ______________________ 64
       3.3.4   Aspect temps réel, cohérence cognitive et résultats ____________________ 69
       3.3.5   Conclusion sur la perception ______________________________________ 71
    3.4   Mémoire perceptuelle ______________________________________________ 72
    3.5   Filtre ____________________________________________________________ 73
    3.6     Mémoire de travail_________________________________________________ 80
       3.6.1   Fondements de la mémoire de travail dans MAGS _____________________ 81
       3.6.2   Structure de la mémoire de travail__________________________________ 82
       3.6.3   Capacité de la mémoire de travail __________________________________ 84
       3.6.4   Répétition et Rétention __________________________________________ 86
-5-


      3.6.5   Passage vers la mémoire à long terme _______________________________ 96
      3.6.6   L’élément mémorisé ____________________________________________ 97
      3.6.7   Conclusion sur la mémoire de travail _______________________________ 99
    3.7      Mémoire à long terme ______________________________________________ 99
       3.7.1    Structure_____________________________________________________ 100
       3.7.2    Rétention ____________________________________________________ 100
    3.8   Conclusion sur le modèle de mémoire de MAGS _______________________ 102
4     Intégration du modèle de mémoire dans MAGS _____________________________ 108
    4.1   Mémoire perceptuelle _____________________________________________ 112
    4.2   Mémoire de travail________________________________________________ 112
    4.3   Mémoire à long terme _____________________________________________ 117
    4.4   Contrôle et flux de données_________________________________________ 117
5     Résultats et conclusion _________________________________________________ 121
    5.1     Performances des mécanismes du modèle de mémoire MAGS____________ 121
       5.1.1    Perception ___________________________________________________ 123
       5.1.2    Mécanisme de Filtre____________________________________________ 125
       5.1.3    Mécanisme de Rétention ________________________________________ 126
    5.2   Analyse générale du modèle de mémoire______________________________ 127
    5.3   Discussion et conclusion sur le modèle de mémoire _____________________ 131
6     Bibliographie_________________________________________________________ 136
-6-


Table des figures
Figure 2.1 : Fonction de rétention de Ebbinghaus _________________________________ 17
Figure 2.2 : Procedure d'expérimentation de Pavlov _______________________________ 19
Figure 2.3 : Acquisition d'une réponse conditionnée _______________________________ 20
Figure 2.4 : Processus d'extinction dans le conditionnement classqiue _________________ 21
Figure 2.5 : Courbe d'apprentissage de Thorndike_________________________________ 22
Figure 2.6 : Résultat de l'expérience de Tolman ___________________________________ 25
Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin __________________________ 29
Figure 2.8 : Résultat du rapport de Sperling______________________________________ 31
Figure 2.9 : Représentation de la mémoire de travail de Baddeley ____________________ 36
Figure 2.10 : Taxonomie de la mémoire selon Squire (1993) _________________________ 37
Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]__________________________ 45
Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997] ___________________________ 47
Figure 3.1 : Mémorisation d’une relation ________________________________________ 51
Figure 3.2 : La carte des élévations ____________________________________________ 55
Figure 3.3 : Carte des élévations d'une partie de la ville de Québec ___________________ 56
Figure 3.4 : Plan (x,z) représenté par le segment A de la carte précédente ______________ 57
Figure 3.5 : LocationMap ____________________________________________________ 58
Figure 3.6 : Exemple d'accès aux agents ________________________________________ 59
Figure 3.7 : Perception dans une « height map » __________________________________ 60
Figure 3.8 : Carte de visibilité Franklin [1999] ___________________________________ 61
Figure 3.9 : Test de visibilité __________________________________________________ 63
Figure 3.10 : Algorithme de visibilité de Palmer __________________________________ 64
Figure 3.11 : Test de visiblité à l'aide d'une ligne de vue ____________________________ 65
Figure 3.12 : Triangles semblables _____________________________________________ 66
Figure 3.13 : coupe en ( x, z ) _________________________________________________ 67
Figure 3.14 : Algorithme de perception de MAGS _________________________________ 68
Figure 3.15 : Test de visibilité _________________________________________________ 69
Figure 3.16 : Mémoire perceptuelle d’un agent ___________________________________ 72
Figure 3.17 : Filtre _________________________________________________________ 74
Figure 3.18 : Identification d’objets par attributs__________________________________ 77
Figure 3.19 : Mécanismes de la mémoire de travail ________________________________ 82
Figure 3.20 : Organisation de la mémoire de travail dans MAGS _____________________ 84
Figure 3.21 : Mémoire de travail ______________________________________________ 86
Figure 3.22 : Force de la trace en mémoire d'un élément____________________________ 88
Figure 3.23 : Structure d’un élément____________________________________________ 89
Figure 3.24 : 15 répétitions en 15 unités de temps _________________________________ 90
Figure 3.25 : Évolution de la trace de Restaurant1 ________________________________ 91
Figure 3.26 : Évolution de la force de la trace de Restaurant1 dans la mémoire de travail _ 92
Figure 3.27 : Évolution de la force de la trace en mémoire après 6 répétitions___________ 93
Figure 3.29 : Fonction d'activation_____________________________________________ 94
Figure 3.30 : Fonction d'activation_____________________________________________ 95
Figure 3.31 : Structure d'un élément ____________________________________________ 98
Figure 3.32 : Mémoire à long terme ___________________________________________ 101
Figure 3.33 : Modèle de mémoire _____________________________________________ 103
-7-


Figure 3.34 : Valeurs modifiables dans le modèle de mémoire ______________________ 105
Figure 3.35 : Structure du modèle de mémoire ___________________________________ 106
Figure 4.1 : Composantes principales de MAGS _________________________________ 108
Figure 4.2 : Description d'un agent____________________________________________ 110
Figure 4.3 : Diagramme de classes du modèle de mémoire _________________________ 111
Figure 4.4 : Méthode de filtrage ______________________________________________ 113
Figure 4.5 : Algorithme de filtrage de la mémoire de travail ________________________ 114
Figure 4.6 : Algorithme pour l'ajout d'un élément dans la mémoire de travail __________ 115
Figure 4.7 : Algorithme de rétention de la mémoire de travail_______________________ 116
Figure 4.8 : Accès à un élément du "chunk" Faim ________________________________ 116
Figure 4.9 : Diagramme de séquence lors de l’appel de TMemoryState->Update() ______ 118
Figure 5.1 : Temps d'un cycle du système MAGS _________________________________ 122
Figure 5.2 : Résultat du mécanisme de perception ________________________________ 123
Figure 5.3 : Temps de calcul de la perception par rapport au rayon de perception ______ 124
Figure 5.4 : Visualisation de la zone de perception d’un agent ______________________ 124
Figure 5.5 : Résultats du modèle de mémoire (grille)______________________________ 127
Figure 5.6 : Résultats du modèle de mémoire (graphique) __________________________ 127
Figure 5.7 : Temps de calcul des composantes de MAGS___________________________ 129
Figure 5.8 : Visualisation d'une simulation______________________________________ 130
Figure 5.9 : Carte de mémoire d'un agent à un instant donné _______________________ 131
____________________________________

             Chapitre 1


             Introduction
____________________________________
-9-



1 Introduction Générale

Depuis plusieurs années, les recherches sur la réalité et la simulation virtuelle ont beaucoup
évolué. Certains phénomènes qui ne peuvent être reproduits en réalité entrent dans le domaine
d’application de la simulation virtuelle. Ces phénomènes, comme par exemple la panne d’un
moteur dans un avion, sont souvent impossibles ou trop risqués à reproduire. Les spécialistes
effectuent alors des simulations pour entraîner les pilotes à faire face à ces situations. Dans le
domaine précis de l’aéronautique, ce genre de simulateur existe et ils sont très utilisés.


Mais qu’arrive-t-il lorsque certains stratèges doivent prendre des décisions pour la sécurité ou
l’aménagement du site d’une manifestation ? Il est impossible de reproduire physiquement les
comportements d’une foule lors d’une manifestation. Il faut donc être en mesure de pouvoir
simuler, à l’aide d’un outil informatique, des phénomènes de foule.


L’idée d’un simulateur de foule dans un environnement urbain 3D est alors née. Le but de ce
simulateur est de permettre à ses utilisateurs d’orienter certaines décisions suivant les résultats
obtenus à partir de la simulation d’un phénomène de foule. La simulation doit avoir lieu dans
un environnement urbain virtuel en trois dimensions. Évidemment, le projet est très ambitieux
puisque les simulations en temps réel contenant des milliers de personnes virtuelles ne sont
pas choses courantes. De plus, le prototype du simulateur doit fonctionner sur un ordinateur de
type PC sous un environnement Windows. C’est suite à cela que le développement du
prototype du système MAGS commença. Le projet MAGS (Multi-Agent Geo-Simulation) a
pour objectif le développement d’une plateforme générale pour la création de simulations
multi-agent dans des espaces géographiques virtuels. La plateforme devra supporter des
milliers d’agents ayant des aptitudes cognitives spatiales et comportementales (perception,
mémoire, comportements, etc.). De plus, les agents devront interagir directement avec
l’environnement virtuel dans lequel ils prennent place. L’application courante de la plateforme
MAGS vise à simuler les phénomènes de foule dans un environnement urbain 3D.
-10-



1.1    Contexte

Il existe plusieurs techniques pour représenter des phénomènes de foule dans un
environnement [AJ, 1954], [Ashford, 1976], [Yuhaski, 1989], [Lovas, 1993]. Il y a
premièrement les systèmes à base de particules où chaque particule représente un agent.
L’interaction entre les particules se fait à l’aide des propriétés d’attraction, de répulsion et à
l’aide de la gestion des collisions qui sont prédéterminées pour chaque particule [Langton,
1997]. Ces systèmes physiques modélisent bien les phénomènes de foule où une foule dense
se trouve dans un environnement très restreint (évacuation d’un stade, modélisation du trafic
[RIC, 1996]). Il y a ensuite les systèmes de modélisation des fluides qui ont été utilisés pour la
première fois par Henderson [Henderson, 1974]. Dans ce cas précis, la foule est caractérisée
par certaines propriétés physiques (densité, vitesse, énergie, etc.) et elle est considérée comme
un tout se déplaçant dans un environnement souvent représenté sous forme de grille. Une autre
technique se sert des automates cellulaires pour modéliser les interactions entre plusieurs
agents (foule, trafic) [Helbing, 1999].


Traditionnellement, les chercheurs et les spécialistes du domaine de la simulation ont toujours
traité les phénomènes de foule comme étant modélisables par des systèmes physiques ou
mathématiques. Une étude au Wembley Stadium a montré que les modèles basés sur la
mécanique des fluides étaient faux. Les analyses révèlent que les « patterns » de la foule
n’étaient presque en aucun point semblables à un liquide. Suite à cette étude, un
mathématicien irlandais du nom de Keith Still a développé une série d’équations connues sous
le nom de « orchid fractal ». La théorie de Still se base sur l’aspect chaotique du
comportement d’une foule. Ses résultats ont été utilisés pour développer un système
commercial d’aide à la décision sur la planification des effets de foule [Still, 2003].


Ces systèmes, modélisés par des équations mathématiques, permettent de modéliser certains
phénomènes très spécialisés mais ils ne peuvent pas être étendus à d’autres applications plus
complexes. Ces dernières années, les chercheurs vont un peu plus loin en considérant des
variables psychologiques pour caractériser chaque individu dans une foule [Helbing, 1998]. Le
concept de self-organization effects est, maintenant, de plus en plus étudié. Suivant cela, un
-11-


modèle modélisant la dynamique individuelle des individus appelé social force model a été
proposé [Helbing & Molnar & Schweitzer, 1994], [Gipps, 1985]. Malgré le terme « social »
dans le nom du modèle, celui-ci est quand même mathématiquement représenté. Il ne prend
pas en considération les variables psychologiques individuellement. La force sociale est plutôt
une représentation des différentes influences qui agissent sur le comportement de l’individu.


Un autre laboratoire, « Virtual reality lab » dirigé par Daniel Thalmann, explore depuis
plusieurs années la vie artificielle dans un environnement virtuel. Thalmann identifie les
mécanismes à modéliser pour être en mesure d’implémenter ce qu’il appelle un humain virtuel
ou un acteur [Thalmann, 2000]. Thalmann identifie cinq composantes nécessaires qu’un
humain virtuel doit posséder. Voici les cinq composantes décrites par Thalmann.

   •   Perception : La perception est la conscience que l’on a de l’environnement qui nous
       entoure. La façon dont un agent perçoit son monde se traduit en y intégrant les
       mécanismes de la vision, de l’audition, du toucher, de l’ouïe et du goût. La perception
       est responsable de l’interaction entre l’agent et l’environnement pour qu’il puisse se
       déplacer, manipuler des objets, et ainsi pouvoir réagir à la rétroaction provenant de
       l’environnement et des autres agents. Une approche basée sur la vision offre une
       méthode universelle pour transmettre de l’information à partir de l’environnement vers
       l’agent dans le contexte de la recherche de chemins, de l’évitement d’obstacles, de la
       représentation interne des connaissances avec les mécanismes d’apprentissage et
       d’oubli [Renault et al., 1990].


       Dans le domaine de la simulation multi-agents, un agent est souvent défini comme une
       entité évoluant dans un environnement qu’elle peut percevoir et dans lequel elle peut
       agir [Franklin & Graesser, 1997]. La perception est donc essentielle à un humain
       virtuel ou un agent pour que ses comportements soient en fonction de son
       environnement immédiat.


   •   Émotions : Les émotions sont des états affectifs intenses caractérisés par une brusque
       perturbation physique et mentale [Bérubé, 1991]. Les émotions peuvent donc être la
-12-


    cause de certaines réactions de l’agent. Certains objets, agents ou actions perçus
    peuvent engendrer des émotions chez l’agent. Ainsi, les émotions ressenties par un
    agent sont causées par la perception de son environnement [Thalmann, 2000].


•   Comportements : Le module comportemental est évidemment très important lors de la
    modélisation des mécanismes d’un agent virtuel. C’est par ce mécanisme qu’est
    représenté le processus de prise de décision qui pousse l’agent à effectuer une action.
    Le comportement doit décider, à partir d’entrées (émotions, perceptions, souvenirs),
    l’action résultante sur l’environnement ou sur soi-même.


    Le comportement peut être vu d’une façon hiérarchique. Le modèle comportemental
    décompose un comportement complexe en sous-comportements beaucoup plus simples
    jusqu’à ce qu’un comportement élémentaire soit atteint [Pelletier, 2003].


•   Actions : Lorsque le module comportemental a décidé quelle est l’action à exécuter, il
    doit avoir la possibilité de le faire. De la même façon qu’un humain ne peut pas voler,
    certaines actions doivent être modélisées et d’autres non pour respecter la cohérence de
    l’univers à simuler.


    Les actions permettent l’interaction avec l’environnement et les autres agents. Ainsi,
    les agents sont en mesure de communiquer et de modifier leur entourage, ce qui garde
    la dynamique de la simulation très active.


•   Mémoire : La mémoire est la capacité de stocker et de récupérer de l’information
    provenant de la perception de l’agent. Le comportement d’un agent variera en fonction
    de son expérience passée. S’il a déjà utilisé un objet, il n’aura pas à réapprendre tout le
    processus de son utilisation. De la même façon, s’il se souvient d’un endroit en
    particulier, il n’aura pas à consulter une carte pour s’orienter. Ce sont des exemples
    simples qui démontrent que les modèles où la mémorisation est absente sont des
    modèles peu convaincants puisqu’il n’y a aucune adaption des agents.
-13-


Voici donc les mécanismes que Thalmann décrit comme étant essentiels pour une
modélisation cohérente d’un humain virtuel dans une simulation virtuelle.



1.2    Objectifs

Lorsque l’on examine attentivement les mécanismes de Thalmann décrits précédemment, l’un
d’eux semble être à la base de tous les autres. Il s’agit, bien sûr, de la perception. Privé de la
perception, un agent serait incapable d’interagir, de raisonner et d’agir sur son environnement,
ce qui est contraire à la définition de Franklin et Graesser [Franklin & Graesser, 1997]. Il
existe certaines techniques pour modéliser la perception dans un environnement virtuel, mais
ces techniques ne sont pas adaptées au contexte de notre projet. Il nous faut un mécanisme
permettant à des milliers d’acteurs de percevoir l’environnement dynamiquement et en temps
réel. C’est donc un grand pas de doter les humains virtuels de la perception mais ils doivent
également être en mesure de mémoriser ce qu’ils ont perçu. La mémoire est aussi un des
mécanismes que Thalmann décrit pour la modélisation d’un acteur virtuel. Cependant, à notre
connaissance, il n’existe, dans la littérature, aucun modèle qui rendre compte avec précision
des mécanismes de perception et de mémoire dans un contexte temps réel. Quelques
recherches en psychologie décrivent les grandes lignes et les caractéristiques d’un modèle de
mémoire, mais sans plus. De plus, ces recherches ne sont pas appliquées au domaine de la
simulation virtuelle et nous devons être en mesure d’implanter ces concepts afin de les
matérialiser.


Notre objectif dans ce mémoire est donc de définir et d’implanter un modèle complet de
perception et de mémoire dans le contexte d’une simulation multi-agent en temps réel. Nous
allons conceptualiser un modèle de mémoire, caractériser ses mécanismes, détailler et
implanter le modèle dans un système de simulation en temps réel. Ces travaux sont motivés
par le fait qu’aucun modèle de perception et de mémoire ne présente un niveau de détails
satisfaisant pour pouvoir être adapté et implanté dans un contexte de simulation multi-agent.
La finalité de ce mémoire devrait donc conduire à un modèle de mémoire efficace dont les
fonctionnalités reflètent celles de la mémoire humaine.
-14-



1.3    Démarche et présentation du mémoire

La première étape de ces recherches a été l’exploration d’ouvrages en sciences cognitives sur
les sujets de la perception, de la mémoire et de l’apprentissage. L’objectif était d’avoir une
idée claire sur le fonctionnement des mécanismes du cerveau humain. Évidemment, ces
recherches bibliographiques en psychologie nous ont amené aux limites de la connaissance
que les chercheurs ont des processus cognitifs. Nous avons quand même répertorié des
avancées intéressantes qui nous ont permis d’établir un modèle relativement cohérent par
rapport aux mécanismes humains compte tenu évidemment du contexte dans lequel il est
développé. Les résultats de ces recherches bibliographiques sont présentés dans le chapitre 2.


Par la suite, nous avons proposé un modèle complet de perception et de mémoire basé sur les
concepts présentés précédemment. Pour chacun des concepts proposés, nous avons défini et
implanté tous les mécanismes que le modèle comprenait. Pour ce faire nous avons, encore une
fois, effectué une revue scientifique pour découvrir que la documentation sur la perception et
la mémorisation dans un contexte d’une simulation virtuelle multi-agent en temps réel n’était
pas très abondante. Cependant, avec les sources trouvées, nous avons pu construire une base
solide pour finalement développer nos propres mécanismes de perception et de mémorisation
qui sont présentés dans le chapitre 3.


Une fois ces mécanismes définis, nous les avons introduits dans la simulation multi-agent
(chapitre 4) pour vérifier le bien fondé de notre modélisation et ainsi obtenir des résultats
concrets sur la faisabilité et la performance d’une telle approche (chapitre 5).
-15-




____________________________________

              Chapitre 2


  Recherches antérieures sur la mémoire
____________________________________
-16-



2 Recherches antérieures sur la mémoire

L’objectif d’une partie du projet MAGS est de développer un modèle de perception et de
mémorisation pour un système multi-agent. Nous cherchons donc à simuler, le plus
exactement possible, les mécanismes humains qui interviennent dans des situations de
mémorisation de l’environnement. Il est évident que, pour y arriver, il est essentiel de
comprendre les mécanismes cognitifs impliqués dans ce qui nous préoccupe : la perception et
la mémoire. Le but de ce chapitre est donc d’explorer le domaine de la psychologie cognitive
afin d’identifier les concepts généraux reliés à la mémoire humaines.


La première étape consiste à parcourir l’évolution historique des dernières décennies à la
recherche des avancées qui ont marqué l’histoire de la recherche sur la mémoire. Ensuite, nous
nous attarderons plus précisément sur les concepts et les mécanismes qui interviennent dans la
mémorisation. Finalement, nous étudierons les différents modèles de mémoire développés
jusqu’ici.

2.1    Historique des recherches sur la mémoire

La recherche scientifique en psychologie n’est apparue que dans la moitié du 19e siècle. C’est
donc une science très jeune qui a rapidement évolué surtout grâce aux nouveaux outils
technologiques développés durant les dernières décennies. Depuis le commencement,
l’apprentissage a été un important champ de recherche pour les scientifiques. L’une des
raisons qui ont poussé les recherches a été la théorie de l’évolution de Darwin parue en 1859
[Darwin, 1859]. Les chercheurs voulaient savoir comment se fait l’adaptation d’un membre
individuel d’une espèce donnée pendant sa vie. Il fallait donc comprendre la relation entre
l’adaptation générale d’une espèce et l’apprentissage individuel de l’individu. Cette question
est encore aujourd’hui très présente dans les différents sujets d’études.


Depuis ce temps, les théories de l’apprentissage ont occupé les chercheurs pendant plus d’un
siècle avant qu’ils ne s’intéressent plus sérieusement aux caractéristiques de la mémorisation
en tant que concept indépendant. L’apprentissage et la mémoire sont des concepts qui ont été
beaucoup entremêlés au commencement des recherches. Le terme mémorisation était presque
-17-


complètement absent. Il n’était pas rare d’utilisé le terme de l’apprentissage pour parler de la
mémorisation d’un élément. L’une des raisons était que la mémorisation d’un élément,
indiquait que nous avions appris cet élément. En fait, nous savons aujourd’hui que mémoire et
apprentissage sont des mécanismes très différents. Donc il ne faut pas être surpris si le terme
apprentissage revient souvent dans les études sur la mémorisation du début du siècle. Nous
allons ici nous intéresser à l’histoire et à l’évolution du concept de mémorisation afin de
mieux comprendre l’orientation des recherches actuelles.


Hermann Ebbinghaus (1850-1909)
Ebbinghaus a été le premier à effectuer une étude rigoureuse de la mémoire humaine, qu’il
publie en 1885 : Über das Gedächtnis (« Concerning memory »). Ebbinghaus se prend lui-
même comme cobaye dans ses expériences. Dans l’une de ses expériences, il devait apprendre
une liste de 13 syllabes aléatoires pour ensuite les répéter dans le même ordre et sans erreurs.
Il mesurait ensuite le temps nécessaire pour réapprendre la liste. Ebbinghaus était intéressé par
la facilité de l’apprentissage lorsque les concepts ont déjà été appris (le délai entre les deux
apprentissages était pris en considération). Dans l’exemple de la liste, il a gagné 64.3% de
temps entre les deux apprentissages (1156 sec (1ère fois) – 467 sec (2ième fois) / 1156 = 64.3%).
Avec ces résultats, il a obtenu ce qu’il appelle la courbe de rétention (Figure 2.1).


                                                   Fonction de rétention

                              60
                              55
              Temps gagné %




                              50
                              45
                              40
                              35
                              30
                              25
                              20
                                   0         200          400          600         800
                                       Heures de délai entre les apprentissages


                                        Figure 2.1 : Fonction de rétention de Ebbinghaus
-18-


L’apport d’Ebbinghaus est surtout au niveau de la méthodologie expérimentale pour l’étude
des phénomènes de la mémoire. Il a proposé la courbe de rétention et la courbe
d’apprentissage qui sont des outils encore très utilisés de nos jours.


Ivan Petrovich Pavlov (1849-1936)
À l’origine, Pavlov travaillait sur la physiologie de la digestion, ce qui lui valut le prix nobel
de médecine en 1904. Une partie de ses recherches consistait à mesurer le taux de salivation
des chiens lorsqu’il introduisait de la nourriture dans leurs mâchoires. Il a, par la suite,
découvert qu’après un certain nombre d’essais, les mesures exactes n’étaient plus possibles
parce que les chiens salivaient dès que Pavlov entrait dans la pièce. C’est à ce moment qu’il
commenca l’étude de ce phénomène connu maintenant sous le nom de conditionnement
classique [Pavlov, 1927]. La technique de base commence avec un stimulus non-conditionné
(« unconditionned stimulus » ou US) qui invoque une réponse non-conditionnée
(« unconditionned response » ou UR). Par exemple, la nourriture est un US et la salivation est
un UR. Ensuite, le US est combiné avec un stimulus conditionné (CS) comme une cloche.
Après un certain nombre d’essais, le CS est capable d’invoquer lui-même une réponse chez le
cobaye. Lorsqu’une réponse se produit suite au CS, on appelle cette réaction une réponse
conditionnée (CR). La Figure 2.2 illustre bien le conditionnement classique de Pavlov.
-19-




        Temps
         (a) Combinaison initiale

         Présentation de la séquence :         CS              US
                                               (cloche)        (Nourriture)



         Réponse :                                                     UR
                                                                       (Salivation)


         (b) Réponse conditionnée

         Présentation de la séquence :         CS              US
                                               (cloche)        (Nourriture)



          Réponse :                                    CR              UR
                                                       (Salivation)    (Salivation)
          (c) Extinction

          Présentation de la séquence :         CS
                                                (cloche)



          Réponse :                                     CR
                                                        (Salivation)


                       Figure 2.2 : Procedure d'expérimentation de Pavlov


Nous ne discuterons pas davantage du conditionnement dans ce document. Cependant
quelques phénomènes de bases établis par Pavlov (1927) ont quand même leur importance :


   1- Acquisition : L’amplitude de la réponse conditionnée peut être exprimée comme une
       fonction du nombre d’essais de la combinaison du US et du CS. La Figure 2.3 montre
       que le CS augmente avec le nombre de répétitions de l’expérience.
-20-




                                                       Acquisition

                      16



                      14



                      12
      Salivation CS



                      10



                       8                                                                       Salivation CS



                       6



                       4



                       2



                       0
                           0   2            4          6          8          10      12   14

                                           Nombre de répétitions de l'expérience


                                   Figure 2.3 : Acquisition d'une réponse conditionnée


2- Extinction : Qu’arrive-t-il lorsque le stimulus non conditionné (US) n’est plus combiné
   avec le stimulus conditionné (CS) ? La réponse conditionnée va diminuer si on
   augmente le nombre d’essais pour laquelle aucun US n’est présenté. Ce processus est
   connu sous le nom d’extinction. La fonction d’extinction du conditionnement est
   similaire à la fonction de rétention de la mémoire (Figure 2.4). Il y a cependant une
   différence entre les deux méthodes puisque la fonction de rétention est obtenue en
   faisant intervenir des délais d’attentes sans présenter de stimulus.
-21-



                                                                Extinction

                          14



                          12



          Salivation CS   10



                          8
                                                                                                           Salivation CS

                          6



                          4



                          2



                          0
                               0           2           4           6            8         10          12


                                                  Nombre de répétitions de l'expérience


                                   Figure 2.4 : Processus d'extinction dans le conditionnement classqiue


   3- Reprise spontanée : Quelquefois après une série d’extinctions, le CS est présenté de
       nouveau sans le US. L’amplitude de la réponse montre souvent des signes de reprise.
   4- Ordonnancement temporel : Pavlov a remarqué que le conditionnement fonctionne
       beaucoup mieux lorsque le CS (cloche) est présenté avant le US (nourriture).


Pavlov a donc catégorisé le conditionnement classique comme étant réflexif et automatique.
Les recherches actuelles tendent cependant à décrire le phénomène avec une vue beaucoup
plus cognitive. Encore aujourd’hui le conditionnement est souvent pointé comme étant un
processus simple et à la base de l’apprentissage.


Edward L. Thorndike (1874-1949)
Thorndike étudiait une situation d’apprentissage quelque peu différente. Il enfermait un chat
dans une boite et le chat devait apprendre comment sortir de la boite pour accéder à la
nourriture qui était à l’extérieur. La boite était munie d’un petit levier qu’il fallait actionner
pour ouvrir la porte et ainsi se libérer. Thorndike s’intéressait à la rapidité d’apprentissage du
chat pour sortir suite à de nombreux essais dans la boite. Ses observations ont conduit au fait
qu’au début, le chat se comportait au hasard bougeant d’un coin à l’autre de la boite sans
savoir quoi faire jusqu’à ce que, par chance, il actionne le levier pour sortir. Plus le nombre
d’essais augmentait, plus la durée du comportement hasardeux du chat diminuait, jusqu’à ce
-22-


qu’il soit capable de sortir de la boite très rapidement. Ce type d’apprentissage à été qualifié
par Thorndike comme étant un apprentissage par essais et erreurs (« trial-and-error learning »)
illustré par la Figure 2.5.



                                                          Courbe d'apprentissage

                                      70



                                      60
            Temps pour sortir (sec)




                                      50



                                      40
                                                                                                       Temps

                                      30



                                      20



                                      10



                                      0
                                           0     5             10            15              20   25


                                                     Nombre de répétitions de l'expérience




                                               Figure 2.5 : Courbe d'apprentissage de Thorndike


Le processus d’apprentissage étudié par Thorndike s’appelle le conditionnement instrumental.
Comme dans Pavlov, une réponse est apprise suite à un stimulus. Ce qui diffère c’est que dans
la boite de Thorndike, le stimulus est la boite et la réponse est l’action permettant d’ouvrir la
boite. Il serait intuitif de penser que le stimulus est la nourriture à l’extérieur mais Thorndike
explique que celle-ci joue un rôle de renforcement plutôt que de stimulus. Ainsi, Thorndike
pense que « un lien stimulus-réponse sera formé à chaque fois qu’un renforcement suit la
réponse en présence du stimulus » [Thorndike, 1898].


Clark L. Hull (1884-1952)
De 1930 à 1970, la psychologie américaine a été dominée par une série de grandes théories de
l’apprentissage. Parmi ces théories, la plus influente fût sûrement celle de Hull appelée théorie
du comportement. L’idée de base de Hull était de développer une théorie systématique
permettant d’expliquer tous les comportements. La théorie finale de Hull [Hull, 1952]
comportait plusieurs équations qui se résument en celle-ci :
-23-




E = (H x D x K) - I


Le but de cette équation (la réponse « E ») était de prédire le potentiel de réaction. Ce potentiel
est déterminé par la probabilité, la vitesse et la force avec lesquels un comportement répondra
à un stimulus. Ainsi, les réponses potentielles pour un rat enfermé dans un labyrinthe sont de
tourner à gauche, de tourner à droite ou de s’arrêter. La réponse avec le potentiel de réaction le
plus fort sera la réponse adoptée par le rat. Selon la théorie de Hull, le potentiel de réaction
serait une fonction des facteurs H, D, K et I.

H - Force de l’habitude (Habit Strength). H représente la force de l’association construite
entre le stimulus et la réponse des essais précédents.


D - Energie (Drive). Selon Hull, les comportements ne sont pas seulement le résultat d’une
habitude comme le suggère Thorndike. Hull propose que l’état d’énergie d’un organisme soit
un agent énergisant pour l’habitude. Si l’énergie est à zéro, toute la force du monde lié à
l’habitude ne produira aucune réponse.


K - Motivation (Incentive Motivation). L’habitude et l’énergie ne sont pas suffisantes pour
expliquer les comportements. Un rat entraîné dans un labyrinthe pour chercher de la nourriture
va s’arrêter s’il sait que la nourriture a été enlevée. Si la quantité de nourriture diminue, les
performances du rat déclinent. La motivation est donc une mesure de la quantité et du délai de
la récompense.


I – Inhibition. L’inhibition reflète la fatigue et l’effet d’extinction des essais pour lesquels la
récompense n’est plus présentée.


Ce que Hull met en évidence dans sa théorie, c’est la relation existant entre l’apprentissage et
la motivation. L’apprentissage ne suffit pas à créer des comportements; il doit aussi y avoir de
la motivation.
-24-


Lorsque l’on fait une rétrospective de la théorie de Hull, on s’aperçoit que les efforts ont été
incomplets et imparfaits. Cela devenait de plus en plus apparent avec le développement de
logiciels informatiques capables de prédire de tels comportements basés sur ces théories. Il
n’en demeure pas moins que les recherches de Hull demeurent toujours une référence dans les
théories récentes de l’apprentissage et de la mémoire.


Edward C. Tolman (1886-1959)
Les théories de l’apprentissage comme celles de Hull ou de Thorndike ont fait l’objet de
plusieurs critiques dans la communauté scientifique. La critique la plus influente fût celle
d’Edward Tolman.


La première démonstration implique l’apprentissage latent, précédemment mentionné par
Thorndike avec « law of effect ». L’expérience de base de Tolman et Honzik consiste en un
labyrinthe ayant 14 points où le rat devait effectuer un choix. Trois groupes de rats ont été
utilisés pendant 17 jours parcourant 1 fois par jour le labyrinthe. Le premier groupe de rat
avait toujours de la nourriture à la fin du parcours tandis que le deuxième groupe n’avait
aucune récompense. Le troisième groupe, quant à lui, s’est vu présenter de la nourriture
seulement après le 11ième jour de l’expérience. La Figure 2.6 présente la performance des trois
groupes tout au long de l’expérience.
-25-



                                     Expérience de Tolman

                  12
                  10                                                     Aucune
                   8                                                     récompense
        Erreurs


                                                                         Toujours une
                   6
                                                                         récompense
                   4
                                                                         Récompense après
                   2                                                     11 jours
                   0
                       0    5         10          15          20
                                    Jours

                             Figure 2.6 : Résultat de l'expérience de Tolman


L’expérience indique le nombre de mauvais choix effectués par les rats tout au long du
parcours pour atteindre la sortie du labyrinthe. Le groupe ayant eu de la nourriture le 11ième
jour a dramatiquement augmenté ses performances le 12ième jour jusqu’à surpasser le groupe
qui a toujours été renforcé. Selon Tolman, les rats non renforcés (pas de nourriture)
apprennent quand même tout le labyrinthe. Cependant, leur apprentissage est en latence;
lorsqu’un but fut introduit, ils ont transformé leur apprentissage en performance. Ainsi, pour
Tolman, le renforcement n’est pas nécessaire à l’apprentissage mais il est nécessaire pour la
performance.


Newell & Simon (1961)
Lorsque le behaviorisme commença à éprouver des difficultés expérimentales dues à la
complexité de l’être humain, une nouvelle méthode pour la construction de théorie vit le jour.
Cette méthode, basée sur la simulation par ordinateur, a beaucoup attiré l’attention des
chercheurs en psychologie. L’approche a été développée par Allen Newell et Herbert Simon,
deux collaborateurs à l’université Carnegie Mellon qui oeuvraient dans le domaine de
l’intelligence artificielle (IA).
-26-


Newell et Simon montrent que la simulation par ordinateur peut utiliser la puissance de cette
technologie pour effectuer des prédictions de théories scientifiques complexes. La technique
de simulation a bouleversé la nature théorique de la psychologie.


Newell et Simon font plus que de la simulation: influencés par le développement de l’IA, ils
mettent en relation la cognition humaine et l’ordinateur. C’est à partir de ce moment
qu’émerge la métaphore de l’ordinateur qui a vraiment été difficilement acceptée par les
psychologues. Pour eux, le cerveau humain est très différent d’un ordinateur et cette théorie
basée sur l’analogie de la cognition et d’un ordinateur semble être une erreur [Rumelhart &
McClelland, 1986]. Par la suite, Newell et Simon développèrent plusieurs simulations pour
des problèmes d’apprentissage et de cognition. Cependant, ce n’est pas ce qui a forgé leur
place dans l’histoire: leur grande contribution s’est faite au niveau de la résolution de
problèmes.


La plus grande difficulté des théories précédentes était de déterminer la relation entre la
connaissance (ce que l’organisme apprend par expérience) et les comportements. Quelques
théories comme celles de Thorndike et Hull combinent ces deux concepts et ne font aucune
différence entre la connaissance et les comportements. Newell et Simon montrent comment la
connaissance peut être séparée de la partie comportementale. Suivant cette voie, ils montrent
que la théorie du comportement appliquée rigoureusement pourrait permettre des constructions
mentales. Cette démonstration met en pièces le doute contre le mentalisme que Watson avait
énoncé dans les années 50. Suite à cela, Newell et Simon établissent les bases d’une révolution
cognitive transformant ainsi tous les champs de la psychologie y compris l’apprentissage.


Ce qu’il faut retenir du travail de Newell et Simon, c’est ce qu’ils appelaient le GPS (General
Problem Solver) [Newell & Simon, 1972]. Le GPS est une simulation par ordinateur utilisant
le déploiement de la connaissance en résolution de problèmes de la façon suivante.


   1- Identifier la différence majeure entre la situation courante et le but à atteindre; il faut se
       concentrer sur le but.
   2- Choisir une action susceptible d’éliminer cette différence (opérateur)
-27-


   3- Si l’opérateur est applicable, l’appliquer. Sinon, définir un sous-but qui rendra
       l’opérateur applicable et reprendre à l’étape 1.


Newell et Simon (1972) donnent cet exemple tiré de la vie de tous les jours pour expliquer
leur analyse.


   1- But : Je veux amener mon fils à l’école. Quelle est la différence entre ce que j’ai et ce
       que je veux? C’est la distance.
   2- Opérateur : Qu’est-ce qui change la distance? Mon automobile.
   3- Applicable ? Mon automobile ne fonctionne pas!
       Nouveau but : Que faut-il pour qu’elle fonctionne? une nouvelle batterie.
   1- But : Me procurer une nouvelle batterie....
   2- ...


L’exemple complet se trouve dans leur ouvrage de 1972 mais le concept important de la
théorie est celui de sous-buts. À l’aide des sous-buts, il est possible d’organiser des
comportements cohérents en réponse à des situations très complexes. Ceci représente une
avancée majeure par rapport au concept de réponses de Skinner.


Newell et Simon montrent donc que la simulation par ordinateur peut être utilisée pour
modéliser des processus cognitifs complexes. De plus, ils montrent qu’à l’aide de leur
approche GPS, il est possible de convertir la connaissance en comportements.


Modèle de mémoire de Atkinson & Shiffrin, 1968
C’est en 1968 que Richard Atkinson et Richard Shiffrin publiaient une théorie sur la mémoire
humaine. Cette théorie amena une vision nouvelle sur la nature de la mémoire humaine qui,
jusqu’ici, avait été un peu négligée au profit des théories de l’apprentissage. Leurs travaux
marquaient l’arrivée de l’ère moderne, qui influença tous les développements futurs dans
l’étude de l’apprentissage animal et humain.
-28-


Ils amenèrent l’idée que la mémoire était constituée de deux unités de stockage : la mémoire à
court terme et la mémoire à long terme. La mémoire à court terme est considérée comme une
mémoire temporaire ne pouvant contenir qu’une petite quantité d’information. L’exemple
classique de ce type de mémoire est lorsque l’on veut se rappeler d’un numéro de téléphone:
un numéro de sept chiffres se retient bien, mais une difficulté s’ajoute lorsque l’indicatif
régional de trois chiffres est ajouté. C’est donc une mémoire temporaire et fragile car, si la
personne subit une légère distraction, elle oubliera rapidement le numéro. La façon de retenir
l’information dans la mémoire à court terme est de se la répéter encore et encore. Ce processus
de répétition de l’information est appelé « rehearsal ». La mémoire à long terme, à l’opposé,
est reconnue pour être un endroit où la connaissance repose de façon permanente; de plus, elle
ne présente pas de limitation apparente de capacité.


L’idée de base de la distinction de ces deux types de mémoire existe depuis un certain nombre
d’années. Broadbent (1957) a été l’un des premiers à les décrire. Atkinson et Shiffrin
rassemblèrent ces idées en une théorie précise, exprimée sous forme d’un modèle
mathématique et d’un modèle de simulation informatique. La Figure 2.7 illustre la base de leur
théorie. L’information arrive à la mémoire à court terme par le biais du processus de
perception. Ensuite pour que l’information soit transférée dans la mémoire à long terme, il faut
répéter cette information. À chaque répétition il y a une chance que l’information se déplace
vers la mémoire à long terme. Ainsi, l’augmentation du nombre de répétitions d’une
information augmente la probabilité de rétention de celle-ci dans la mémoire à long terme.
Étant donné l’espace limité dans la mémoire à court terme, la répétition d’une nouvelle
information entraîne la perte d’une autre information.
-29-




                                                             Répétition


                                Mémoire à                                 Mémoire à
             Information                          Tranfert
                                court terme                               long terme


                                              Déplacé




                      Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin


Suite à la théorie innovatrice de Atkinson et Shiffrin faisant la distinction entre la mémoire à
court terme et la mémoire à long terme, de grandes questions soulevèrent la communauté
scientifique. La structure, l’organisation et les conditions de récupération de l’information sont
des avenues importantes qui n’ont pas été mentionnées.


Le fait que maintenant les psychologues proposent de nouvelles théories suite aux échecs des
théories précédentes représente un avancement considérable. La section 2.1 a montré que la
psychologie s’est déplacée au-delà des arguments verbaux pour se préciser et ainsi produire
des modèles qui peuvent être testés donc maintenues ou rejetés. Nous avons pu comprendre
les enjeux des recherches en psychologie en nous positionnant correctement sur les concepts
importants de la mémoire humaine.
-30-



2.2    Théories de la mémoire

L’histoire des recherches sur la mémoire est relativement jeune et évidemment très complexe.
Les dernières décennies ont beaucoup développé les méthodes expérimentales (voir section
précédente) et, suivant cela, les théories cognitives ont commencé à émerger. Il est évident que
les « preuves » de ces théories sont empiriques, mais celles-ci constituent néanmoins une
avancée dans le domaine de la recherche en psychologie. Voici donc les principales théories
concernant successivement la mémoire perceptuelle, la mémoire à court terme, la mémoire de
travail et la mémoire à long terme. Nous allons, pour chacun de ces types de mémoires,
détailler les phénomènes et les mécanismes qui leur sont rattachés dans le but de comprendre
leur fonctionnement.


2.2.1 Mémoire perceptuelle

La première question à se poser est la suivante : comment l’information présente dans
l’environnement s’enregistre-t-elle dans une mémoire permanente? Le système perceptuel,
comme celui de la vision ou de l’audition, transforme les signaux arrivant aux capteurs (œil,
oreille, etc.) en représentation perceptuelle. Cette représentation doit être stockée quelque part
assez longtemps pour pouvoir être analysée et ainsi créer la représentation correspondante.
Beaucoup de recherches se sont orientées dans le but d’étudier les propriétés de ces endroits
temporaires qui stockent l’information de la vision ou de l’audition.


L’une des premières expériences concluantes sur le sujet fût celle de Sperling [Sperling, 1960]
qui traça une courbe du nombre d’items mémorisés dans la mémoire visuelle selon le temps
d’exposition de l’information (Figure 2.8). La conclusion fût qu’après avoir enlevé le stimulus
visuel, la mémoire visuelle du sujet contenait toute l’information mais celle-ci s’effaçait très
rapidement. En 1967, Neisser [Neisser, 1967] supposa que la mémoire visuelle reflétait
l’activation neuronale responsable du système visuel. Sakitt [Sakitt, 1976], quant à elle,
énonça l’idée que la mémoire était située dans les photorécepteurs de la rétine. Elle montra
que les propriétés de la mémoire visuelle étaient très semblables aux propriétés sensitives
présentes dans l’utilisation d’une vision nocturne. Selon cette analyse, la mémoire visuelle se
-31-


comparerait à l’image résiduelle d’un éclair dans la nuit. En 1983, Haber [Haber, 1983] remit
en question l’idée puisque l’humain ne perçoit pas le monde seulement par des flashs.
Coltheart (1983) lui répondit que la majorité de l’information acquise est obtenue dans les
premières 50 ms de fixation (les yeux étant presque toujours en mouvement pour scruter les
objets).



                                                                    Sperling
                    Mean number of letters




                                             3,5
                                               3
                                             2,5
                          recalled




                                               2
                                             1,5
                                               1
                                             0,5
                                               0
                                                   0        0,2        0,4       0,6       0,8    1
                                                                   Delay of Tone, (Sec)




                                                   Figure 2.8 : Résultat du rapport de Sperling


Plusieurs chercheurs ont donc élaboré des théories sur la structure et les propriétés de cette
mémoire visuelle. Cependant, il n’y a aucun concensus établi sur la nature de celle-ci; la seule
chose sur laquelle ils s’entendent tous, c’est qu’elle existe !


2.2.2 Mémoire à court terme

La mémoire à court terme a été très critiquée au cours du temps. Personne ne semblait en
accord avec les différentes théories proposées. Il faut rappeler que la mémoire à court terme a
été introduite uniquement pour expliquer les différences notables que la théorie de la mémoire
à long terme n’expliquait pas.


Les données empiriques recueillies au cours des années ont permis d’identifier certains
phénomènes reliés à la mémoire en générale. Il était très difficile de comprendre et d’expliquer
toutes ces données si l’introduction d’une mémoire à court terme n’était pas faite entre la
-32-


mémoire perceptuelle et la mémoire à long terme. Cette section considère donc les
phénomènes et les mécanismes de la mémoire à court terme en tentant de comprendre les
théories et les différents problèmes associés.



2.2.2.1    Effets de la répétition

Les premières études montrèrent que plus une information était répétée, plus elle était
mémorisée [Rundus, 1971]. Ce résultat venait confirmer le modèle de Atkinson & Shiffrin
proposé en 1968. Cependant, l’étude de Glenberg, Smith et Green en 1977 [Glenberg, 1977]
ne pût corroborer cette théorie suite à l’une de leur expérience. Les sujets devaient mémoriser
un nombre de quatre chiffres pendant 2 secondes pour ensuite répéter un mot pendant 2, 6 ou
18 secondes et finalement redire le nombre précédemment appris. Le nombre d’essais de
l’expérience fût de 64. Après l’expérience, les chercheurs demandèrent aux sujets de se
rappeler du mot qui avait été répété. Les sujets pensaient que l’expérience portait sur la
mémorisation du nombre et non du mot. Les résultats furent donc désastreux : 11, 7 et 12 % de
réussite pour 2, 6 et 18 secondes de répétition respectivement. Cette étude montre qu’il n’y
aurait pas de relations entre le nombre de répétitions et la mémorisation. Une autre expérience
de Craik et Watkins (1973) montrait qu’aucune relation ne pouvait être faite entre le nombre
de répétitions et la probabilité de se rappeler l’information.

Si le fait de répéter l’information n’influence pas la mémoire, alors quel est le phénomène qui
détermine notre mémorisation ? Rundus [Rundus, 1971] trouva une relation entre le nombre
de répétitions et la mémoire mais, à la lumière des expériences précédentes, nous savons qu’il
y a une variante. En 1972, Craik et Lockart [Craik & Lockart, 1972] proposaient une théorie
voulant que pour mémoriser correctement, l’information doit être répétée à un niveau de
profondeur acceptable. En d’autres termes, la répétition passive n’améliore pas la
mémorisation. La théorie a été passablement critiquée en raison du concept de profondeur qui
était trop vague. Il n’en reste pas moins que selon les expériences, la répétition à elle seule
n’augmente pas la mémorisation. Cela vient confirmer le modèle de Atkinson et Shiffrin selon
lequel l’information se transfère dans la mémoire à long terme par la répétition verbale.
-33-



2.2.2.2    Regroupement (Chunking) et capacité

L’organisation de la mémoire à court terme est effectuée d’une façon bien précise, sous forme
de regroupements ou « chunks ». Essayez de lire la série « A T W B I Y T G Q W E», pour
ensuite la répéter. Si vous n’avez aucune erreur, c’est que vous disposez d’une mémoire
immédiate très efficace sinon, vous risquez de faire 2 ou 3 erreurs. Par contre, si vous faites la
même expérience avec la série « N O N E F F I C A C E », vous allez remarquer qu’elle se
retient beaucoup plus facilement. En fait, ces deux séries de 11 lettres ne se classent pas de la
même façon dans la mémoire à court terme. La première série comprend 11 lettres n’ayant
aucun lien entre elles, il est donc difficile d’effectuer des regroupements. La seconde série, par
contre, peut être regroupée en 2 « chunks », soit « NON » et « EFFICACE » ce qui facilite la
mémorisation. La mémoire à court terme peut retenir environ 7 chunks ± 2 [Miller, 1956]. Il
est possible d’emmagasiner beaucoup d’information dans la mémoire perceptuelle et beaucoup
d’information dans la mémoire à long terme. Cependant, le transfert de toute cette information
d’une mémoire à l’autre est difficile puisqu’il faut la traiter dans la mémoire à court terme qui
a une capacité très limitée. Il y a donc une énorme limitation sur la quantité d’éléments que
nous pouvons mémoriser [Miller, 1956 ; p.95].


Évidemment, la solution à la limite de capacité de la mémoire à court terme se trouve dans la
caractéristique qui est de regrouper l’information: cela nous permet de mémoriser beaucoup
plus d’éléments. Cependant, la capacité de regrouper des éléments dépend directement des
stimuli en relation avec l’observateur. Certains stimuli sont plus facilement groupables chez
certaines personnes parce qu’elles ont une expérience différente en rapport avec le matériel
présenté. Par exemple, un anglophone aura plus de difficulté qu’un francophone pour retenir
une série de mots en français.


La mémoire à court terme a donc une capacité de stockage ou de traitement limitée à environ
sept « chunks ». La façon de regrouper l’information en « chunks » est aussi l’une des
principales caractéristiques de la mémoire à court terme et cela permet d’augmenter la quantité
d’information retenue.
-34-



2.2.2.3      Rétention et oubli

La mémoire semble s’effacer au fil du temps. Plusieurs expériences déterminent que la perte
de la mémoire est une fonction du temps. Nous avons précédemment présenté les travaux
d’Ebbinghaus portant sur la fonction de rétention. La fonction de rétention démontrait
comment la performance de la mémoire diminuait avec le temps. Toutes les fonctions de
rétention ont sensiblement le même comportement: initialement, l’oubli est rapide mais la
courbe s’estompe aussi rapidement. Mais est-ce que la perte d’information n’est fonction que
du temps ?


Il existe deux grandes théories pour expliquer l’oubli dans la mémoire à court terme. La
première théorie suppose que la trace de l’information qui est en mémoire décroit avec le
temps (decay hypothesis). La seconde hypothèse suppose que l’oubli survient suite à l’ajout de
nouvelles informations stockées en mémoire. Cela causerait donc de l’interférence sur les
informations déjà présentes dans la mémoire à court terme (interference hypothesis).


Si l’hypothèse selon laquelle l’information s’efface progressivement en mémoire est juste, la
variable déterminante pour savoir si oui ou non l’information est récupérable est le temps
écoulé. Plus le délai est long, plus l’oubli est fort et vice versa. Par contre, si l’oubli est le
résultat de l’interférence entre les informations, le facteur déterminant devrait être la nature de
l’information qui survient au moment présent. Plus il y a de liens entre les informations
présentes dans la mémoire à court terme, plus l’interférence augmente ce qui résulte en une
augmentation de l’oubli.


Évidemment, les recherches [Baddeley, 1998, 1996] montrent qu’il ne s’agit pas de l’une ou
l’autre des hypothèses mais bien d’une combinaison des deux. Beaucoup d’études ont été
effectuées sur les circonstances du phénomène de l’oubli dans la mémoire à court terme
[Brown & Hulme, 1995 ; Kieras, Meyer, Mueller & Seymour, 1998]. C’est un domaine très
complexe ou aucune conclusion claire n’a été proposée. C’est pourquoi nous mentionnons le
phénomène sans trop nous y attarder. Des modèles récents de la mémoire de travail et de la
mémoire à court terme proposent des fonctions de rétention liées au temps d’extinction et à
-35-


l’interférence [Dosher, 1999 ; Dosher & Ma, 1998 ; Lewandowsky & Murdock, 1989; Rubin
& Wenzel, 1996; Wickelgren, 1970]. Cependant, ces modèles sont très difficiles à utiliser dans
le contexte de notre projet car les fonctions ont besoin d’informations très précises sur
l’acquisition et l’encodage des éléments dans la mémoire, ce que nous n’avons pas.



2.2.2.4    Différence d’encodage

Un argument permettant de séparer la mémoire à court et à long terme fût la différence
d’encodage de l’information dans ces deux dernières. Il semblait que l’encodage dans la
mémoire à court terme était de nature sensorielle. Une expérience classique de Kintsch et
Buschke (1969) montra la distinction entre ces deux mémoires. L’expérience consistait à
présenter visuellement 16 mots aux sujets au rythme d’un mot toutes les deux secondes.
Ensuite ils demandèrent aux sujets de répéter tous les mots dans la liste qui suivaient un mot
en particulier. L’hypothèse était que les sujets répétaient les derniers mots de la liste dans leur
mémoire à court terme. Suivant cela, les sujets devraient avoir de bons résultats lorsque les
derniers mots de la liste sont demandés puisqu’ils sont répétés. Ce résultat fût observé tel
qu’attendu et ce phénomène fût appelé recency effect. La mémorisation du reste de la liste
dépend de la mémoire à long terme.


Kintsch et Bushke raisonnèrent sur le fait que la mémoire à court terme était de type verbal. Il
y aurait de l’interférence acoustique si les mots de la liste avaient une sonorité semblable
(exemple : sea et see). Si on demandait au sujet de répéter les mots suivant see, il pourrait
répéter les mots suivant sea. Les problèmes devraient être plus nombreux vers la fin de la liste
étant donné l’encodage acoustique de la mémoire à court terme. Quant aux mots du début de
la liste, ils devraient se produire une confusion sémantique si des synonymes sont présents
(sea et ocean). La raison est que les premiers mots de la liste sont dans la mémoire à long
terme, qui se veut une mémoire sémantique.


Les hypothèses de Kintsch et Bushke furent vérifiées et ces chercheurs conclurent qu’il y avait
une différence d’encodage entre la mémoire à court terme et la mémoire à long terme.
-36-


Évidemment, la théorie fût critiquée mais l’idée de base de la différence d’encodage entre les
deux mémoires fût respectée.

2.2.3 Mémoire de travail

Il existe une multitude de mémoires permettant de maintenir provisoirement l’information
disponible. Il y a le système sensoriel qui retient brièvement l’information qu’il reçoit pour
que l’organisme ait une chance de l’encoder dans une mémoire permanente. L’information
peut aussi être maintenue dans des tampons sensoriels par la répétition (slave rehearsal
processes) [Baddeley, 1986]. Toutes ces mémoires transitoires sont utilisées pour guider le
traitement de l’information. Pour être juste dans nos propos, il faut donc parler de ces types de
mémoire comme étant la mémoire de travail. La mémoire de travail amenée par Baddeley
diffère de la mémoire à court terme sur les points suivants. Premièrement, la mémoire de
travail se compose de trois composantes servant au traitement parallèle de l’information. Il y a
le système central (central executive) qui est un contrôleur d’attention soutenu par deux
systèmes esclaves : le phonological loop et le visuo-spatial sketch pad.




                    Visuo-                                                Phonological
                    Spatial                     Central                      Loop
                  sketch pad                   executive




                  Figure 2.9 : Représentation de la mémoire de travail de Baddeley


Le système phonological loop comprend un endroit de stockage de l’information ainsi qu’un
mécanisme de répétitions (rehearsal process). Ce système semble être impliqué dans
l’apprentissage à long terme phonologique comme dans l’acquisition de nouveaux mots par
exemple.


Le deuxième système esclave, visuo-spatial sketch pad, est un système qui stocke et manipule
des images visuelles. Il est impliqué dans l’apprentissage et la mémorisation par imagerie.
-37-




Le système central, quant à lui, est la composante la plus complexe et la moins comprise de la
mémoire de travail. Ce système contrôle les deux systèmes esclaves tout en assurant un lien
avec la mémoire à long terme. Le système central aurait aussi une capacité de traitement de
l’information limitée ce qui expliquerait le phénomène du nombre magique de Miller.


2.2.4 Mémoire à long terme

Selon une citation célèbre de Edridge-Green (1900), « la mémoire est la fonction la plus
importante de notre cerveau… Sans la mémoire, toute l’expérience acquise serait inutile. »
Cela énonce bien l’utilité et l’importance de la mémoire en général. Cependant, la mémoire à
long terme reflète encore mieux cette citation, car c’est avec cette structure que la
mémorisation permanente est effectuée. Cette section traite de la mémoire à long terme, de sa
structure et de ses mécanismes.



2.2.4.1       Structure
Ces dernières années, les chercheurs ont tenté de catégoriser les différentes fonctions de la
mémoire à long terme. Le résultat fût la subdivision de la mémoire à long terme en plusieurs
catégories.


                                  Mémoire à long terme




                Déclarative                                    Non Déclarative



          Faits           Événements          Aprentissage        Habileté       Conditionnement
                                              non associatif


                     Figure 2.10 : Taxonomie de la mémoire selon Squire (1993)
-38-


Il existe plusieurs organisations et subdivisions de la mémoire à long terme mais la plus
courante dans la littérature est la taxonomie de Squire (1993). Comme le montre la Figure
2.10, la grande distinction si situe entre la mémoire déclarative (mémoire explicite) et la
mémoire non déclarative (mémoire implicite). La mémoire déclarative stocke la connaissance
de la mémoire à long terme pouvant être récupérée de façon consciente. En d’autres termes, le
fait de récupérer l’information dans la mémoire déclarative veut dire que cette information est
consciente et que vous savez qu’elle est disponible. De l’autre côté, la mémoire non
déclarative ou implicite stocke la connaissance qui peut influencer le comportement sans une
implication consciente de votre part. Notre revue bibliographique ne traite que de la mémoire
déclarative étant donné la nature du projet que nous développons. Il n’est pas, à ce stade-ci,
pertinent d’explorer la façon dont le cerveau stocke l’information implicite, puisque notre
système ne considère pas directement ce genre de distinction. Le but de nos recherches est de
développer un modèle de mémoire déclaratif pour la mémorisation d’événements, d’objets,
d’états ou de localisation spatiale. Nous ne traitons pas de conditionnement ou d’apprentissage
à ce stade-ci du projet. Il n’est donc pas nécessaire de s’attarder sur les théories de la mémoire
implicite.


La mémoire déclarative ou explicite se compose de deux structures : la mémoire épisodique et
la mémoire sémantique. Si vous vous demandez quel est le nom de famille de votre mère, vous
faites appel à de l’information dans la mémoire épisodique. Lorsque vous récupérez cette
information, vous être conscient de celle-ci et vous pouvez verbalement énoncer ce nom. La
mémoire épisodique sert aussi à stocker l’histoire. C’est l’habileté mentale à revivre certaines
situations pour en extraire des informations et pour anticiper sur le futur [Wheeler, Struss &
Tulving, 1997]. En revanche, si je vous demande ce qu’est un nom de famille, vous irez
chercher l’information dans la mémoire sémantique qui contient votre connaissance générale
du monde. La question vous demande de relier des concepts et des idées, incluant votre
connaissance sur la façon d’exprimer ces concepts et ces idées dans un langage donné.
Lorsque l’information est récupérée, elle devient explicite : le concept est maintenant devenu
conscient et vous pouvez y faire appel.
-39-


Lorsqu’on s’attarde aux mécanismes de la mémoire à long terme, on s’apperçoit que ce sont
sensiblement les mêmes que ceux présents dans la mémoire à court terme. Il y a le phénomène
de la répétition qui aide la mémorisation d’un élément. La théorie de Craik et Lockhart sur
l’attention s’applique de la même façon que dans la mémoire à court terme. L’organisation de
l’information est aussi semblable et considère des regroupements de ce qui est mémorisé
(chunking). La fonction de rétention réagit de la même façon dans la mémoire à long terme
que dans la mémoire à court terme. Les hypothèses sur celle-ci sont aussi les mêmes :
interférence et diminution graduelle de la trace (decay hypothesis). Cependant, l’information
semble s’oublier moins rapidement que dans la mémoire à court terme. Est-ce la fonction de
rétention qui est différente ou est-ce la force de la trace dans la mémoire à long terme qui est
supérieure ? Est-ce que l’interférence joue un rôle moins dominant étant donné la capacité
illimitée de la mémoire à long terme ? Toutes ces questions ont amené certains chercheurs
[McKoon & Ratcliff, 1986; Tulving, 1989] à s’interroger sur la raison d’être de la mémoire à
court terme puisque tous les mécanismes de la mémoire à long terme sont suffisants pour
expliquer le comportement de la mémoire à court terme [Anderson, 1993]. C’est ainsi qu’ils
ont proposé une hypothèse selon laquelle la mémoire à long terme ne serait qu’une seule et
même structure composée de plusieurs mécanismes de traitement.



2.3    Les modèles de mémoire

Nous avons étudié différentes théories portant sur la mémoire en explorant les propriétés des
mémoires (structure, rétention, encodage, etc.). Il est maintenant temps de regarder ce que la
théorie a produit concernant les modèles de la mémoire. Il faut bien comprendre que, en
psychologie, il existe une différence entre les théories et les modèles. Les théories sont des
avenues proposées pour expliquer un phénomène expérimental sur un sujet bien précis (par
exemple la théorie de la rétention de la mémoire à court terme). Les modèles, de leur côté,
rassemblent toutes ces théories pour former un tout cohérent qui devrait valider et prédire les
phénomènes associés aux mécanismes de mémoire. Jusqu’ici, nous n’avons vu que des
théories sur la mémoire à l’exception du modèle de Atkinson & Shiffrin qui a été présenté
pour sa distinction historique. Les modèles n’ont pas une place très proéminente dans la
recherche expérimentale en psychologie. Cependant, ils seront très utiles dans l’étude et la
-40-


conception de notre modèle de mémoire. Cela nous permettra de nous concentrer sur les
relations entre les théories et la modélisation des mécanismes de mémoire tout en explorant les
différentes façons de représenter des mécanismes cognitifs.

2.3.1 Le modèle SAM

Étant donné que l’architecte principal de SAM fut Richard Shiffrin, il n’est pas étonnant de
retrouver plusieurs propriétés du modèle de double stockage [Atkinson & Shiffrin, 1968]. La
mémoire à court terme est vue comme un tampon à capacité limitée permettant deux choses.
Premièrement, elle affecte quel item sera stocké dans la mémoire à long terme et
deuxièmement, elle est utilisée pour assembler les requêtes pour l’accès à la mémoire à long
terme (semblable à la mémoire de travail). La mémoire à long terme, quant à elle, est
modélisée comme étant un ensemble illimité d’interconnexions entre concepts. L’information
dans cette mémoire se veut permanente et non effaçable. Tout ce qui se rapproche du
phénomène de l’oubli n’est qu’un échec lors de la récupération des données.


Le concept clé de l’architecture de SAM est l’image. Une image est un ensemble
d’interconnexions contenant de l’information sur l’item lui-même, sur le contexte dans lequel
l’item a été appris, et sur les relations avec les autres images. Le processus d’association se fait
dans la mémoire à court terme. Lorsque la capacité du tampon est excédée, une règle de
remplacement détermine quel objet sera perdu. La première version de SAM en 1981
proposait que chaque item dans le tampon avait la même probabilité d’être remplacé. Dans les
versions suivantes [Gillund & Shiffrin, 1984], la règle remplaçait l’item le plus vieux dans le
tampon. Le concept de répétition est également présent afin d’augmenter la force des
associations dans la mémoire. La force d’une association entre deux items ou entre un item et
son contexte dépend du temps que ces deux objets passeront ensemble dans la mémoire à
court terme. Suite à cela, un modèle assez complet de récupération et de reconnaissance est
élaboré dans Gillund & Shiffrin 1984. Même si SAM est en mesure d’expliquer une grande
variété de phénomènes psychologiques, il fait quand même l’objet de quelques critiques. Par
exemple, le modèle ne prend pas en considération l’attention ou le niveau de traitement de
l’information (conscience).
-41-




2.3.2 MINERVA 2

Le but premier du développement de MINERVA2 [Hintzman, 1988] était d’expliquer les
phénomènes de la mémoire épisodique et de la mémoire sémantique. Étant donné que ces
mémoires ont un niveau d’abstraction assez élevé, il fallait émettre plusieurs hypothèses au
départ :
1. Seulement les traces épisodiques sont stockées en mémoire,
2. La répétition crée plusieurs traces d’un même item en mémoire,
3. Une requête contacte simultanément toutes les traces en mémoire,
4. Chaque trace est activée selon la similarité de la requête de récupération.


Le point 2 soulève une affirmation importante car MINERVA2 suggère que la répétition
augmente la force de la trace en mémoire non pas par renforcement, mais bien par redondance,
en produisant des copies multiples en mémoire. Ceci diffère des autres modèles dans lesquels
c’est la force de la trace de l’item qui est augmenté.


L’affirmation de ces hypothèses vient donc élever le niveau du modèle au-delà de
l’application que nous désirons en faire. Il n’est donc pas très pertinent pour nous d’étudier
plus en détails ce modèle. C’est un modèle intéressant mais la nature même des problèmes
qu’il aborde n’est pas d’une grande importance pour nos agents qui sont dans un contexte
particulier. C’est pourquoi nous n’aborderons pas non plus certains modèles comme TODAM
[Murdock, 1997], REM [Shiffrin & Steyvers, 1997] ou les modèles connectionismes.



2.3.3 Modèle de mémoire de SOAR

Le modèle de mémoire de SOAR [Newell, 1990] propose trois mécanismes reliés à la
mémoire, soit l’acquisition, la récupération et l’accès. La définition de l’apprentissage du
modèle est intimement reliée à la mémoire. Selon Newell, l’apprentissage fait référence au
mécanisme d’acquisition de la mémoire mais aussi à celui de la récupération. Newell prétend
-42-


que l’apprentissage n’est pas seulement l’acquisition de nouvelles connaissances mais aussi la
façon de récupérer ces nouvelles connaissances.



2.3.3.1    Hypothèses de SOAR
Pour débuter, étudions les différentes hypothèses que SOAR fait à propos de la mémoire et de
l’apprentissage.
1- La première hypothèse est l’unité fonctionnelle de la mémoire à long terme (functionnal
   unity of long-term memory). Tous les modules de la mémoire à long terme devraient
   consister en une mémoire de reconnaissance. Cette mémoire devrait être uniforme et
   devrait contenir toute la connaissance, qu’elle soit épisodique, sémantique ou procédurale.
   Cela n’implique cependant pas un encodage unique pour toute la connaissance stockée
   dans la mémoire à long terme. Plusieurs niveaux peuvent être utilisés avec, pour chacun
   d’eux, des mécanismes différents. Par exemple, un ordinateur est fondamentalement
   composé de circuits manipulant des 0 et des 1. Cependant, les niveaux plus abstraits ne
   traitent pas nécessairement des 0 et des 1. Ils peuvent posséder différents mécanismes
   exploitant pourtant ce même système. Il en est de même pour le cerveau humain qui est
   fondamentalement composé de neurones. Ces neurones peuvent former différents systèmes
   s’exploitant de manière très différente même si la structure physique de base est la même.

2- La deuxième hypothèse concerne l’apprentissage par chunks (chunking-learning
   hypothesis). Dans SOAR, tout l’apprentissage à long terme s’effectue par regroupement
   (chunking). L’unité de l’apprentissage est le morceau ou chunk. Newell admet que le
   « chunking » n’est pas le seul mécanisme de l’intelligence mais il est, selon lui, suffisant
   pour supporter toutes les directions de l’hypothèse de l’apprentissage par « chunks ».


3- La troisième considération de Newell est la fonctionnalité de la mémoire à court terme.
   Une architecture ne serait pas complète sans l’intégration d’une mémoire à court terme
   servant à fermer la boucle entre tous les éléments d’une mémorisation. SOAR appelle cette
   mémoire la mémoire de travail. Par sa nature, cette mémoire est temporaire et change au
   rythme des opérations du système.
-43-



2.3.3.2    Théorie qualitative de SOAR
Nous allons maintenant nous concentrer sur la théorie qualitative de l’apprentissage de SOAR.
Cette théorie est intéressante puisqu’elle vient mettre en relation plusieurs théories de la
mémoire que nous avons vues précédemment.
1- Tout ce qui est appris provient d’une activité qui consistait à accomplir un but (goal-
   oriented activity). C’est probablement la caractéristique la plus importante du mécanisme
   de chunking. Pour apprendre (ou mémoriser), l’organisme doit avoir un objectif à
   atteindre. Il n’a pas le but d’apprendre puisque l’apprentissage n’est pas délibéré. Nous
   acquérons seulement la connaissance nous permettant d’accomplir notre but.
2- Une des propriétés les plus intéressantes pour nous est celle concernant l’apprentissage par
   répétition. La répétition est le mécanisme par lequel l’information est retenue dans la
   mémoire à court terme. Dans le modèle de Atkinson et Shiffrin, la répétition était
   considérée comme le seul mécanisme permettant à l’information dans la mémoire à court
   terme de se transférer dans la mémoire à long terme. Comme nous l’avons vu, cette
   hypothèse a été critiqué par la théorie Craik et Lockhart (depth-of-processing). Suite à
   cela, SOAR indique que la répétition a des effets positifs sur la rétention de la mémoire si
   ce qui est répété est d’intérêt. Si aucune tâche n’est effectuée et que la répétition n’est
   qu’un comportement passif, alors l’acquisition à long terme ne pourra pas s’effectuer.
   SOAR est donc en accord avec la théorie de Craik et Lockhart.
3- La dernière propriété concerne le regroupement (chunking) qui serait, pour plusieurs, la
   façon dont la mémoire est organisée. Newell se base sur les résultats de DeGroot en 1965
   et de Chase & Simon en 1973 sur la perception d’un jeu d’échecs. Une personne doit
   examiner un jeu d’échecs pendant 5 secondes et ensuite reproduire de mémoire la position
   de toutes les pièces. Un maître d’échecs fait un excellent travail (en moyenne 23 sur 25
   pièces sont placées correctement) tandis que les résultats du débutant sont vraiment
   désastreux (en moyenne 3 ou 4 sur 25). En fait, ce test de mémoire perceptuelle est le test
   le plus rapide pour déterminer la compétence aux échecs. Le modèle qui explique ce
   phénomène le fait en termes de regroupements. Le maître d’échec acquiert, à travers son
   expérience, la capacité d’effectuer des liens fonctionnels et spatiaux entre les pièces du
   jeu. Le regroupement permet au maître de caractériser un arrangement complexe de
-44-


   plusieurs pièces en seulement quelques chunks. Le débutant, quant à lui, considère
   simplement une pièce par chunk, ce qui lui permet d’acquérir seulement la position de
   quelques pièces.

Ces propriétés concernent la mémoire en général, mais quelle est exactement l’opinion de
Newell concernant la mémoire à court terme et les mécanismes de transfert vers la mémoire à
long terme? Le modèle SOAR ne considère pas vraiment la mémoire à court terme étant
donné la confusion qui règne concernant son existence physique [Crowder, 1976]. SOAR
considère plutôt une mémoire temporaire servant à exécuter la tâche courante (mémoire de
travail). Il est donc nécessaire de remplacer la connaissance contenue dans la mémoire de
travail lorsque la tâche courante change. Ce remplacement peut être effectué de plusieurs
façons : par un déplacement d’informations, par un déplacement des processus manipulant ces
informations ou par une modification du chemin d’accès. Le phénomène de rétention est
représenté assez simplement : l’information reste accessible dans la mémoire de travail tant
que la tâche courante n’est pas achevée.


L’architecture de la mémoire de SOAR se compose donc de différents modules jouant chacun
un rôle important. La mémoire de travail est intimement liée à la perception, aux réactions
motrices et à l’accès à l’information nécessaire pour résoudre une tâche (Figure 2.11).
-45-




                     Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]


Les propriétés de la mémoire dont SOAR rend compte sont, selon Newell, assez cohérentes
par rapport aux caractéristiques observées chez l’être humain. Il se base sur des observations
empiriques, mais il prend aussi en considération une connaissance assez complète de la
littérature en psychologie. Il y a quand même un aspect important de la mémoire qui n’est pas
modélisé : l’oubli de la connaissance dans la mémoire de production (mémoire à long terme).

2.3.4 Modèle de mémoire de l’architecture ACT-R

Le modèle de mémoire de ACT-R [Anderson, 1990] possède deux systèmes de mémoire à
long terme : la mémoire procédurale et la mémoire déclarative. Plusieurs mécanismes sont
associés à ces mémoires permettant ainsi d’ajouter et de maintenir l’information. ACT-R est
basé sur la théorie de l’analyse rationnelle de Anderson. Suivant cela, le système cognitif est
entièrement optimisé en fonction de son environnement.


Un premier exemple du rôle de l’analyse rationnelle est la mémoire déclarative. Les éléments
de la mémoire déclarative sont appelés chunks et sont l’équivalent des chunks de SOAR.
Chaque chunk possède une valeur d’activation représentant la probabilité que le chunk soit
-46-


sollicité dans le contexte courant. Pour être en mesure d’estimer cette valeur, les mécanismes
d’apprentissage doivent garder toujours un œil attentif sur l’environnement. Deux facteurs
sont pris en compte : combien de fois le chunk a été utilisé dans le passé et combien de temps
s’est écoulé depuis sa dernière utilisation.


Ensuite, ACT-R possède une mémoire procédurale où la connaissance est représentée par des
règles de production. Chaque règle est associée à un ou plusieurs paramètres.


ACT-R définit une pile de buts (Goal-Stack) servant à empiler dynamiquement des chunks
pour des usages temporaires. Comme le nom l’indique, seulement le chunk du dessus de la
pile est accessible à un moment donné. Ce mécanisme est similaire à la mémoire de travail des
théories cognitives ainsi qu’à celle définie par SOAR.


Les mécanismes de l’architecture de la mémoire de ACT-R sont définis par des formules
mathématiques et explicites, ce qui permet une modélisation plus directe comparativement au
modèle de Newell. Suivant cela, une équation de l’accumulation de la force de rétention suite
à la pratique a été proposée par Anderson & Fincham (1999). La force de la trace en mémoire
est caractérisée comme suit : F = ∑ ti-d où ti est le temps écoulé de la ie pratique depuis
l’acquisition de l’information. La constante « d » représente le taux d’apprentissage pouvant
varier d’une personne à l’autre. Donc, la somme de tous les temps écoulés des pratiques de la
donnée depuis son acquisition est calculée pour former la force de la trace en mémoire de
l’élément mémorisé.


2.3.5 EPIC

SOAR et ACT-R sont des architectures qui se concentrent sur la cognition centrale, c’est à
dire les mécanismes liés directement à la mémoire et à l’apprentissage. EPIC (Executive-
Process Interactive Control) [Kieras & Meyer, 1997] insiste plutôt sur l’importance de la
cognition   périphérique,    c’est-à-dire      tous   les   mécanismes   qui   interagissent   avec
l’environnement (perception, actions, etc.). Les auteurs affirment que la cognition
périphérique est un facteur déterminant pour la performance d’une tâche. La Figure 2.12
-47-


montre bien l’importance des systèmes périphériques en proposant un ensemble de
processeurs moteurs et perceptuels. Le module perceptuel envoie les informations qu’il reçoit
directement à la mémoire de travail de façon complètement asynchrone. La particularité de
cette architecture est que plusieurs buts peuvent être représentés de façon non hiérarchique. De
plus, plusieurs buts peuvent être actifs dans le même cycle (traitement parallèle) en autant
qu’ils n’utilisent pas la même ressource périphérique.




                       Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997]


EPIC suppose ainsi que les contraintes et limitations de l’architecture sont dues à la structure
des organes sensoriels et moteurs. Ce sont ces organes qui limitent l’apport et la transmission
de l’information.
-48-



2.3.6 3CAPS

Enfin, le modèle 3CAPS [Just & Carpenter, 1992] avance que les limitations du système
cognitif sont liées de la capacité de la mémoire de travail. 3CAPS définit trois types de
mémoires, soit la mémoire de travail, la mémoire procédurale et la mémoire déclarative. Selon
la théorie de la capacité, si le maximum d’éléments est atteint dans la mémoire de travail, les
processus de production activent moins d’éléments que ce dont ils ont besoin. Cela a pour
effet d’oublier des éléments prématurément. Le modèle 3CAPS interprète ce phénomène
comme une source de différences individuelles. L’architecture de 3CAPS ne prend cependant
pas en compte l’apprentissage.



2.4    Conclusion sur l’état de l’art sur la mémoire

À ce stade-ci, il est important de discerner les grandes composantes d’un modèle de mémoire
et d’identifier les principales fonctionnalités de ces mêmes composantes. C’est donc ce que
nous avons fait dans ce chapitre en présentant l’historique, les théories et les modèles associés
à la mémoire.


Plusieurs théories, phénomènes et modèles n’ont pas été présentés dans cette courte revue
bibliographique sur la mémoire. Les recherches dans ce domaine sont actuellement très actives
et beaucoup d’incertitude persiste dans en psychologie cognitive. Bien que nous ayons omis
plusieurs travaux, toutes les références bibliographiques présentées donneront un excellent
point de départ pour les recherches plus précises dans ce domaine. Notre but n’est pas de
rapporter toutes les recherches sur la mémoire des dernières décennies, mais simplement de
cibler les principaux phénomènes et mécanismes qui seront utiles dans le développement d’un
modèle de mémoire dans le cadre de notre projet multi-agent.
-49-




____________________________________

             Chapitre 3


       Notre modèle de mémoire
____________________________________
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel

Contenu connexe

En vedette

Le livre numérique et si c'était du web
Le livre numérique et si c'était du webLe livre numérique et si c'était du web
Le livre numérique et si c'était du webmikaelrandy
 
Carnet De Culture Hydroponique Du Cannabis
Carnet De Culture Hydroponique Du CannabisCarnet De Culture Hydroponique Du Cannabis
Carnet De Culture Hydroponique Du CannabisSaul Carreter Raso
 
Escala Ff
Escala FfEscala Ff
Escala Ffalondra
 
Présentation NSim Contour à Geomatique 2009
Présentation NSim Contour à Geomatique 2009Présentation NSim Contour à Geomatique 2009
Présentation NSim Contour à Geomatique 2009NSim Technology
 
Personnaliser son ordinateur !
Personnaliser son ordinateur !Personnaliser son ordinateur !
Personnaliser son ordinateur !ateliernumerique
 
Mariage en Champagne
Mariage en ChampagneMariage en Champagne
Mariage en Champagnehelene5152
 
Réseaux sociaux et jeunes diplômés - Etude APEC
Réseaux sociaux et jeunes diplômés - Etude APECRéseaux sociaux et jeunes diplômés - Etude APEC
Réseaux sociaux et jeunes diplômés - Etude APECAgence Double Numérique
 
Espaces ruraux
Espaces rurauxEspaces ruraux
Espaces rurauxmangeclous
 
Enfoque clarificación de valores
Enfoque clarificación de valoresEnfoque clarificación de valores
Enfoque clarificación de valoresMarta
 
Communiqué projet onWHEELS
Communiqué projet onWHEELSCommuniqué projet onWHEELS
Communiqué projet onWHEELSChrisPetit
 
Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...
Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...
Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...Astek Finance
 
Espace pédagogique Edelweiss
Espace pédagogique EdelweissEspace pédagogique Edelweiss
Espace pédagogique EdelweissMaroom France
 

En vedette (20)

SIMULATION
SIMULATIONSIMULATION
SIMULATION
 
Le livre numérique et si c'était du web
Le livre numérique et si c'était du webLe livre numérique et si c'était du web
Le livre numérique et si c'était du web
 
Laf l'ours et l'oursone
Laf   l'ours et l'oursoneLaf   l'ours et l'oursone
Laf l'ours et l'oursone
 
Carnet De Culture Hydroponique Du Cannabis
Carnet De Culture Hydroponique Du CannabisCarnet De Culture Hydroponique Du Cannabis
Carnet De Culture Hydroponique Du Cannabis
 
Deya[1]
Deya[1]Deya[1]
Deya[1]
 
Cibersexo
CibersexoCibersexo
Cibersexo
 
Escala Ff
Escala FfEscala Ff
Escala Ff
 
E-novatrices
E-novatricesE-novatrices
E-novatrices
 
Présentation NSim Contour à Geomatique 2009
Présentation NSim Contour à Geomatique 2009Présentation NSim Contour à Geomatique 2009
Présentation NSim Contour à Geomatique 2009
 
Personnaliser son ordinateur !
Personnaliser son ordinateur !Personnaliser son ordinateur !
Personnaliser son ordinateur !
 
Mariage en Champagne
Mariage en ChampagneMariage en Champagne
Mariage en Champagne
 
Réseaux sociaux et jeunes diplômés - Etude APEC
Réseaux sociaux et jeunes diplômés - Etude APECRéseaux sociaux et jeunes diplômés - Etude APEC
Réseaux sociaux et jeunes diplômés - Etude APEC
 
Espaces ruraux
Espaces rurauxEspaces ruraux
Espaces ruraux
 
Enfoque clarificación de valores
Enfoque clarificación de valoresEnfoque clarificación de valores
Enfoque clarificación de valores
 
Communiqué projet onWHEELS
Communiqué projet onWHEELSCommuniqué projet onWHEELS
Communiqué projet onWHEELS
 
Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...
Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...
Petit dej ASTEK Mobilité - Mobil'isez votre SI, pour réussir votre transforma...
 
Net Land Art 2
Net Land Art 2Net Land Art 2
Net Land Art 2
 
MEDEF - Rapport de gestion 2014
MEDEF - Rapport de gestion 2014MEDEF - Rapport de gestion 2014
MEDEF - Rapport de gestion 2014
 
Présentation - Métropolis - 2011
Présentation - Métropolis - 2011Présentation - Métropolis - 2011
Présentation - Métropolis - 2011
 
Espace pédagogique Edelweiss
Espace pédagogique EdelweissEspace pédagogique Edelweiss
Espace pédagogique Edelweiss
 

Similaire à Modèle cognitif de mémoire dans un environnement virtuel

Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...
Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...
Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...Patrick Faure
 
Rapport projet: relisation d'une app desktop
Rapport projet: relisation d'une app desktop Rapport projet: relisation d'une app desktop
Rapport projet: relisation d'une app desktop amat samiâ boualil
 
Merise
MeriseMerise
Merisebasy15
 
These Web Semantheque
These Web SemanthequeThese Web Semantheque
These Web Semanthequesahar
 
Simulation de comportements de foule
Simulation de comportements de fouleSimulation de comportements de foule
Simulation de comportements de fouleNSim Technology
 
Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...
Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...
Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...abdellatrach
 
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]Zouhir Mezrhab
 
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]Zouhir Mezrhab
 
Rapport de pfe format doc 2013
Rapport de pfe format doc 2013Rapport de pfe format doc 2013
Rapport de pfe format doc 2013Addi Ait-Mlouk
 
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuelModèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuelNSim Technology
 
D c0yfr.942
D c0yfr.942D c0yfr.942
D c0yfr.942dongnghi
 
Le Contrôle Interne Assisté par Ordinateur
Le Contrôle Interne Assisté par OrdinateurLe Contrôle Interne Assisté par Ordinateur
Le Contrôle Interne Assisté par Ordinateurmohammed EZZOUAK
 
These hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectif
These hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectifThese hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectif
These hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectifAbdelhak Essoulahi
 
Manuel du module Ventes d'OpenERP produit par Gestion-Ressources
Manuel du module Ventes d'OpenERP produit par Gestion-RessourcesManuel du module Ventes d'OpenERP produit par Gestion-Ressources
Manuel du module Ventes d'OpenERP produit par Gestion-RessourcesGestion-Ressources Inc.
 
0098-formation-word-2010.pdf
0098-formation-word-2010.pdf0098-formation-word-2010.pdf
0098-formation-word-2010.pdfSofiane BENYETTOU
 
Rapport PFE: PIM (Product Information Management) - A graduation project repo...
Rapport PFE: PIM (Product Information Management) - A graduation project repo...Rapport PFE: PIM (Product Information Management) - A graduation project repo...
Rapport PFE: PIM (Product Information Management) - A graduation project repo...younes elmorabit
 

Similaire à Modèle cognitif de mémoire dans un environnement virtuel (20)

Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...
Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...
Thèse - Mettre les utilisateurs et les métiers au coeur de leur système d'inf...
 
Rapport projet: relisation d'une app desktop
Rapport projet: relisation d'une app desktop Rapport projet: relisation d'une app desktop
Rapport projet: relisation d'une app desktop
 
Vlans
VlansVlans
Vlans
 
Merise
MeriseMerise
Merise
 
These Web Semantheque
These Web SemanthequeThese Web Semantheque
These Web Semantheque
 
Simulation de comportements de foule
Simulation de comportements de fouleSimulation de comportements de foule
Simulation de comportements de foule
 
uml
umluml
uml
 
Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...
Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...
Memoire d'ingénieur:Agrégation de plusieurs connexions réseaux à caractéristi...
 
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
 
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
Guide%20 utilisateur%20de%20shadowprotect v9-20111129-0911[1]
 
Rapport de pfe format doc 2013
Rapport de pfe format doc 2013Rapport de pfe format doc 2013
Rapport de pfe format doc 2013
 
Modèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuelModèle cognitif de mémoire dans un environnement virtuel
Modèle cognitif de mémoire dans un environnement virtuel
 
Word07cb
Word07cbWord07cb
Word07cb
 
D c0yfr.942
D c0yfr.942D c0yfr.942
D c0yfr.942
 
Le Contrôle Interne Assisté par Ordinateur
Le Contrôle Interne Assisté par OrdinateurLe Contrôle Interne Assisté par Ordinateur
Le Contrôle Interne Assisté par Ordinateur
 
These hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectif
These hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectifThese hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectif
These hec -_ecole_des_mines_sur_le_tableau_de_bord_prospectif
 
Rapport IA
Rapport IARapport IA
Rapport IA
 
Manuel du module Ventes d'OpenERP produit par Gestion-Ressources
Manuel du module Ventes d'OpenERP produit par Gestion-RessourcesManuel du module Ventes d'OpenERP produit par Gestion-Ressources
Manuel du module Ventes d'OpenERP produit par Gestion-Ressources
 
0098-formation-word-2010.pdf
0098-formation-word-2010.pdf0098-formation-word-2010.pdf
0098-formation-word-2010.pdf
 
Rapport PFE: PIM (Product Information Management) - A graduation project repo...
Rapport PFE: PIM (Product Information Management) - A graduation project repo...Rapport PFE: PIM (Product Information Management) - A graduation project repo...
Rapport PFE: PIM (Product Information Management) - A graduation project repo...
 

Plus de NSim Technology

Agilité pour la PME faisant face à plusieurs projets
Agilité pour la PME faisant face à plusieurs projetsAgilité pour la PME faisant face à plusieurs projets
Agilité pour la PME faisant face à plusieurs projetsNSim Technology
 
Modélisation de la perception dans un monde virtuel 3D
Modélisation de la perception dans un monde virtuel 3DModélisation de la perception dans un monde virtuel 3D
Modélisation de la perception dans un monde virtuel 3DNSim Technology
 
Apprentissage par renforcement
Apprentissage par renforcementApprentissage par renforcement
Apprentissage par renforcementNSim Technology
 
Approche qualitative en intelligence artificielle
Approche qualitative en intelligence artificielleApproche qualitative en intelligence artificielle
Approche qualitative en intelligence artificielleNSim Technology
 
Framework Orienté objet
Framework Orienté objetFramework Orienté objet
Framework Orienté objetNSim Technology
 

Plus de NSim Technology (6)

Agilité pour la PME faisant face à plusieurs projets
Agilité pour la PME faisant face à plusieurs projetsAgilité pour la PME faisant face à plusieurs projets
Agilité pour la PME faisant face à plusieurs projets
 
Modélisation de la perception dans un monde virtuel 3D
Modélisation de la perception dans un monde virtuel 3DModélisation de la perception dans un monde virtuel 3D
Modélisation de la perception dans un monde virtuel 3D
 
Apprentissage par renforcement
Apprentissage par renforcementApprentissage par renforcement
Apprentissage par renforcement
 
Approche qualitative en intelligence artificielle
Approche qualitative en intelligence artificielleApproche qualitative en intelligence artificielle
Approche qualitative en intelligence artificielle
 
Framework Orienté objet
Framework Orienté objetFramework Orienté objet
Framework Orienté objet
 
Mags Project
Mags ProjectMags Project
Mags Project
 

Modèle cognitif de mémoire dans un environnement virtuel

  • 1. JIMMY PERRON Modélisation d’un modèle cognitif de mémoire dans un système multi-agent temps réel Mémoire présenté à la Faculté des études supérieures de l’Université Laval pour l’obtention du grade de maître ès sciences (M.Sc.) Département d’informatique FACULTÉ DES SCIENCES ET GÉNIE UNIVERSITÉ LAVAL Août 2003  Jimmy Perron, 2003
  • 2. -2- Résumé Le présent travail s’inscrit dans un projet visant la simulation d’un grand nombre d’agents dans un environnement urbain 3D virtuel. En fait, le système MAGS (Multi-Agent GeoSimulation) est une plateforme multi-agent en temps réel pouvant s’appliquer à plusieurs domaines : simulation de foule, simulation de consommateurs dans des centres commerciaux, simulation d’évacuations, etc. Les fondements du simulateur sont issus des approches cognitives, ce qui implique que les agents sont dotés de comportements évolués basés sur leurs besoins et objectifs. Cela implique aussi que les agents doivent être munis d’un outil supplémentaire proposant des mécanismes de perception et de mémorisation de l’environnement. Ce mémoire présente donc un modèle détaillé de perception et de mémorisation de l’environnement virtuel 3D. Ses mécanismes sont cohérents avec les études réalisées dans le domaine des sciences cognitives sur la mémoire. Notre modèle de Perception-Mémoire permet d’individualiser les agents en dotant chaque agent d’une mémoire individuelle du monde virtuel qu’il parcourt. Il est, de plus, en mesure d’effectuer la perception et la mémorisation de plusieurs centaines d’agents en temps réel dans la plateforme MAGS.
  • 3. -3- Préface et Remerciements Dès le début de cette recherche, nous étions un peu impressionnés par le grand défi qu’un système semblable représentait. Finalement, deux ans après, une première version de MAGS (Multi-Agent GeoSimulation) vit le jour. Cette première version était le fruit d’un grand travail de la part de toute notre équipe. Le présent travail est une contribution à ce système dont l’instigateur est M. Bernard Moulin. Son expertise, son talent de leader, de gestionnaire et de coordonnateur de recherche ont fait que ce projet est maintenant une chose concrète. Suivant cela, je désire sincèrement remercier M. Moulin pour son implication, sa confiance et sa détermination à nous initier à la recherche. Il a été un guide extraordinaire dans tout le déroulement du projet, en plus de nous inspirer dans des périodes souvent complexes. Deuxièmement, je tiens à souligner l’implication du RDDC Val-Cartier dans le projet MAGS. Ils ont permis la réalisation du projet en appuyant l’équipe tant du point de vue technique (équipement) que du point de vue financier, en fournissant un soutien boursier aux étudiants impliqués. Ils ont toujours été convaincus du bien-fondé et de l’apport que cette recherche pouvait amener et pour cela, je les remercie. De plus, je tiens à remercier tous mes proches qui m’ont, d’une façon ou d’une autre, supporté dans cette aventure. Étant donné l’ampleur du projet, le temps consacré à ceux qui me sont chers a été considérablement limité. Ils ont quand même su comprendre et m’ont soutenu dans cette démarche en faisant tout ce qu’ils pouvaient pour m’aider. Pour cette raison, et bien d’autres, je les remercie et je veux qu’ils sachent qu’ils ont eu un grand rôle à jouer dans l’aboutissement de cette étape. Jimmy Perron
  • 4. -4- Table des matières 1 Introduction Générale ___________________________________________________ 9 1.1 Contexte _________________________________________________________ 10 1.2 Objectifs _________________________________________________________ 13 1.3 Démarche et présentation du mémoire ________________________________ 14 2 Recherches antérieures sur la mémoire_____________________________________ 16 2.1 Historique des recherches sur la mémoire _____________________________ 16 2.2 Théories de la mémoire _____________________________________________ 30 2.2.1 Mémoire perceptuelle ___________________________________________ 30 2.2.2 Mémoire à court terme___________________________________________ 31 2.2.3 Mémoire de travail______________________________________________ 36 2.2.4 Mémoire à long terme ___________________________________________ 37 2.3 Les modèles de mémoire ____________________________________________ 39 2.3.1 Le modèle SAM________________________________________________ 40 2.3.2 MINERVA 2 __________________________________________________ 41 2.3.3 Modèle de mémoire de SOAR_____________________________________ 41 2.3.4 Modèle de mémoire de l’architecture ACT-R _________________________ 45 2.3.5 EPIC_________________________________________________________ 46 2.3.6 3CAPS _______________________________________________________ 48 2.4 Conclusion sur l’état de l’art sur la mémoire ___________________________ 48 3 Modèle de mémoire développé dans le contexte de MAGS ______________________ 50 3.1 Fonctionnalités nécessaires et contraintes du modèle ____________________ 51 3.1.1 Fonctionnalités_________________________________________________ 51 3.1.2 Contraintes ____________________________________________________ 53 3.2 Environnement de MAGS___________________________________________ 55 3.3 Mécanisme de perception ___________________________________________ 60 3.3.1 Algorithme de Perception de l’environnement ________________________ 62 3.3.2 Algorithme de parcours des cellules de Palmer________________________ 63 3.3.3 Calcul des lignes de vue ( troisième dimension ) ______________________ 64 3.3.4 Aspect temps réel, cohérence cognitive et résultats ____________________ 69 3.3.5 Conclusion sur la perception ______________________________________ 71 3.4 Mémoire perceptuelle ______________________________________________ 72 3.5 Filtre ____________________________________________________________ 73 3.6 Mémoire de travail_________________________________________________ 80 3.6.1 Fondements de la mémoire de travail dans MAGS _____________________ 81 3.6.2 Structure de la mémoire de travail__________________________________ 82 3.6.3 Capacité de la mémoire de travail __________________________________ 84 3.6.4 Répétition et Rétention __________________________________________ 86
  • 5. -5- 3.6.5 Passage vers la mémoire à long terme _______________________________ 96 3.6.6 L’élément mémorisé ____________________________________________ 97 3.6.7 Conclusion sur la mémoire de travail _______________________________ 99 3.7 Mémoire à long terme ______________________________________________ 99 3.7.1 Structure_____________________________________________________ 100 3.7.2 Rétention ____________________________________________________ 100 3.8 Conclusion sur le modèle de mémoire de MAGS _______________________ 102 4 Intégration du modèle de mémoire dans MAGS _____________________________ 108 4.1 Mémoire perceptuelle _____________________________________________ 112 4.2 Mémoire de travail________________________________________________ 112 4.3 Mémoire à long terme _____________________________________________ 117 4.4 Contrôle et flux de données_________________________________________ 117 5 Résultats et conclusion _________________________________________________ 121 5.1 Performances des mécanismes du modèle de mémoire MAGS____________ 121 5.1.1 Perception ___________________________________________________ 123 5.1.2 Mécanisme de Filtre____________________________________________ 125 5.1.3 Mécanisme de Rétention ________________________________________ 126 5.2 Analyse générale du modèle de mémoire______________________________ 127 5.3 Discussion et conclusion sur le modèle de mémoire _____________________ 131 6 Bibliographie_________________________________________________________ 136
  • 6. -6- Table des figures Figure 2.1 : Fonction de rétention de Ebbinghaus _________________________________ 17 Figure 2.2 : Procedure d'expérimentation de Pavlov _______________________________ 19 Figure 2.3 : Acquisition d'une réponse conditionnée _______________________________ 20 Figure 2.4 : Processus d'extinction dans le conditionnement classqiue _________________ 21 Figure 2.5 : Courbe d'apprentissage de Thorndike_________________________________ 22 Figure 2.6 : Résultat de l'expérience de Tolman ___________________________________ 25 Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin __________________________ 29 Figure 2.8 : Résultat du rapport de Sperling______________________________________ 31 Figure 2.9 : Représentation de la mémoire de travail de Baddeley ____________________ 36 Figure 2.10 : Taxonomie de la mémoire selon Squire (1993) _________________________ 37 Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]__________________________ 45 Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997] ___________________________ 47 Figure 3.1 : Mémorisation d’une relation ________________________________________ 51 Figure 3.2 : La carte des élévations ____________________________________________ 55 Figure 3.3 : Carte des élévations d'une partie de la ville de Québec ___________________ 56 Figure 3.4 : Plan (x,z) représenté par le segment A de la carte précédente ______________ 57 Figure 3.5 : LocationMap ____________________________________________________ 58 Figure 3.6 : Exemple d'accès aux agents ________________________________________ 59 Figure 3.7 : Perception dans une « height map » __________________________________ 60 Figure 3.8 : Carte de visibilité Franklin [1999] ___________________________________ 61 Figure 3.9 : Test de visibilité __________________________________________________ 63 Figure 3.10 : Algorithme de visibilité de Palmer __________________________________ 64 Figure 3.11 : Test de visiblité à l'aide d'une ligne de vue ____________________________ 65 Figure 3.12 : Triangles semblables _____________________________________________ 66 Figure 3.13 : coupe en ( x, z ) _________________________________________________ 67 Figure 3.14 : Algorithme de perception de MAGS _________________________________ 68 Figure 3.15 : Test de visibilité _________________________________________________ 69 Figure 3.16 : Mémoire perceptuelle d’un agent ___________________________________ 72 Figure 3.17 : Filtre _________________________________________________________ 74 Figure 3.18 : Identification d’objets par attributs__________________________________ 77 Figure 3.19 : Mécanismes de la mémoire de travail ________________________________ 82 Figure 3.20 : Organisation de la mémoire de travail dans MAGS _____________________ 84 Figure 3.21 : Mémoire de travail ______________________________________________ 86 Figure 3.22 : Force de la trace en mémoire d'un élément____________________________ 88 Figure 3.23 : Structure d’un élément____________________________________________ 89 Figure 3.24 : 15 répétitions en 15 unités de temps _________________________________ 90 Figure 3.25 : Évolution de la trace de Restaurant1 ________________________________ 91 Figure 3.26 : Évolution de la force de la trace de Restaurant1 dans la mémoire de travail _ 92 Figure 3.27 : Évolution de la force de la trace en mémoire après 6 répétitions___________ 93 Figure 3.29 : Fonction d'activation_____________________________________________ 94 Figure 3.30 : Fonction d'activation_____________________________________________ 95 Figure 3.31 : Structure d'un élément ____________________________________________ 98 Figure 3.32 : Mémoire à long terme ___________________________________________ 101 Figure 3.33 : Modèle de mémoire _____________________________________________ 103
  • 7. -7- Figure 3.34 : Valeurs modifiables dans le modèle de mémoire ______________________ 105 Figure 3.35 : Structure du modèle de mémoire ___________________________________ 106 Figure 4.1 : Composantes principales de MAGS _________________________________ 108 Figure 4.2 : Description d'un agent____________________________________________ 110 Figure 4.3 : Diagramme de classes du modèle de mémoire _________________________ 111 Figure 4.4 : Méthode de filtrage ______________________________________________ 113 Figure 4.5 : Algorithme de filtrage de la mémoire de travail ________________________ 114 Figure 4.6 : Algorithme pour l'ajout d'un élément dans la mémoire de travail __________ 115 Figure 4.7 : Algorithme de rétention de la mémoire de travail_______________________ 116 Figure 4.8 : Accès à un élément du "chunk" Faim ________________________________ 116 Figure 4.9 : Diagramme de séquence lors de l’appel de TMemoryState->Update() ______ 118 Figure 5.1 : Temps d'un cycle du système MAGS _________________________________ 122 Figure 5.2 : Résultat du mécanisme de perception ________________________________ 123 Figure 5.3 : Temps de calcul de la perception par rapport au rayon de perception ______ 124 Figure 5.4 : Visualisation de la zone de perception d’un agent ______________________ 124 Figure 5.5 : Résultats du modèle de mémoire (grille)______________________________ 127 Figure 5.6 : Résultats du modèle de mémoire (graphique) __________________________ 127 Figure 5.7 : Temps de calcul des composantes de MAGS___________________________ 129 Figure 5.8 : Visualisation d'une simulation______________________________________ 130 Figure 5.9 : Carte de mémoire d'un agent à un instant donné _______________________ 131
  • 8. ____________________________________ Chapitre 1 Introduction ____________________________________
  • 9. -9- 1 Introduction Générale Depuis plusieurs années, les recherches sur la réalité et la simulation virtuelle ont beaucoup évolué. Certains phénomènes qui ne peuvent être reproduits en réalité entrent dans le domaine d’application de la simulation virtuelle. Ces phénomènes, comme par exemple la panne d’un moteur dans un avion, sont souvent impossibles ou trop risqués à reproduire. Les spécialistes effectuent alors des simulations pour entraîner les pilotes à faire face à ces situations. Dans le domaine précis de l’aéronautique, ce genre de simulateur existe et ils sont très utilisés. Mais qu’arrive-t-il lorsque certains stratèges doivent prendre des décisions pour la sécurité ou l’aménagement du site d’une manifestation ? Il est impossible de reproduire physiquement les comportements d’une foule lors d’une manifestation. Il faut donc être en mesure de pouvoir simuler, à l’aide d’un outil informatique, des phénomènes de foule. L’idée d’un simulateur de foule dans un environnement urbain 3D est alors née. Le but de ce simulateur est de permettre à ses utilisateurs d’orienter certaines décisions suivant les résultats obtenus à partir de la simulation d’un phénomène de foule. La simulation doit avoir lieu dans un environnement urbain virtuel en trois dimensions. Évidemment, le projet est très ambitieux puisque les simulations en temps réel contenant des milliers de personnes virtuelles ne sont pas choses courantes. De plus, le prototype du simulateur doit fonctionner sur un ordinateur de type PC sous un environnement Windows. C’est suite à cela que le développement du prototype du système MAGS commença. Le projet MAGS (Multi-Agent Geo-Simulation) a pour objectif le développement d’une plateforme générale pour la création de simulations multi-agent dans des espaces géographiques virtuels. La plateforme devra supporter des milliers d’agents ayant des aptitudes cognitives spatiales et comportementales (perception, mémoire, comportements, etc.). De plus, les agents devront interagir directement avec l’environnement virtuel dans lequel ils prennent place. L’application courante de la plateforme MAGS vise à simuler les phénomènes de foule dans un environnement urbain 3D.
  • 10. -10- 1.1 Contexte Il existe plusieurs techniques pour représenter des phénomènes de foule dans un environnement [AJ, 1954], [Ashford, 1976], [Yuhaski, 1989], [Lovas, 1993]. Il y a premièrement les systèmes à base de particules où chaque particule représente un agent. L’interaction entre les particules se fait à l’aide des propriétés d’attraction, de répulsion et à l’aide de la gestion des collisions qui sont prédéterminées pour chaque particule [Langton, 1997]. Ces systèmes physiques modélisent bien les phénomènes de foule où une foule dense se trouve dans un environnement très restreint (évacuation d’un stade, modélisation du trafic [RIC, 1996]). Il y a ensuite les systèmes de modélisation des fluides qui ont été utilisés pour la première fois par Henderson [Henderson, 1974]. Dans ce cas précis, la foule est caractérisée par certaines propriétés physiques (densité, vitesse, énergie, etc.) et elle est considérée comme un tout se déplaçant dans un environnement souvent représenté sous forme de grille. Une autre technique se sert des automates cellulaires pour modéliser les interactions entre plusieurs agents (foule, trafic) [Helbing, 1999]. Traditionnellement, les chercheurs et les spécialistes du domaine de la simulation ont toujours traité les phénomènes de foule comme étant modélisables par des systèmes physiques ou mathématiques. Une étude au Wembley Stadium a montré que les modèles basés sur la mécanique des fluides étaient faux. Les analyses révèlent que les « patterns » de la foule n’étaient presque en aucun point semblables à un liquide. Suite à cette étude, un mathématicien irlandais du nom de Keith Still a développé une série d’équations connues sous le nom de « orchid fractal ». La théorie de Still se base sur l’aspect chaotique du comportement d’une foule. Ses résultats ont été utilisés pour développer un système commercial d’aide à la décision sur la planification des effets de foule [Still, 2003]. Ces systèmes, modélisés par des équations mathématiques, permettent de modéliser certains phénomènes très spécialisés mais ils ne peuvent pas être étendus à d’autres applications plus complexes. Ces dernières années, les chercheurs vont un peu plus loin en considérant des variables psychologiques pour caractériser chaque individu dans une foule [Helbing, 1998]. Le concept de self-organization effects est, maintenant, de plus en plus étudié. Suivant cela, un
  • 11. -11- modèle modélisant la dynamique individuelle des individus appelé social force model a été proposé [Helbing & Molnar & Schweitzer, 1994], [Gipps, 1985]. Malgré le terme « social » dans le nom du modèle, celui-ci est quand même mathématiquement représenté. Il ne prend pas en considération les variables psychologiques individuellement. La force sociale est plutôt une représentation des différentes influences qui agissent sur le comportement de l’individu. Un autre laboratoire, « Virtual reality lab » dirigé par Daniel Thalmann, explore depuis plusieurs années la vie artificielle dans un environnement virtuel. Thalmann identifie les mécanismes à modéliser pour être en mesure d’implémenter ce qu’il appelle un humain virtuel ou un acteur [Thalmann, 2000]. Thalmann identifie cinq composantes nécessaires qu’un humain virtuel doit posséder. Voici les cinq composantes décrites par Thalmann. • Perception : La perception est la conscience que l’on a de l’environnement qui nous entoure. La façon dont un agent perçoit son monde se traduit en y intégrant les mécanismes de la vision, de l’audition, du toucher, de l’ouïe et du goût. La perception est responsable de l’interaction entre l’agent et l’environnement pour qu’il puisse se déplacer, manipuler des objets, et ainsi pouvoir réagir à la rétroaction provenant de l’environnement et des autres agents. Une approche basée sur la vision offre une méthode universelle pour transmettre de l’information à partir de l’environnement vers l’agent dans le contexte de la recherche de chemins, de l’évitement d’obstacles, de la représentation interne des connaissances avec les mécanismes d’apprentissage et d’oubli [Renault et al., 1990]. Dans le domaine de la simulation multi-agents, un agent est souvent défini comme une entité évoluant dans un environnement qu’elle peut percevoir et dans lequel elle peut agir [Franklin & Graesser, 1997]. La perception est donc essentielle à un humain virtuel ou un agent pour que ses comportements soient en fonction de son environnement immédiat. • Émotions : Les émotions sont des états affectifs intenses caractérisés par une brusque perturbation physique et mentale [Bérubé, 1991]. Les émotions peuvent donc être la
  • 12. -12- cause de certaines réactions de l’agent. Certains objets, agents ou actions perçus peuvent engendrer des émotions chez l’agent. Ainsi, les émotions ressenties par un agent sont causées par la perception de son environnement [Thalmann, 2000]. • Comportements : Le module comportemental est évidemment très important lors de la modélisation des mécanismes d’un agent virtuel. C’est par ce mécanisme qu’est représenté le processus de prise de décision qui pousse l’agent à effectuer une action. Le comportement doit décider, à partir d’entrées (émotions, perceptions, souvenirs), l’action résultante sur l’environnement ou sur soi-même. Le comportement peut être vu d’une façon hiérarchique. Le modèle comportemental décompose un comportement complexe en sous-comportements beaucoup plus simples jusqu’à ce qu’un comportement élémentaire soit atteint [Pelletier, 2003]. • Actions : Lorsque le module comportemental a décidé quelle est l’action à exécuter, il doit avoir la possibilité de le faire. De la même façon qu’un humain ne peut pas voler, certaines actions doivent être modélisées et d’autres non pour respecter la cohérence de l’univers à simuler. Les actions permettent l’interaction avec l’environnement et les autres agents. Ainsi, les agents sont en mesure de communiquer et de modifier leur entourage, ce qui garde la dynamique de la simulation très active. • Mémoire : La mémoire est la capacité de stocker et de récupérer de l’information provenant de la perception de l’agent. Le comportement d’un agent variera en fonction de son expérience passée. S’il a déjà utilisé un objet, il n’aura pas à réapprendre tout le processus de son utilisation. De la même façon, s’il se souvient d’un endroit en particulier, il n’aura pas à consulter une carte pour s’orienter. Ce sont des exemples simples qui démontrent que les modèles où la mémorisation est absente sont des modèles peu convaincants puisqu’il n’y a aucune adaption des agents.
  • 13. -13- Voici donc les mécanismes que Thalmann décrit comme étant essentiels pour une modélisation cohérente d’un humain virtuel dans une simulation virtuelle. 1.2 Objectifs Lorsque l’on examine attentivement les mécanismes de Thalmann décrits précédemment, l’un d’eux semble être à la base de tous les autres. Il s’agit, bien sûr, de la perception. Privé de la perception, un agent serait incapable d’interagir, de raisonner et d’agir sur son environnement, ce qui est contraire à la définition de Franklin et Graesser [Franklin & Graesser, 1997]. Il existe certaines techniques pour modéliser la perception dans un environnement virtuel, mais ces techniques ne sont pas adaptées au contexte de notre projet. Il nous faut un mécanisme permettant à des milliers d’acteurs de percevoir l’environnement dynamiquement et en temps réel. C’est donc un grand pas de doter les humains virtuels de la perception mais ils doivent également être en mesure de mémoriser ce qu’ils ont perçu. La mémoire est aussi un des mécanismes que Thalmann décrit pour la modélisation d’un acteur virtuel. Cependant, à notre connaissance, il n’existe, dans la littérature, aucun modèle qui rendre compte avec précision des mécanismes de perception et de mémoire dans un contexte temps réel. Quelques recherches en psychologie décrivent les grandes lignes et les caractéristiques d’un modèle de mémoire, mais sans plus. De plus, ces recherches ne sont pas appliquées au domaine de la simulation virtuelle et nous devons être en mesure d’implanter ces concepts afin de les matérialiser. Notre objectif dans ce mémoire est donc de définir et d’implanter un modèle complet de perception et de mémoire dans le contexte d’une simulation multi-agent en temps réel. Nous allons conceptualiser un modèle de mémoire, caractériser ses mécanismes, détailler et implanter le modèle dans un système de simulation en temps réel. Ces travaux sont motivés par le fait qu’aucun modèle de perception et de mémoire ne présente un niveau de détails satisfaisant pour pouvoir être adapté et implanté dans un contexte de simulation multi-agent. La finalité de ce mémoire devrait donc conduire à un modèle de mémoire efficace dont les fonctionnalités reflètent celles de la mémoire humaine.
  • 14. -14- 1.3 Démarche et présentation du mémoire La première étape de ces recherches a été l’exploration d’ouvrages en sciences cognitives sur les sujets de la perception, de la mémoire et de l’apprentissage. L’objectif était d’avoir une idée claire sur le fonctionnement des mécanismes du cerveau humain. Évidemment, ces recherches bibliographiques en psychologie nous ont amené aux limites de la connaissance que les chercheurs ont des processus cognitifs. Nous avons quand même répertorié des avancées intéressantes qui nous ont permis d’établir un modèle relativement cohérent par rapport aux mécanismes humains compte tenu évidemment du contexte dans lequel il est développé. Les résultats de ces recherches bibliographiques sont présentés dans le chapitre 2. Par la suite, nous avons proposé un modèle complet de perception et de mémoire basé sur les concepts présentés précédemment. Pour chacun des concepts proposés, nous avons défini et implanté tous les mécanismes que le modèle comprenait. Pour ce faire nous avons, encore une fois, effectué une revue scientifique pour découvrir que la documentation sur la perception et la mémorisation dans un contexte d’une simulation virtuelle multi-agent en temps réel n’était pas très abondante. Cependant, avec les sources trouvées, nous avons pu construire une base solide pour finalement développer nos propres mécanismes de perception et de mémorisation qui sont présentés dans le chapitre 3. Une fois ces mécanismes définis, nous les avons introduits dans la simulation multi-agent (chapitre 4) pour vérifier le bien fondé de notre modélisation et ainsi obtenir des résultats concrets sur la faisabilité et la performance d’une telle approche (chapitre 5).
  • 15. -15- ____________________________________ Chapitre 2 Recherches antérieures sur la mémoire ____________________________________
  • 16. -16- 2 Recherches antérieures sur la mémoire L’objectif d’une partie du projet MAGS est de développer un modèle de perception et de mémorisation pour un système multi-agent. Nous cherchons donc à simuler, le plus exactement possible, les mécanismes humains qui interviennent dans des situations de mémorisation de l’environnement. Il est évident que, pour y arriver, il est essentiel de comprendre les mécanismes cognitifs impliqués dans ce qui nous préoccupe : la perception et la mémoire. Le but de ce chapitre est donc d’explorer le domaine de la psychologie cognitive afin d’identifier les concepts généraux reliés à la mémoire humaines. La première étape consiste à parcourir l’évolution historique des dernières décennies à la recherche des avancées qui ont marqué l’histoire de la recherche sur la mémoire. Ensuite, nous nous attarderons plus précisément sur les concepts et les mécanismes qui interviennent dans la mémorisation. Finalement, nous étudierons les différents modèles de mémoire développés jusqu’ici. 2.1 Historique des recherches sur la mémoire La recherche scientifique en psychologie n’est apparue que dans la moitié du 19e siècle. C’est donc une science très jeune qui a rapidement évolué surtout grâce aux nouveaux outils technologiques développés durant les dernières décennies. Depuis le commencement, l’apprentissage a été un important champ de recherche pour les scientifiques. L’une des raisons qui ont poussé les recherches a été la théorie de l’évolution de Darwin parue en 1859 [Darwin, 1859]. Les chercheurs voulaient savoir comment se fait l’adaptation d’un membre individuel d’une espèce donnée pendant sa vie. Il fallait donc comprendre la relation entre l’adaptation générale d’une espèce et l’apprentissage individuel de l’individu. Cette question est encore aujourd’hui très présente dans les différents sujets d’études. Depuis ce temps, les théories de l’apprentissage ont occupé les chercheurs pendant plus d’un siècle avant qu’ils ne s’intéressent plus sérieusement aux caractéristiques de la mémorisation en tant que concept indépendant. L’apprentissage et la mémoire sont des concepts qui ont été beaucoup entremêlés au commencement des recherches. Le terme mémorisation était presque
  • 17. -17- complètement absent. Il n’était pas rare d’utilisé le terme de l’apprentissage pour parler de la mémorisation d’un élément. L’une des raisons était que la mémorisation d’un élément, indiquait que nous avions appris cet élément. En fait, nous savons aujourd’hui que mémoire et apprentissage sont des mécanismes très différents. Donc il ne faut pas être surpris si le terme apprentissage revient souvent dans les études sur la mémorisation du début du siècle. Nous allons ici nous intéresser à l’histoire et à l’évolution du concept de mémorisation afin de mieux comprendre l’orientation des recherches actuelles. Hermann Ebbinghaus (1850-1909) Ebbinghaus a été le premier à effectuer une étude rigoureuse de la mémoire humaine, qu’il publie en 1885 : Über das Gedächtnis (« Concerning memory »). Ebbinghaus se prend lui- même comme cobaye dans ses expériences. Dans l’une de ses expériences, il devait apprendre une liste de 13 syllabes aléatoires pour ensuite les répéter dans le même ordre et sans erreurs. Il mesurait ensuite le temps nécessaire pour réapprendre la liste. Ebbinghaus était intéressé par la facilité de l’apprentissage lorsque les concepts ont déjà été appris (le délai entre les deux apprentissages était pris en considération). Dans l’exemple de la liste, il a gagné 64.3% de temps entre les deux apprentissages (1156 sec (1ère fois) – 467 sec (2ième fois) / 1156 = 64.3%). Avec ces résultats, il a obtenu ce qu’il appelle la courbe de rétention (Figure 2.1). Fonction de rétention 60 55 Temps gagné % 50 45 40 35 30 25 20 0 200 400 600 800 Heures de délai entre les apprentissages Figure 2.1 : Fonction de rétention de Ebbinghaus
  • 18. -18- L’apport d’Ebbinghaus est surtout au niveau de la méthodologie expérimentale pour l’étude des phénomènes de la mémoire. Il a proposé la courbe de rétention et la courbe d’apprentissage qui sont des outils encore très utilisés de nos jours. Ivan Petrovich Pavlov (1849-1936) À l’origine, Pavlov travaillait sur la physiologie de la digestion, ce qui lui valut le prix nobel de médecine en 1904. Une partie de ses recherches consistait à mesurer le taux de salivation des chiens lorsqu’il introduisait de la nourriture dans leurs mâchoires. Il a, par la suite, découvert qu’après un certain nombre d’essais, les mesures exactes n’étaient plus possibles parce que les chiens salivaient dès que Pavlov entrait dans la pièce. C’est à ce moment qu’il commenca l’étude de ce phénomène connu maintenant sous le nom de conditionnement classique [Pavlov, 1927]. La technique de base commence avec un stimulus non-conditionné (« unconditionned stimulus » ou US) qui invoque une réponse non-conditionnée (« unconditionned response » ou UR). Par exemple, la nourriture est un US et la salivation est un UR. Ensuite, le US est combiné avec un stimulus conditionné (CS) comme une cloche. Après un certain nombre d’essais, le CS est capable d’invoquer lui-même une réponse chez le cobaye. Lorsqu’une réponse se produit suite au CS, on appelle cette réaction une réponse conditionnée (CR). La Figure 2.2 illustre bien le conditionnement classique de Pavlov.
  • 19. -19- Temps (a) Combinaison initiale Présentation de la séquence : CS US (cloche) (Nourriture) Réponse : UR (Salivation) (b) Réponse conditionnée Présentation de la séquence : CS US (cloche) (Nourriture) Réponse : CR UR (Salivation) (Salivation) (c) Extinction Présentation de la séquence : CS (cloche) Réponse : CR (Salivation) Figure 2.2 : Procedure d'expérimentation de Pavlov Nous ne discuterons pas davantage du conditionnement dans ce document. Cependant quelques phénomènes de bases établis par Pavlov (1927) ont quand même leur importance : 1- Acquisition : L’amplitude de la réponse conditionnée peut être exprimée comme une fonction du nombre d’essais de la combinaison du US et du CS. La Figure 2.3 montre que le CS augmente avec le nombre de répétitions de l’expérience.
  • 20. -20- Acquisition 16 14 12 Salivation CS 10 8 Salivation CS 6 4 2 0 0 2 4 6 8 10 12 14 Nombre de répétitions de l'expérience Figure 2.3 : Acquisition d'une réponse conditionnée 2- Extinction : Qu’arrive-t-il lorsque le stimulus non conditionné (US) n’est plus combiné avec le stimulus conditionné (CS) ? La réponse conditionnée va diminuer si on augmente le nombre d’essais pour laquelle aucun US n’est présenté. Ce processus est connu sous le nom d’extinction. La fonction d’extinction du conditionnement est similaire à la fonction de rétention de la mémoire (Figure 2.4). Il y a cependant une différence entre les deux méthodes puisque la fonction de rétention est obtenue en faisant intervenir des délais d’attentes sans présenter de stimulus.
  • 21. -21- Extinction 14 12 Salivation CS 10 8 Salivation CS 6 4 2 0 0 2 4 6 8 10 12 Nombre de répétitions de l'expérience Figure 2.4 : Processus d'extinction dans le conditionnement classqiue 3- Reprise spontanée : Quelquefois après une série d’extinctions, le CS est présenté de nouveau sans le US. L’amplitude de la réponse montre souvent des signes de reprise. 4- Ordonnancement temporel : Pavlov a remarqué que le conditionnement fonctionne beaucoup mieux lorsque le CS (cloche) est présenté avant le US (nourriture). Pavlov a donc catégorisé le conditionnement classique comme étant réflexif et automatique. Les recherches actuelles tendent cependant à décrire le phénomène avec une vue beaucoup plus cognitive. Encore aujourd’hui le conditionnement est souvent pointé comme étant un processus simple et à la base de l’apprentissage. Edward L. Thorndike (1874-1949) Thorndike étudiait une situation d’apprentissage quelque peu différente. Il enfermait un chat dans une boite et le chat devait apprendre comment sortir de la boite pour accéder à la nourriture qui était à l’extérieur. La boite était munie d’un petit levier qu’il fallait actionner pour ouvrir la porte et ainsi se libérer. Thorndike s’intéressait à la rapidité d’apprentissage du chat pour sortir suite à de nombreux essais dans la boite. Ses observations ont conduit au fait qu’au début, le chat se comportait au hasard bougeant d’un coin à l’autre de la boite sans savoir quoi faire jusqu’à ce que, par chance, il actionne le levier pour sortir. Plus le nombre d’essais augmentait, plus la durée du comportement hasardeux du chat diminuait, jusqu’à ce
  • 22. -22- qu’il soit capable de sortir de la boite très rapidement. Ce type d’apprentissage à été qualifié par Thorndike comme étant un apprentissage par essais et erreurs (« trial-and-error learning ») illustré par la Figure 2.5. Courbe d'apprentissage 70 60 Temps pour sortir (sec) 50 40 Temps 30 20 10 0 0 5 10 15 20 25 Nombre de répétitions de l'expérience Figure 2.5 : Courbe d'apprentissage de Thorndike Le processus d’apprentissage étudié par Thorndike s’appelle le conditionnement instrumental. Comme dans Pavlov, une réponse est apprise suite à un stimulus. Ce qui diffère c’est que dans la boite de Thorndike, le stimulus est la boite et la réponse est l’action permettant d’ouvrir la boite. Il serait intuitif de penser que le stimulus est la nourriture à l’extérieur mais Thorndike explique que celle-ci joue un rôle de renforcement plutôt que de stimulus. Ainsi, Thorndike pense que « un lien stimulus-réponse sera formé à chaque fois qu’un renforcement suit la réponse en présence du stimulus » [Thorndike, 1898]. Clark L. Hull (1884-1952) De 1930 à 1970, la psychologie américaine a été dominée par une série de grandes théories de l’apprentissage. Parmi ces théories, la plus influente fût sûrement celle de Hull appelée théorie du comportement. L’idée de base de Hull était de développer une théorie systématique permettant d’expliquer tous les comportements. La théorie finale de Hull [Hull, 1952] comportait plusieurs équations qui se résument en celle-ci :
  • 23. -23- E = (H x D x K) - I Le but de cette équation (la réponse « E ») était de prédire le potentiel de réaction. Ce potentiel est déterminé par la probabilité, la vitesse et la force avec lesquels un comportement répondra à un stimulus. Ainsi, les réponses potentielles pour un rat enfermé dans un labyrinthe sont de tourner à gauche, de tourner à droite ou de s’arrêter. La réponse avec le potentiel de réaction le plus fort sera la réponse adoptée par le rat. Selon la théorie de Hull, le potentiel de réaction serait une fonction des facteurs H, D, K et I. H - Force de l’habitude (Habit Strength). H représente la force de l’association construite entre le stimulus et la réponse des essais précédents. D - Energie (Drive). Selon Hull, les comportements ne sont pas seulement le résultat d’une habitude comme le suggère Thorndike. Hull propose que l’état d’énergie d’un organisme soit un agent énergisant pour l’habitude. Si l’énergie est à zéro, toute la force du monde lié à l’habitude ne produira aucune réponse. K - Motivation (Incentive Motivation). L’habitude et l’énergie ne sont pas suffisantes pour expliquer les comportements. Un rat entraîné dans un labyrinthe pour chercher de la nourriture va s’arrêter s’il sait que la nourriture a été enlevée. Si la quantité de nourriture diminue, les performances du rat déclinent. La motivation est donc une mesure de la quantité et du délai de la récompense. I – Inhibition. L’inhibition reflète la fatigue et l’effet d’extinction des essais pour lesquels la récompense n’est plus présentée. Ce que Hull met en évidence dans sa théorie, c’est la relation existant entre l’apprentissage et la motivation. L’apprentissage ne suffit pas à créer des comportements; il doit aussi y avoir de la motivation.
  • 24. -24- Lorsque l’on fait une rétrospective de la théorie de Hull, on s’aperçoit que les efforts ont été incomplets et imparfaits. Cela devenait de plus en plus apparent avec le développement de logiciels informatiques capables de prédire de tels comportements basés sur ces théories. Il n’en demeure pas moins que les recherches de Hull demeurent toujours une référence dans les théories récentes de l’apprentissage et de la mémoire. Edward C. Tolman (1886-1959) Les théories de l’apprentissage comme celles de Hull ou de Thorndike ont fait l’objet de plusieurs critiques dans la communauté scientifique. La critique la plus influente fût celle d’Edward Tolman. La première démonstration implique l’apprentissage latent, précédemment mentionné par Thorndike avec « law of effect ». L’expérience de base de Tolman et Honzik consiste en un labyrinthe ayant 14 points où le rat devait effectuer un choix. Trois groupes de rats ont été utilisés pendant 17 jours parcourant 1 fois par jour le labyrinthe. Le premier groupe de rat avait toujours de la nourriture à la fin du parcours tandis que le deuxième groupe n’avait aucune récompense. Le troisième groupe, quant à lui, s’est vu présenter de la nourriture seulement après le 11ième jour de l’expérience. La Figure 2.6 présente la performance des trois groupes tout au long de l’expérience.
  • 25. -25- Expérience de Tolman 12 10 Aucune 8 récompense Erreurs Toujours une 6 récompense 4 Récompense après 2 11 jours 0 0 5 10 15 20 Jours Figure 2.6 : Résultat de l'expérience de Tolman L’expérience indique le nombre de mauvais choix effectués par les rats tout au long du parcours pour atteindre la sortie du labyrinthe. Le groupe ayant eu de la nourriture le 11ième jour a dramatiquement augmenté ses performances le 12ième jour jusqu’à surpasser le groupe qui a toujours été renforcé. Selon Tolman, les rats non renforcés (pas de nourriture) apprennent quand même tout le labyrinthe. Cependant, leur apprentissage est en latence; lorsqu’un but fut introduit, ils ont transformé leur apprentissage en performance. Ainsi, pour Tolman, le renforcement n’est pas nécessaire à l’apprentissage mais il est nécessaire pour la performance. Newell & Simon (1961) Lorsque le behaviorisme commença à éprouver des difficultés expérimentales dues à la complexité de l’être humain, une nouvelle méthode pour la construction de théorie vit le jour. Cette méthode, basée sur la simulation par ordinateur, a beaucoup attiré l’attention des chercheurs en psychologie. L’approche a été développée par Allen Newell et Herbert Simon, deux collaborateurs à l’université Carnegie Mellon qui oeuvraient dans le domaine de l’intelligence artificielle (IA).
  • 26. -26- Newell et Simon montrent que la simulation par ordinateur peut utiliser la puissance de cette technologie pour effectuer des prédictions de théories scientifiques complexes. La technique de simulation a bouleversé la nature théorique de la psychologie. Newell et Simon font plus que de la simulation: influencés par le développement de l’IA, ils mettent en relation la cognition humaine et l’ordinateur. C’est à partir de ce moment qu’émerge la métaphore de l’ordinateur qui a vraiment été difficilement acceptée par les psychologues. Pour eux, le cerveau humain est très différent d’un ordinateur et cette théorie basée sur l’analogie de la cognition et d’un ordinateur semble être une erreur [Rumelhart & McClelland, 1986]. Par la suite, Newell et Simon développèrent plusieurs simulations pour des problèmes d’apprentissage et de cognition. Cependant, ce n’est pas ce qui a forgé leur place dans l’histoire: leur grande contribution s’est faite au niveau de la résolution de problèmes. La plus grande difficulté des théories précédentes était de déterminer la relation entre la connaissance (ce que l’organisme apprend par expérience) et les comportements. Quelques théories comme celles de Thorndike et Hull combinent ces deux concepts et ne font aucune différence entre la connaissance et les comportements. Newell et Simon montrent comment la connaissance peut être séparée de la partie comportementale. Suivant cette voie, ils montrent que la théorie du comportement appliquée rigoureusement pourrait permettre des constructions mentales. Cette démonstration met en pièces le doute contre le mentalisme que Watson avait énoncé dans les années 50. Suite à cela, Newell et Simon établissent les bases d’une révolution cognitive transformant ainsi tous les champs de la psychologie y compris l’apprentissage. Ce qu’il faut retenir du travail de Newell et Simon, c’est ce qu’ils appelaient le GPS (General Problem Solver) [Newell & Simon, 1972]. Le GPS est une simulation par ordinateur utilisant le déploiement de la connaissance en résolution de problèmes de la façon suivante. 1- Identifier la différence majeure entre la situation courante et le but à atteindre; il faut se concentrer sur le but. 2- Choisir une action susceptible d’éliminer cette différence (opérateur)
  • 27. -27- 3- Si l’opérateur est applicable, l’appliquer. Sinon, définir un sous-but qui rendra l’opérateur applicable et reprendre à l’étape 1. Newell et Simon (1972) donnent cet exemple tiré de la vie de tous les jours pour expliquer leur analyse. 1- But : Je veux amener mon fils à l’école. Quelle est la différence entre ce que j’ai et ce que je veux? C’est la distance. 2- Opérateur : Qu’est-ce qui change la distance? Mon automobile. 3- Applicable ? Mon automobile ne fonctionne pas! Nouveau but : Que faut-il pour qu’elle fonctionne? une nouvelle batterie. 1- But : Me procurer une nouvelle batterie.... 2- ... L’exemple complet se trouve dans leur ouvrage de 1972 mais le concept important de la théorie est celui de sous-buts. À l’aide des sous-buts, il est possible d’organiser des comportements cohérents en réponse à des situations très complexes. Ceci représente une avancée majeure par rapport au concept de réponses de Skinner. Newell et Simon montrent donc que la simulation par ordinateur peut être utilisée pour modéliser des processus cognitifs complexes. De plus, ils montrent qu’à l’aide de leur approche GPS, il est possible de convertir la connaissance en comportements. Modèle de mémoire de Atkinson & Shiffrin, 1968 C’est en 1968 que Richard Atkinson et Richard Shiffrin publiaient une théorie sur la mémoire humaine. Cette théorie amena une vision nouvelle sur la nature de la mémoire humaine qui, jusqu’ici, avait été un peu négligée au profit des théories de l’apprentissage. Leurs travaux marquaient l’arrivée de l’ère moderne, qui influença tous les développements futurs dans l’étude de l’apprentissage animal et humain.
  • 28. -28- Ils amenèrent l’idée que la mémoire était constituée de deux unités de stockage : la mémoire à court terme et la mémoire à long terme. La mémoire à court terme est considérée comme une mémoire temporaire ne pouvant contenir qu’une petite quantité d’information. L’exemple classique de ce type de mémoire est lorsque l’on veut se rappeler d’un numéro de téléphone: un numéro de sept chiffres se retient bien, mais une difficulté s’ajoute lorsque l’indicatif régional de trois chiffres est ajouté. C’est donc une mémoire temporaire et fragile car, si la personne subit une légère distraction, elle oubliera rapidement le numéro. La façon de retenir l’information dans la mémoire à court terme est de se la répéter encore et encore. Ce processus de répétition de l’information est appelé « rehearsal ». La mémoire à long terme, à l’opposé, est reconnue pour être un endroit où la connaissance repose de façon permanente; de plus, elle ne présente pas de limitation apparente de capacité. L’idée de base de la distinction de ces deux types de mémoire existe depuis un certain nombre d’années. Broadbent (1957) a été l’un des premiers à les décrire. Atkinson et Shiffrin rassemblèrent ces idées en une théorie précise, exprimée sous forme d’un modèle mathématique et d’un modèle de simulation informatique. La Figure 2.7 illustre la base de leur théorie. L’information arrive à la mémoire à court terme par le biais du processus de perception. Ensuite pour que l’information soit transférée dans la mémoire à long terme, il faut répéter cette information. À chaque répétition il y a une chance que l’information se déplace vers la mémoire à long terme. Ainsi, l’augmentation du nombre de répétitions d’une information augmente la probabilité de rétention de celle-ci dans la mémoire à long terme. Étant donné l’espace limité dans la mémoire à court terme, la répétition d’une nouvelle information entraîne la perte d’une autre information.
  • 29. -29- Répétition Mémoire à Mémoire à Information Tranfert court terme long terme Déplacé Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin Suite à la théorie innovatrice de Atkinson et Shiffrin faisant la distinction entre la mémoire à court terme et la mémoire à long terme, de grandes questions soulevèrent la communauté scientifique. La structure, l’organisation et les conditions de récupération de l’information sont des avenues importantes qui n’ont pas été mentionnées. Le fait que maintenant les psychologues proposent de nouvelles théories suite aux échecs des théories précédentes représente un avancement considérable. La section 2.1 a montré que la psychologie s’est déplacée au-delà des arguments verbaux pour se préciser et ainsi produire des modèles qui peuvent être testés donc maintenues ou rejetés. Nous avons pu comprendre les enjeux des recherches en psychologie en nous positionnant correctement sur les concepts importants de la mémoire humaine.
  • 30. -30- 2.2 Théories de la mémoire L’histoire des recherches sur la mémoire est relativement jeune et évidemment très complexe. Les dernières décennies ont beaucoup développé les méthodes expérimentales (voir section précédente) et, suivant cela, les théories cognitives ont commencé à émerger. Il est évident que les « preuves » de ces théories sont empiriques, mais celles-ci constituent néanmoins une avancée dans le domaine de la recherche en psychologie. Voici donc les principales théories concernant successivement la mémoire perceptuelle, la mémoire à court terme, la mémoire de travail et la mémoire à long terme. Nous allons, pour chacun de ces types de mémoires, détailler les phénomènes et les mécanismes qui leur sont rattachés dans le but de comprendre leur fonctionnement. 2.2.1 Mémoire perceptuelle La première question à se poser est la suivante : comment l’information présente dans l’environnement s’enregistre-t-elle dans une mémoire permanente? Le système perceptuel, comme celui de la vision ou de l’audition, transforme les signaux arrivant aux capteurs (œil, oreille, etc.) en représentation perceptuelle. Cette représentation doit être stockée quelque part assez longtemps pour pouvoir être analysée et ainsi créer la représentation correspondante. Beaucoup de recherches se sont orientées dans le but d’étudier les propriétés de ces endroits temporaires qui stockent l’information de la vision ou de l’audition. L’une des premières expériences concluantes sur le sujet fût celle de Sperling [Sperling, 1960] qui traça une courbe du nombre d’items mémorisés dans la mémoire visuelle selon le temps d’exposition de l’information (Figure 2.8). La conclusion fût qu’après avoir enlevé le stimulus visuel, la mémoire visuelle du sujet contenait toute l’information mais celle-ci s’effaçait très rapidement. En 1967, Neisser [Neisser, 1967] supposa que la mémoire visuelle reflétait l’activation neuronale responsable du système visuel. Sakitt [Sakitt, 1976], quant à elle, énonça l’idée que la mémoire était située dans les photorécepteurs de la rétine. Elle montra que les propriétés de la mémoire visuelle étaient très semblables aux propriétés sensitives présentes dans l’utilisation d’une vision nocturne. Selon cette analyse, la mémoire visuelle se
  • 31. -31- comparerait à l’image résiduelle d’un éclair dans la nuit. En 1983, Haber [Haber, 1983] remit en question l’idée puisque l’humain ne perçoit pas le monde seulement par des flashs. Coltheart (1983) lui répondit que la majorité de l’information acquise est obtenue dans les premières 50 ms de fixation (les yeux étant presque toujours en mouvement pour scruter les objets). Sperling Mean number of letters 3,5 3 2,5 recalled 2 1,5 1 0,5 0 0 0,2 0,4 0,6 0,8 1 Delay of Tone, (Sec) Figure 2.8 : Résultat du rapport de Sperling Plusieurs chercheurs ont donc élaboré des théories sur la structure et les propriétés de cette mémoire visuelle. Cependant, il n’y a aucun concensus établi sur la nature de celle-ci; la seule chose sur laquelle ils s’entendent tous, c’est qu’elle existe ! 2.2.2 Mémoire à court terme La mémoire à court terme a été très critiquée au cours du temps. Personne ne semblait en accord avec les différentes théories proposées. Il faut rappeler que la mémoire à court terme a été introduite uniquement pour expliquer les différences notables que la théorie de la mémoire à long terme n’expliquait pas. Les données empiriques recueillies au cours des années ont permis d’identifier certains phénomènes reliés à la mémoire en générale. Il était très difficile de comprendre et d’expliquer toutes ces données si l’introduction d’une mémoire à court terme n’était pas faite entre la
  • 32. -32- mémoire perceptuelle et la mémoire à long terme. Cette section considère donc les phénomènes et les mécanismes de la mémoire à court terme en tentant de comprendre les théories et les différents problèmes associés. 2.2.2.1 Effets de la répétition Les premières études montrèrent que plus une information était répétée, plus elle était mémorisée [Rundus, 1971]. Ce résultat venait confirmer le modèle de Atkinson & Shiffrin proposé en 1968. Cependant, l’étude de Glenberg, Smith et Green en 1977 [Glenberg, 1977] ne pût corroborer cette théorie suite à l’une de leur expérience. Les sujets devaient mémoriser un nombre de quatre chiffres pendant 2 secondes pour ensuite répéter un mot pendant 2, 6 ou 18 secondes et finalement redire le nombre précédemment appris. Le nombre d’essais de l’expérience fût de 64. Après l’expérience, les chercheurs demandèrent aux sujets de se rappeler du mot qui avait été répété. Les sujets pensaient que l’expérience portait sur la mémorisation du nombre et non du mot. Les résultats furent donc désastreux : 11, 7 et 12 % de réussite pour 2, 6 et 18 secondes de répétition respectivement. Cette étude montre qu’il n’y aurait pas de relations entre le nombre de répétitions et la mémorisation. Une autre expérience de Craik et Watkins (1973) montrait qu’aucune relation ne pouvait être faite entre le nombre de répétitions et la probabilité de se rappeler l’information. Si le fait de répéter l’information n’influence pas la mémoire, alors quel est le phénomène qui détermine notre mémorisation ? Rundus [Rundus, 1971] trouva une relation entre le nombre de répétitions et la mémoire mais, à la lumière des expériences précédentes, nous savons qu’il y a une variante. En 1972, Craik et Lockart [Craik & Lockart, 1972] proposaient une théorie voulant que pour mémoriser correctement, l’information doit être répétée à un niveau de profondeur acceptable. En d’autres termes, la répétition passive n’améliore pas la mémorisation. La théorie a été passablement critiquée en raison du concept de profondeur qui était trop vague. Il n’en reste pas moins que selon les expériences, la répétition à elle seule n’augmente pas la mémorisation. Cela vient confirmer le modèle de Atkinson et Shiffrin selon lequel l’information se transfère dans la mémoire à long terme par la répétition verbale.
  • 33. -33- 2.2.2.2 Regroupement (Chunking) et capacité L’organisation de la mémoire à court terme est effectuée d’une façon bien précise, sous forme de regroupements ou « chunks ». Essayez de lire la série « A T W B I Y T G Q W E», pour ensuite la répéter. Si vous n’avez aucune erreur, c’est que vous disposez d’une mémoire immédiate très efficace sinon, vous risquez de faire 2 ou 3 erreurs. Par contre, si vous faites la même expérience avec la série « N O N E F F I C A C E », vous allez remarquer qu’elle se retient beaucoup plus facilement. En fait, ces deux séries de 11 lettres ne se classent pas de la même façon dans la mémoire à court terme. La première série comprend 11 lettres n’ayant aucun lien entre elles, il est donc difficile d’effectuer des regroupements. La seconde série, par contre, peut être regroupée en 2 « chunks », soit « NON » et « EFFICACE » ce qui facilite la mémorisation. La mémoire à court terme peut retenir environ 7 chunks ± 2 [Miller, 1956]. Il est possible d’emmagasiner beaucoup d’information dans la mémoire perceptuelle et beaucoup d’information dans la mémoire à long terme. Cependant, le transfert de toute cette information d’une mémoire à l’autre est difficile puisqu’il faut la traiter dans la mémoire à court terme qui a une capacité très limitée. Il y a donc une énorme limitation sur la quantité d’éléments que nous pouvons mémoriser [Miller, 1956 ; p.95]. Évidemment, la solution à la limite de capacité de la mémoire à court terme se trouve dans la caractéristique qui est de regrouper l’information: cela nous permet de mémoriser beaucoup plus d’éléments. Cependant, la capacité de regrouper des éléments dépend directement des stimuli en relation avec l’observateur. Certains stimuli sont plus facilement groupables chez certaines personnes parce qu’elles ont une expérience différente en rapport avec le matériel présenté. Par exemple, un anglophone aura plus de difficulté qu’un francophone pour retenir une série de mots en français. La mémoire à court terme a donc une capacité de stockage ou de traitement limitée à environ sept « chunks ». La façon de regrouper l’information en « chunks » est aussi l’une des principales caractéristiques de la mémoire à court terme et cela permet d’augmenter la quantité d’information retenue.
  • 34. -34- 2.2.2.3 Rétention et oubli La mémoire semble s’effacer au fil du temps. Plusieurs expériences déterminent que la perte de la mémoire est une fonction du temps. Nous avons précédemment présenté les travaux d’Ebbinghaus portant sur la fonction de rétention. La fonction de rétention démontrait comment la performance de la mémoire diminuait avec le temps. Toutes les fonctions de rétention ont sensiblement le même comportement: initialement, l’oubli est rapide mais la courbe s’estompe aussi rapidement. Mais est-ce que la perte d’information n’est fonction que du temps ? Il existe deux grandes théories pour expliquer l’oubli dans la mémoire à court terme. La première théorie suppose que la trace de l’information qui est en mémoire décroit avec le temps (decay hypothesis). La seconde hypothèse suppose que l’oubli survient suite à l’ajout de nouvelles informations stockées en mémoire. Cela causerait donc de l’interférence sur les informations déjà présentes dans la mémoire à court terme (interference hypothesis). Si l’hypothèse selon laquelle l’information s’efface progressivement en mémoire est juste, la variable déterminante pour savoir si oui ou non l’information est récupérable est le temps écoulé. Plus le délai est long, plus l’oubli est fort et vice versa. Par contre, si l’oubli est le résultat de l’interférence entre les informations, le facteur déterminant devrait être la nature de l’information qui survient au moment présent. Plus il y a de liens entre les informations présentes dans la mémoire à court terme, plus l’interférence augmente ce qui résulte en une augmentation de l’oubli. Évidemment, les recherches [Baddeley, 1998, 1996] montrent qu’il ne s’agit pas de l’une ou l’autre des hypothèses mais bien d’une combinaison des deux. Beaucoup d’études ont été effectuées sur les circonstances du phénomène de l’oubli dans la mémoire à court terme [Brown & Hulme, 1995 ; Kieras, Meyer, Mueller & Seymour, 1998]. C’est un domaine très complexe ou aucune conclusion claire n’a été proposée. C’est pourquoi nous mentionnons le phénomène sans trop nous y attarder. Des modèles récents de la mémoire de travail et de la mémoire à court terme proposent des fonctions de rétention liées au temps d’extinction et à
  • 35. -35- l’interférence [Dosher, 1999 ; Dosher & Ma, 1998 ; Lewandowsky & Murdock, 1989; Rubin & Wenzel, 1996; Wickelgren, 1970]. Cependant, ces modèles sont très difficiles à utiliser dans le contexte de notre projet car les fonctions ont besoin d’informations très précises sur l’acquisition et l’encodage des éléments dans la mémoire, ce que nous n’avons pas. 2.2.2.4 Différence d’encodage Un argument permettant de séparer la mémoire à court et à long terme fût la différence d’encodage de l’information dans ces deux dernières. Il semblait que l’encodage dans la mémoire à court terme était de nature sensorielle. Une expérience classique de Kintsch et Buschke (1969) montra la distinction entre ces deux mémoires. L’expérience consistait à présenter visuellement 16 mots aux sujets au rythme d’un mot toutes les deux secondes. Ensuite ils demandèrent aux sujets de répéter tous les mots dans la liste qui suivaient un mot en particulier. L’hypothèse était que les sujets répétaient les derniers mots de la liste dans leur mémoire à court terme. Suivant cela, les sujets devraient avoir de bons résultats lorsque les derniers mots de la liste sont demandés puisqu’ils sont répétés. Ce résultat fût observé tel qu’attendu et ce phénomène fût appelé recency effect. La mémorisation du reste de la liste dépend de la mémoire à long terme. Kintsch et Bushke raisonnèrent sur le fait que la mémoire à court terme était de type verbal. Il y aurait de l’interférence acoustique si les mots de la liste avaient une sonorité semblable (exemple : sea et see). Si on demandait au sujet de répéter les mots suivant see, il pourrait répéter les mots suivant sea. Les problèmes devraient être plus nombreux vers la fin de la liste étant donné l’encodage acoustique de la mémoire à court terme. Quant aux mots du début de la liste, ils devraient se produire une confusion sémantique si des synonymes sont présents (sea et ocean). La raison est que les premiers mots de la liste sont dans la mémoire à long terme, qui se veut une mémoire sémantique. Les hypothèses de Kintsch et Bushke furent vérifiées et ces chercheurs conclurent qu’il y avait une différence d’encodage entre la mémoire à court terme et la mémoire à long terme.
  • 36. -36- Évidemment, la théorie fût critiquée mais l’idée de base de la différence d’encodage entre les deux mémoires fût respectée. 2.2.3 Mémoire de travail Il existe une multitude de mémoires permettant de maintenir provisoirement l’information disponible. Il y a le système sensoriel qui retient brièvement l’information qu’il reçoit pour que l’organisme ait une chance de l’encoder dans une mémoire permanente. L’information peut aussi être maintenue dans des tampons sensoriels par la répétition (slave rehearsal processes) [Baddeley, 1986]. Toutes ces mémoires transitoires sont utilisées pour guider le traitement de l’information. Pour être juste dans nos propos, il faut donc parler de ces types de mémoire comme étant la mémoire de travail. La mémoire de travail amenée par Baddeley diffère de la mémoire à court terme sur les points suivants. Premièrement, la mémoire de travail se compose de trois composantes servant au traitement parallèle de l’information. Il y a le système central (central executive) qui est un contrôleur d’attention soutenu par deux systèmes esclaves : le phonological loop et le visuo-spatial sketch pad. Visuo- Phonological Spatial Central Loop sketch pad executive Figure 2.9 : Représentation de la mémoire de travail de Baddeley Le système phonological loop comprend un endroit de stockage de l’information ainsi qu’un mécanisme de répétitions (rehearsal process). Ce système semble être impliqué dans l’apprentissage à long terme phonologique comme dans l’acquisition de nouveaux mots par exemple. Le deuxième système esclave, visuo-spatial sketch pad, est un système qui stocke et manipule des images visuelles. Il est impliqué dans l’apprentissage et la mémorisation par imagerie.
  • 37. -37- Le système central, quant à lui, est la composante la plus complexe et la moins comprise de la mémoire de travail. Ce système contrôle les deux systèmes esclaves tout en assurant un lien avec la mémoire à long terme. Le système central aurait aussi une capacité de traitement de l’information limitée ce qui expliquerait le phénomène du nombre magique de Miller. 2.2.4 Mémoire à long terme Selon une citation célèbre de Edridge-Green (1900), « la mémoire est la fonction la plus importante de notre cerveau… Sans la mémoire, toute l’expérience acquise serait inutile. » Cela énonce bien l’utilité et l’importance de la mémoire en général. Cependant, la mémoire à long terme reflète encore mieux cette citation, car c’est avec cette structure que la mémorisation permanente est effectuée. Cette section traite de la mémoire à long terme, de sa structure et de ses mécanismes. 2.2.4.1 Structure Ces dernières années, les chercheurs ont tenté de catégoriser les différentes fonctions de la mémoire à long terme. Le résultat fût la subdivision de la mémoire à long terme en plusieurs catégories. Mémoire à long terme Déclarative Non Déclarative Faits Événements Aprentissage Habileté Conditionnement non associatif Figure 2.10 : Taxonomie de la mémoire selon Squire (1993)
  • 38. -38- Il existe plusieurs organisations et subdivisions de la mémoire à long terme mais la plus courante dans la littérature est la taxonomie de Squire (1993). Comme le montre la Figure 2.10, la grande distinction si situe entre la mémoire déclarative (mémoire explicite) et la mémoire non déclarative (mémoire implicite). La mémoire déclarative stocke la connaissance de la mémoire à long terme pouvant être récupérée de façon consciente. En d’autres termes, le fait de récupérer l’information dans la mémoire déclarative veut dire que cette information est consciente et que vous savez qu’elle est disponible. De l’autre côté, la mémoire non déclarative ou implicite stocke la connaissance qui peut influencer le comportement sans une implication consciente de votre part. Notre revue bibliographique ne traite que de la mémoire déclarative étant donné la nature du projet que nous développons. Il n’est pas, à ce stade-ci, pertinent d’explorer la façon dont le cerveau stocke l’information implicite, puisque notre système ne considère pas directement ce genre de distinction. Le but de nos recherches est de développer un modèle de mémoire déclaratif pour la mémorisation d’événements, d’objets, d’états ou de localisation spatiale. Nous ne traitons pas de conditionnement ou d’apprentissage à ce stade-ci du projet. Il n’est donc pas nécessaire de s’attarder sur les théories de la mémoire implicite. La mémoire déclarative ou explicite se compose de deux structures : la mémoire épisodique et la mémoire sémantique. Si vous vous demandez quel est le nom de famille de votre mère, vous faites appel à de l’information dans la mémoire épisodique. Lorsque vous récupérez cette information, vous être conscient de celle-ci et vous pouvez verbalement énoncer ce nom. La mémoire épisodique sert aussi à stocker l’histoire. C’est l’habileté mentale à revivre certaines situations pour en extraire des informations et pour anticiper sur le futur [Wheeler, Struss & Tulving, 1997]. En revanche, si je vous demande ce qu’est un nom de famille, vous irez chercher l’information dans la mémoire sémantique qui contient votre connaissance générale du monde. La question vous demande de relier des concepts et des idées, incluant votre connaissance sur la façon d’exprimer ces concepts et ces idées dans un langage donné. Lorsque l’information est récupérée, elle devient explicite : le concept est maintenant devenu conscient et vous pouvez y faire appel.
  • 39. -39- Lorsqu’on s’attarde aux mécanismes de la mémoire à long terme, on s’apperçoit que ce sont sensiblement les mêmes que ceux présents dans la mémoire à court terme. Il y a le phénomène de la répétition qui aide la mémorisation d’un élément. La théorie de Craik et Lockhart sur l’attention s’applique de la même façon que dans la mémoire à court terme. L’organisation de l’information est aussi semblable et considère des regroupements de ce qui est mémorisé (chunking). La fonction de rétention réagit de la même façon dans la mémoire à long terme que dans la mémoire à court terme. Les hypothèses sur celle-ci sont aussi les mêmes : interférence et diminution graduelle de la trace (decay hypothesis). Cependant, l’information semble s’oublier moins rapidement que dans la mémoire à court terme. Est-ce la fonction de rétention qui est différente ou est-ce la force de la trace dans la mémoire à long terme qui est supérieure ? Est-ce que l’interférence joue un rôle moins dominant étant donné la capacité illimitée de la mémoire à long terme ? Toutes ces questions ont amené certains chercheurs [McKoon & Ratcliff, 1986; Tulving, 1989] à s’interroger sur la raison d’être de la mémoire à court terme puisque tous les mécanismes de la mémoire à long terme sont suffisants pour expliquer le comportement de la mémoire à court terme [Anderson, 1993]. C’est ainsi qu’ils ont proposé une hypothèse selon laquelle la mémoire à long terme ne serait qu’une seule et même structure composée de plusieurs mécanismes de traitement. 2.3 Les modèles de mémoire Nous avons étudié différentes théories portant sur la mémoire en explorant les propriétés des mémoires (structure, rétention, encodage, etc.). Il est maintenant temps de regarder ce que la théorie a produit concernant les modèles de la mémoire. Il faut bien comprendre que, en psychologie, il existe une différence entre les théories et les modèles. Les théories sont des avenues proposées pour expliquer un phénomène expérimental sur un sujet bien précis (par exemple la théorie de la rétention de la mémoire à court terme). Les modèles, de leur côté, rassemblent toutes ces théories pour former un tout cohérent qui devrait valider et prédire les phénomènes associés aux mécanismes de mémoire. Jusqu’ici, nous n’avons vu que des théories sur la mémoire à l’exception du modèle de Atkinson & Shiffrin qui a été présenté pour sa distinction historique. Les modèles n’ont pas une place très proéminente dans la recherche expérimentale en psychologie. Cependant, ils seront très utiles dans l’étude et la
  • 40. -40- conception de notre modèle de mémoire. Cela nous permettra de nous concentrer sur les relations entre les théories et la modélisation des mécanismes de mémoire tout en explorant les différentes façons de représenter des mécanismes cognitifs. 2.3.1 Le modèle SAM Étant donné que l’architecte principal de SAM fut Richard Shiffrin, il n’est pas étonnant de retrouver plusieurs propriétés du modèle de double stockage [Atkinson & Shiffrin, 1968]. La mémoire à court terme est vue comme un tampon à capacité limitée permettant deux choses. Premièrement, elle affecte quel item sera stocké dans la mémoire à long terme et deuxièmement, elle est utilisée pour assembler les requêtes pour l’accès à la mémoire à long terme (semblable à la mémoire de travail). La mémoire à long terme, quant à elle, est modélisée comme étant un ensemble illimité d’interconnexions entre concepts. L’information dans cette mémoire se veut permanente et non effaçable. Tout ce qui se rapproche du phénomène de l’oubli n’est qu’un échec lors de la récupération des données. Le concept clé de l’architecture de SAM est l’image. Une image est un ensemble d’interconnexions contenant de l’information sur l’item lui-même, sur le contexte dans lequel l’item a été appris, et sur les relations avec les autres images. Le processus d’association se fait dans la mémoire à court terme. Lorsque la capacité du tampon est excédée, une règle de remplacement détermine quel objet sera perdu. La première version de SAM en 1981 proposait que chaque item dans le tampon avait la même probabilité d’être remplacé. Dans les versions suivantes [Gillund & Shiffrin, 1984], la règle remplaçait l’item le plus vieux dans le tampon. Le concept de répétition est également présent afin d’augmenter la force des associations dans la mémoire. La force d’une association entre deux items ou entre un item et son contexte dépend du temps que ces deux objets passeront ensemble dans la mémoire à court terme. Suite à cela, un modèle assez complet de récupération et de reconnaissance est élaboré dans Gillund & Shiffrin 1984. Même si SAM est en mesure d’expliquer une grande variété de phénomènes psychologiques, il fait quand même l’objet de quelques critiques. Par exemple, le modèle ne prend pas en considération l’attention ou le niveau de traitement de l’information (conscience).
  • 41. -41- 2.3.2 MINERVA 2 Le but premier du développement de MINERVA2 [Hintzman, 1988] était d’expliquer les phénomènes de la mémoire épisodique et de la mémoire sémantique. Étant donné que ces mémoires ont un niveau d’abstraction assez élevé, il fallait émettre plusieurs hypothèses au départ : 1. Seulement les traces épisodiques sont stockées en mémoire, 2. La répétition crée plusieurs traces d’un même item en mémoire, 3. Une requête contacte simultanément toutes les traces en mémoire, 4. Chaque trace est activée selon la similarité de la requête de récupération. Le point 2 soulève une affirmation importante car MINERVA2 suggère que la répétition augmente la force de la trace en mémoire non pas par renforcement, mais bien par redondance, en produisant des copies multiples en mémoire. Ceci diffère des autres modèles dans lesquels c’est la force de la trace de l’item qui est augmenté. L’affirmation de ces hypothèses vient donc élever le niveau du modèle au-delà de l’application que nous désirons en faire. Il n’est donc pas très pertinent pour nous d’étudier plus en détails ce modèle. C’est un modèle intéressant mais la nature même des problèmes qu’il aborde n’est pas d’une grande importance pour nos agents qui sont dans un contexte particulier. C’est pourquoi nous n’aborderons pas non plus certains modèles comme TODAM [Murdock, 1997], REM [Shiffrin & Steyvers, 1997] ou les modèles connectionismes. 2.3.3 Modèle de mémoire de SOAR Le modèle de mémoire de SOAR [Newell, 1990] propose trois mécanismes reliés à la mémoire, soit l’acquisition, la récupération et l’accès. La définition de l’apprentissage du modèle est intimement reliée à la mémoire. Selon Newell, l’apprentissage fait référence au mécanisme d’acquisition de la mémoire mais aussi à celui de la récupération. Newell prétend
  • 42. -42- que l’apprentissage n’est pas seulement l’acquisition de nouvelles connaissances mais aussi la façon de récupérer ces nouvelles connaissances. 2.3.3.1 Hypothèses de SOAR Pour débuter, étudions les différentes hypothèses que SOAR fait à propos de la mémoire et de l’apprentissage. 1- La première hypothèse est l’unité fonctionnelle de la mémoire à long terme (functionnal unity of long-term memory). Tous les modules de la mémoire à long terme devraient consister en une mémoire de reconnaissance. Cette mémoire devrait être uniforme et devrait contenir toute la connaissance, qu’elle soit épisodique, sémantique ou procédurale. Cela n’implique cependant pas un encodage unique pour toute la connaissance stockée dans la mémoire à long terme. Plusieurs niveaux peuvent être utilisés avec, pour chacun d’eux, des mécanismes différents. Par exemple, un ordinateur est fondamentalement composé de circuits manipulant des 0 et des 1. Cependant, les niveaux plus abstraits ne traitent pas nécessairement des 0 et des 1. Ils peuvent posséder différents mécanismes exploitant pourtant ce même système. Il en est de même pour le cerveau humain qui est fondamentalement composé de neurones. Ces neurones peuvent former différents systèmes s’exploitant de manière très différente même si la structure physique de base est la même. 2- La deuxième hypothèse concerne l’apprentissage par chunks (chunking-learning hypothesis). Dans SOAR, tout l’apprentissage à long terme s’effectue par regroupement (chunking). L’unité de l’apprentissage est le morceau ou chunk. Newell admet que le « chunking » n’est pas le seul mécanisme de l’intelligence mais il est, selon lui, suffisant pour supporter toutes les directions de l’hypothèse de l’apprentissage par « chunks ». 3- La troisième considération de Newell est la fonctionnalité de la mémoire à court terme. Une architecture ne serait pas complète sans l’intégration d’une mémoire à court terme servant à fermer la boucle entre tous les éléments d’une mémorisation. SOAR appelle cette mémoire la mémoire de travail. Par sa nature, cette mémoire est temporaire et change au rythme des opérations du système.
  • 43. -43- 2.3.3.2 Théorie qualitative de SOAR Nous allons maintenant nous concentrer sur la théorie qualitative de l’apprentissage de SOAR. Cette théorie est intéressante puisqu’elle vient mettre en relation plusieurs théories de la mémoire que nous avons vues précédemment. 1- Tout ce qui est appris provient d’une activité qui consistait à accomplir un but (goal- oriented activity). C’est probablement la caractéristique la plus importante du mécanisme de chunking. Pour apprendre (ou mémoriser), l’organisme doit avoir un objectif à atteindre. Il n’a pas le but d’apprendre puisque l’apprentissage n’est pas délibéré. Nous acquérons seulement la connaissance nous permettant d’accomplir notre but. 2- Une des propriétés les plus intéressantes pour nous est celle concernant l’apprentissage par répétition. La répétition est le mécanisme par lequel l’information est retenue dans la mémoire à court terme. Dans le modèle de Atkinson et Shiffrin, la répétition était considérée comme le seul mécanisme permettant à l’information dans la mémoire à court terme de se transférer dans la mémoire à long terme. Comme nous l’avons vu, cette hypothèse a été critiqué par la théorie Craik et Lockhart (depth-of-processing). Suite à cela, SOAR indique que la répétition a des effets positifs sur la rétention de la mémoire si ce qui est répété est d’intérêt. Si aucune tâche n’est effectuée et que la répétition n’est qu’un comportement passif, alors l’acquisition à long terme ne pourra pas s’effectuer. SOAR est donc en accord avec la théorie de Craik et Lockhart. 3- La dernière propriété concerne le regroupement (chunking) qui serait, pour plusieurs, la façon dont la mémoire est organisée. Newell se base sur les résultats de DeGroot en 1965 et de Chase & Simon en 1973 sur la perception d’un jeu d’échecs. Une personne doit examiner un jeu d’échecs pendant 5 secondes et ensuite reproduire de mémoire la position de toutes les pièces. Un maître d’échecs fait un excellent travail (en moyenne 23 sur 25 pièces sont placées correctement) tandis que les résultats du débutant sont vraiment désastreux (en moyenne 3 ou 4 sur 25). En fait, ce test de mémoire perceptuelle est le test le plus rapide pour déterminer la compétence aux échecs. Le modèle qui explique ce phénomène le fait en termes de regroupements. Le maître d’échec acquiert, à travers son expérience, la capacité d’effectuer des liens fonctionnels et spatiaux entre les pièces du jeu. Le regroupement permet au maître de caractériser un arrangement complexe de
  • 44. -44- plusieurs pièces en seulement quelques chunks. Le débutant, quant à lui, considère simplement une pièce par chunk, ce qui lui permet d’acquérir seulement la position de quelques pièces. Ces propriétés concernent la mémoire en général, mais quelle est exactement l’opinion de Newell concernant la mémoire à court terme et les mécanismes de transfert vers la mémoire à long terme? Le modèle SOAR ne considère pas vraiment la mémoire à court terme étant donné la confusion qui règne concernant son existence physique [Crowder, 1976]. SOAR considère plutôt une mémoire temporaire servant à exécuter la tâche courante (mémoire de travail). Il est donc nécessaire de remplacer la connaissance contenue dans la mémoire de travail lorsque la tâche courante change. Ce remplacement peut être effectué de plusieurs façons : par un déplacement d’informations, par un déplacement des processus manipulant ces informations ou par une modification du chemin d’accès. Le phénomène de rétention est représenté assez simplement : l’information reste accessible dans la mémoire de travail tant que la tâche courante n’est pas achevée. L’architecture de la mémoire de SOAR se compose donc de différents modules jouant chacun un rôle important. La mémoire de travail est intimement liée à la perception, aux réactions motrices et à l’accès à l’information nécessaire pour résoudre une tâche (Figure 2.11).
  • 45. -45- Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990] Les propriétés de la mémoire dont SOAR rend compte sont, selon Newell, assez cohérentes par rapport aux caractéristiques observées chez l’être humain. Il se base sur des observations empiriques, mais il prend aussi en considération une connaissance assez complète de la littérature en psychologie. Il y a quand même un aspect important de la mémoire qui n’est pas modélisé : l’oubli de la connaissance dans la mémoire de production (mémoire à long terme). 2.3.4 Modèle de mémoire de l’architecture ACT-R Le modèle de mémoire de ACT-R [Anderson, 1990] possède deux systèmes de mémoire à long terme : la mémoire procédurale et la mémoire déclarative. Plusieurs mécanismes sont associés à ces mémoires permettant ainsi d’ajouter et de maintenir l’information. ACT-R est basé sur la théorie de l’analyse rationnelle de Anderson. Suivant cela, le système cognitif est entièrement optimisé en fonction de son environnement. Un premier exemple du rôle de l’analyse rationnelle est la mémoire déclarative. Les éléments de la mémoire déclarative sont appelés chunks et sont l’équivalent des chunks de SOAR. Chaque chunk possède une valeur d’activation représentant la probabilité que le chunk soit
  • 46. -46- sollicité dans le contexte courant. Pour être en mesure d’estimer cette valeur, les mécanismes d’apprentissage doivent garder toujours un œil attentif sur l’environnement. Deux facteurs sont pris en compte : combien de fois le chunk a été utilisé dans le passé et combien de temps s’est écoulé depuis sa dernière utilisation. Ensuite, ACT-R possède une mémoire procédurale où la connaissance est représentée par des règles de production. Chaque règle est associée à un ou plusieurs paramètres. ACT-R définit une pile de buts (Goal-Stack) servant à empiler dynamiquement des chunks pour des usages temporaires. Comme le nom l’indique, seulement le chunk du dessus de la pile est accessible à un moment donné. Ce mécanisme est similaire à la mémoire de travail des théories cognitives ainsi qu’à celle définie par SOAR. Les mécanismes de l’architecture de la mémoire de ACT-R sont définis par des formules mathématiques et explicites, ce qui permet une modélisation plus directe comparativement au modèle de Newell. Suivant cela, une équation de l’accumulation de la force de rétention suite à la pratique a été proposée par Anderson & Fincham (1999). La force de la trace en mémoire est caractérisée comme suit : F = ∑ ti-d où ti est le temps écoulé de la ie pratique depuis l’acquisition de l’information. La constante « d » représente le taux d’apprentissage pouvant varier d’une personne à l’autre. Donc, la somme de tous les temps écoulés des pratiques de la donnée depuis son acquisition est calculée pour former la force de la trace en mémoire de l’élément mémorisé. 2.3.5 EPIC SOAR et ACT-R sont des architectures qui se concentrent sur la cognition centrale, c’est à dire les mécanismes liés directement à la mémoire et à l’apprentissage. EPIC (Executive- Process Interactive Control) [Kieras & Meyer, 1997] insiste plutôt sur l’importance de la cognition périphérique, c’est-à-dire tous les mécanismes qui interagissent avec l’environnement (perception, actions, etc.). Les auteurs affirment que la cognition périphérique est un facteur déterminant pour la performance d’une tâche. La Figure 2.12
  • 47. -47- montre bien l’importance des systèmes périphériques en proposant un ensemble de processeurs moteurs et perceptuels. Le module perceptuel envoie les informations qu’il reçoit directement à la mémoire de travail de façon complètement asynchrone. La particularité de cette architecture est que plusieurs buts peuvent être représentés de façon non hiérarchique. De plus, plusieurs buts peuvent être actifs dans le même cycle (traitement parallèle) en autant qu’ils n’utilisent pas la même ressource périphérique. Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997] EPIC suppose ainsi que les contraintes et limitations de l’architecture sont dues à la structure des organes sensoriels et moteurs. Ce sont ces organes qui limitent l’apport et la transmission de l’information.
  • 48. -48- 2.3.6 3CAPS Enfin, le modèle 3CAPS [Just & Carpenter, 1992] avance que les limitations du système cognitif sont liées de la capacité de la mémoire de travail. 3CAPS définit trois types de mémoires, soit la mémoire de travail, la mémoire procédurale et la mémoire déclarative. Selon la théorie de la capacité, si le maximum d’éléments est atteint dans la mémoire de travail, les processus de production activent moins d’éléments que ce dont ils ont besoin. Cela a pour effet d’oublier des éléments prématurément. Le modèle 3CAPS interprète ce phénomène comme une source de différences individuelles. L’architecture de 3CAPS ne prend cependant pas en compte l’apprentissage. 2.4 Conclusion sur l’état de l’art sur la mémoire À ce stade-ci, il est important de discerner les grandes composantes d’un modèle de mémoire et d’identifier les principales fonctionnalités de ces mêmes composantes. C’est donc ce que nous avons fait dans ce chapitre en présentant l’historique, les théories et les modèles associés à la mémoire. Plusieurs théories, phénomènes et modèles n’ont pas été présentés dans cette courte revue bibliographique sur la mémoire. Les recherches dans ce domaine sont actuellement très actives et beaucoup d’incertitude persiste dans en psychologie cognitive. Bien que nous ayons omis plusieurs travaux, toutes les références bibliographiques présentées donneront un excellent point de départ pour les recherches plus précises dans ce domaine. Notre but n’est pas de rapporter toutes les recherches sur la mémoire des dernières décennies, mais simplement de cibler les principaux phénomènes et mécanismes qui seront utiles dans le développement d’un modèle de mémoire dans le cadre de notre projet multi-agent.
  • 49. -49- ____________________________________ Chapitre 3 Notre modèle de mémoire ____________________________________