Modèle cognitif de mémoire dans un environnement virtuel

JIMMY PERRON

Modélisation d’un modèle cognitif de mémoire dans un système
multi-agent temps réel

Mémoire
présenté
à la Faculté des études supérieures
de l’Université Laval
pour l’obtention
du grade de maître ès sciences (M.Sc.)

Département d’informatique
FACULTÉ DES SCIENCES ET GÉNIE
UNIVERSITÉ LAVAL

Août 2003

 Jimmy Perron, 2003

-2-

Résumé
Le présent travail s’inscrit dans un projet visant la simulation d’un grand nombre d’agents
dans un environnement urbain 3D virtuel. En fait, le système MAGS (Multi-Agent
GeoSimulation) est une plateforme multi-agent en temps réel pouvant s’appliquer à plusieurs
domaines : simulation de foule, simulation de consommateurs dans des centres commerciaux,
simulation d’évacuations, etc. Les fondements du simulateur sont issus des approches
cognitives, ce qui implique que les agents sont dotés de comportements évolués basés sur leurs
besoins et objectifs. Cela implique aussi que les agents doivent être munis d’un outil
supplémentaire proposant des mécanismes de perception et de mémorisation de
l’environnement.

Ce mémoire présente donc un modèle détaillé de perception et de mémorisation de
l’environnement virtuel 3D. Ses mécanismes sont cohérents avec les études réalisées dans le
domaine des sciences cognitives sur la mémoire. Notre modèle de Perception-Mémoire permet
d’individualiser les agents en dotant chaque agent d’une mémoire individuelle du monde
virtuel qu’il parcourt. Il est, de plus, en mesure d’effectuer la perception et la mémorisation de
plusieurs centaines d’agents en temps réel dans la plateforme MAGS.

-3-

Préface et Remerciements
Dès le début de cette recherche, nous étions un peu impressionnés par le grand défi qu’un
système semblable représentait. Finalement, deux ans après, une première version de MAGS
(Multi-Agent GeoSimulation) vit le jour. Cette première version était le fruit d’un grand
travail de la part de toute notre équipe. Le présent travail est une contribution à ce système
dont l’instigateur est M. Bernard Moulin. Son expertise, son talent de leader, de gestionnaire et
de coordonnateur de recherche ont fait que ce projet est maintenant une chose concrète.
Suivant cela, je désire sincèrement remercier M. Moulin pour son implication, sa confiance et
sa détermination à nous initier à la recherche. Il a été un guide extraordinaire dans tout le
déroulement du projet, en plus de nous inspirer dans des périodes souvent complexes.

Deuxièmement, je tiens à souligner l’implication du RDDC Val-Cartier dans le projet MAGS.
Ils ont permis la réalisation du projet en appuyant l’équipe tant du point de vue technique
(équipement) que du point de vue financier, en fournissant un soutien boursier aux étudiants
impliqués. Ils ont toujours été convaincus du bien-fondé et de l’apport que cette recherche
pouvait amener et pour cela, je les remercie.

De plus, je tiens à remercier tous mes proches qui m’ont, d’une façon ou d’une autre, supporté
dans cette aventure. Étant donné l’ampleur du projet, le temps consacré à ceux qui me sont
chers a été considérablement limité. Ils ont quand même su comprendre et m’ont soutenu dans
cette démarche en faisant tout ce qu’ils pouvaient pour m’aider. Pour cette raison, et bien
d’autres, je les remercie et je veux qu’ils sachent qu’ils ont eu un grand rôle à jouer dans
l’aboutissement de cette étape.

Jimmy Perron

-4-

Table des matières

1 Introduction Générale ___________________________________________________ 9
1.1 Contexte _________________________________________________________ 10
1.2 Objectifs _________________________________________________________ 13
1.3 Démarche et présentation du mémoire ________________________________ 14
2 Recherches antérieures sur la mémoire_____________________________________ 16
2.1 Historique des recherches sur la mémoire _____________________________ 16
2.2 Théories de la mémoire _____________________________________________ 30
2.2.1 Mémoire perceptuelle ___________________________________________ 30
2.2.2 Mémoire à court terme___________________________________________ 31
2.2.3 Mémoire de travail______________________________________________ 36
2.2.4 Mémoire à long terme ___________________________________________ 37
2.3 Les modèles de mémoire ____________________________________________ 39
2.3.1 Le modèle SAM________________________________________________ 40
2.3.2 MINERVA 2 __________________________________________________ 41
2.3.3 Modèle de mémoire de SOAR_____________________________________ 41
2.3.4 Modèle de mémoire de l’architecture ACT-R _________________________ 45
2.3.5 EPIC_________________________________________________________ 46
2.3.6 3CAPS _______________________________________________________ 48
2.4 Conclusion sur l’état de l’art sur la mémoire ___________________________ 48
3 Modèle de mémoire développé dans le contexte de MAGS ______________________ 50
3.1 Fonctionnalités nécessaires et contraintes du modèle ____________________ 51
3.1.1 Fonctionnalités_________________________________________________ 51
3.1.2 Contraintes ____________________________________________________ 53
3.2 Environnement de MAGS___________________________________________ 55
3.3 Mécanisme de perception ___________________________________________ 60
3.3.1 Algorithme de Perception de l’environnement ________________________ 62
3.3.2 Algorithme de parcours des cellules de Palmer________________________ 63
3.3.3 Calcul des lignes de vue ( troisième dimension ) ______________________ 64
3.3.4 Aspect temps réel, cohérence cognitive et résultats ____________________ 69
3.3.5 Conclusion sur la perception ______________________________________ 71
3.4 Mémoire perceptuelle ______________________________________________ 72
3.5 Filtre ____________________________________________________________ 73
3.6 Mémoire de travail_________________________________________________ 80
3.6.1 Fondements de la mémoire de travail dans MAGS _____________________ 81
3.6.2 Structure de la mémoire de travail__________________________________ 82
3.6.3 Capacité de la mémoire de travail __________________________________ 84
3.6.4 Répétition et Rétention __________________________________________ 86

-5-

3.6.5 Passage vers la mémoire à long terme _______________________________ 96
3.6.6 L’élément mémorisé ____________________________________________ 97
3.6.7 Conclusion sur la mémoire de travail _______________________________ 99
3.7 Mémoire à long terme ______________________________________________ 99
3.7.1 Structure_____________________________________________________ 100
3.7.2 Rétention ____________________________________________________ 100
3.8 Conclusion sur le modèle de mémoire de MAGS _______________________ 102
4 Intégration du modèle de mémoire dans MAGS _____________________________ 108
4.1 Mémoire perceptuelle _____________________________________________ 112
4.2 Mémoire de travail________________________________________________ 112
4.3 Mémoire à long terme _____________________________________________ 117
4.4 Contrôle et flux de données_________________________________________ 117
5 Résultats et conclusion _________________________________________________ 121
5.1 Performances des mécanismes du modèle de mémoire MAGS____________ 121
5.1.1 Perception ___________________________________________________ 123
5.1.2 Mécanisme de Filtre____________________________________________ 125
5.1.3 Mécanisme de Rétention ________________________________________ 126
5.2 Analyse générale du modèle de mémoire______________________________ 127
5.3 Discussion et conclusion sur le modèle de mémoire _____________________ 131
6 Bibliographie_________________________________________________________ 136

-6-

Table des figures
Figure 2.1 : Fonction de rétention de Ebbinghaus _________________________________ 17
Figure 2.2 : Procedure d'expérimentation de Pavlov _______________________________ 19
Figure 2.3 : Acquisition d'une réponse conditionnée _______________________________ 20
Figure 2.4 : Processus d'extinction dans le conditionnement classqiue _________________ 21
Figure 2.5 : Courbe d'apprentissage de Thorndike_________________________________ 22
Figure 2.6 : Résultat de l'expérience de Tolman ___________________________________ 25
Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin __________________________ 29
Figure 2.8 : Résultat du rapport de Sperling______________________________________ 31
Figure 2.9 : Représentation de la mémoire de travail de Baddeley ____________________ 36
Figure 2.10 : Taxonomie de la mémoire selon Squire (1993) _________________________ 37
Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]__________________________ 45
Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997] ___________________________ 47
Figure 3.1 : Mémorisation d’une relation ________________________________________ 51
Figure 3.2 : La carte des élévations ____________________________________________ 55
Figure 3.3 : Carte des élévations d'une partie de la ville de Québec ___________________ 56
Figure 3.4 : Plan (x,z) représenté par le segment A de la carte précédente ______________ 57
Figure 3.5 : LocationMap ____________________________________________________ 58
Figure 3.6 : Exemple d'accès aux agents ________________________________________ 59
Figure 3.7 : Perception dans une « height map » __________________________________ 60
Figure 3.8 : Carte de visibilité Franklin [1999] ___________________________________ 61
Figure 3.9 : Test de visibilité __________________________________________________ 63
Figure 3.10 : Algorithme de visibilité de Palmer __________________________________ 64
Figure 3.11 : Test de visiblité à l'aide d'une ligne de vue ____________________________ 65
Figure 3.12 : Triangles semblables _____________________________________________ 66
Figure 3.13 : coupe en ( x, z ) _________________________________________________ 67
Figure 3.14 : Algorithme de perception de MAGS _________________________________ 68
Figure 3.15 : Test de visibilité _________________________________________________ 69
Figure 3.16 : Mémoire perceptuelle d’un agent ___________________________________ 72
Figure 3.17 : Filtre _________________________________________________________ 74
Figure 3.18 : Identification d’objets par attributs__________________________________ 77
Figure 3.19 : Mécanismes de la mémoire de travail ________________________________ 82
Figure 3.20 : Organisation de la mémoire de travail dans MAGS _____________________ 84
Figure 3.21 : Mémoire de travail ______________________________________________ 86
Figure 3.22 : Force de la trace en mémoire d'un élément____________________________ 88
Figure 3.23 : Structure d’un élément____________________________________________ 89
Figure 3.24 : 15 répétitions en 15 unités de temps _________________________________ 90
Figure 3.25 : Évolution de la trace de Restaurant1 ________________________________ 91
Figure 3.26 : Évolution de la force de la trace de Restaurant1 dans la mémoire de travail _ 92
Figure 3.27 : Évolution de la force de la trace en mémoire après 6 répétitions___________ 93
Figure 3.29 : Fonction d'activation_____________________________________________ 94
Figure 3.30 : Fonction d'activation_____________________________________________ 95
Figure 3.31 : Structure d'un élément ____________________________________________ 98
Figure 3.32 : Mémoire à long terme ___________________________________________ 101
Figure 3.33 : Modèle de mémoire _____________________________________________ 103

-7-

Figure 3.34 : Valeurs modifiables dans le modèle de mémoire ______________________ 105
Figure 3.35 : Structure du modèle de mémoire ___________________________________ 106
Figure 4.1 : Composantes principales de MAGS _________________________________ 108
Figure 4.2 : Description d'un agent____________________________________________ 110
Figure 4.3 : Diagramme de classes du modèle de mémoire _________________________ 111
Figure 4.4 : Méthode de filtrage ______________________________________________ 113
Figure 4.5 : Algorithme de filtrage de la mémoire de travail ________________________ 114
Figure 4.6 : Algorithme pour l'ajout d'un élément dans la mémoire de travail __________ 115
Figure 4.7 : Algorithme de rétention de la mémoire de travail_______________________ 116
Figure 4.8 : Accès à un élément du "chunk" Faim ________________________________ 116
Figure 4.9 : Diagramme de séquence lors de l’appel de TMemoryState->Update() ______ 118
Figure 5.1 : Temps d'un cycle du système MAGS _________________________________ 122
Figure 5.2 : Résultat du mécanisme de perception ________________________________ 123
Figure 5.3 : Temps de calcul de la perception par rapport au rayon de perception ______ 124
Figure 5.4 : Visualisation de la zone de perception d’un agent ______________________ 124
Figure 5.5 : Résultats du modèle de mémoire (grille)______________________________ 127
Figure 5.6 : Résultats du modèle de mémoire (graphique) __________________________ 127
Figure 5.7 : Temps de calcul des composantes de MAGS___________________________ 129
Figure 5.8 : Visualisation d'une simulation______________________________________ 130
Figure 5.9 : Carte de mémoire d'un agent à un instant donné _______________________ 131

____________________________________

Chapitre 1

Introduction
____________________________________

-9-

1 Introduction Générale

Depuis plusieurs années, les recherches sur la réalité et la simulation virtuelle ont beaucoup
évolué. Certains phénomènes qui ne peuvent être reproduits en réalité entrent dans le domaine
d’application de la simulation virtuelle. Ces phénomènes, comme par exemple la panne d’un
moteur dans un avion, sont souvent impossibles ou trop risqués à reproduire. Les spécialistes
effectuent alors des simulations pour entraîner les pilotes à faire face à ces situations. Dans le
domaine précis de l’aéronautique, ce genre de simulateur existe et ils sont très utilisés.

Mais qu’arrive-t-il lorsque certains stratèges doivent prendre des décisions pour la sécurité ou
l’aménagement du site d’une manifestation ? Il est impossible de reproduire physiquement les
comportements d’une foule lors d’une manifestation. Il faut donc être en mesure de pouvoir
simuler, à l’aide d’un outil informatique, des phénomènes de foule.

L’idée d’un simulateur de foule dans un environnement urbain 3D est alors née. Le but de ce
simulateur est de permettre à ses utilisateurs d’orienter certaines décisions suivant les résultats
obtenus à partir de la simulation d’un phénomène de foule. La simulation doit avoir lieu dans
un environnement urbain virtuel en trois dimensions. Évidemment, le projet est très ambitieux
puisque les simulations en temps réel contenant des milliers de personnes virtuelles ne sont
pas choses courantes. De plus, le prototype du simulateur doit fonctionner sur un ordinateur de
type PC sous un environnement Windows. C’est suite à cela que le développement du
prototype du système MAGS commença. Le projet MAGS (Multi-Agent Geo-Simulation) a
pour objectif le développement d’une plateforme générale pour la création de simulations
multi-agent dans des espaces géographiques virtuels. La plateforme devra supporter des
milliers d’agents ayant des aptitudes cognitives spatiales et comportementales (perception,
mémoire, comportements, etc.). De plus, les agents devront interagir directement avec
l’environnement virtuel dans lequel ils prennent place. L’application courante de la plateforme
MAGS vise à simuler les phénomènes de foule dans un environnement urbain 3D.

-10-

1.1 Contexte

Il existe plusieurs techniques pour représenter des phénomènes de foule dans un
environnement [AJ, 1954], [Ashford, 1976], [Yuhaski, 1989], [Lovas, 1993]. Il y a
premièrement les systèmes à base de particules où chaque particule représente un agent.
L’interaction entre les particules se fait à l’aide des propriétés d’attraction, de répulsion et à
l’aide de la gestion des collisions qui sont prédéterminées pour chaque particule [Langton,
1997]. Ces systèmes physiques modélisent bien les phénomènes de foule où une foule dense
se trouve dans un environnement très restreint (évacuation d’un stade, modélisation du trafic
[RIC, 1996]). Il y a ensuite les systèmes de modélisation des fluides qui ont été utilisés pour la
première fois par Henderson [Henderson, 1974]. Dans ce cas précis, la foule est caractérisée
par certaines propriétés physiques (densité, vitesse, énergie, etc.) et elle est considérée comme
un tout se déplaçant dans un environnement souvent représenté sous forme de grille. Une autre
technique se sert des automates cellulaires pour modéliser les interactions entre plusieurs
agents (foule, trafic) [Helbing, 1999].

Traditionnellement, les chercheurs et les spécialistes du domaine de la simulation ont toujours
traité les phénomènes de foule comme étant modélisables par des systèmes physiques ou
mathématiques. Une étude au Wembley Stadium a montré que les modèles basés sur la
mécanique des fluides étaient faux. Les analyses révèlent que les « patterns » de la foule
n’étaient presque en aucun point semblables à un liquide. Suite à cette étude, un
mathématicien irlandais du nom de Keith Still a développé une série d’équations connues sous
le nom de « orchid fractal ». La théorie de Still se base sur l’aspect chaotique du
comportement d’une foule. Ses résultats ont été utilisés pour développer un système
commercial d’aide à la décision sur la planification des effets de foule [Still, 2003].

Ces systèmes, modélisés par des équations mathématiques, permettent de modéliser certains
phénomènes très spécialisés mais ils ne peuvent pas être étendus à d’autres applications plus
complexes. Ces dernières années, les chercheurs vont un peu plus loin en considérant des
variables psychologiques pour caractériser chaque individu dans une foule [Helbing, 1998]. Le
concept de self-organization effects est, maintenant, de plus en plus étudié. Suivant cela, un

-11-

modèle modélisant la dynamique individuelle des individus appelé social force model a été
proposé [Helbing & Molnar & Schweitzer, 1994], [Gipps, 1985]. Malgré le terme « social »
dans le nom du modèle, celui-ci est quand même mathématiquement représenté. Il ne prend
pas en considération les variables psychologiques individuellement. La force sociale est plutôt
une représentation des différentes influences qui agissent sur le comportement de l’individu.

Un autre laboratoire, « Virtual reality lab » dirigé par Daniel Thalmann, explore depuis
plusieurs années la vie artificielle dans un environnement virtuel. Thalmann identifie les
mécanismes à modéliser pour être en mesure d’implémenter ce qu’il appelle un humain virtuel
ou un acteur [Thalmann, 2000]. Thalmann identifie cinq composantes nécessaires qu’un
humain virtuel doit posséder. Voici les cinq composantes décrites par Thalmann.

• Perception : La perception est la conscience que l’on a de l’environnement qui nous
entoure. La façon dont un agent perçoit son monde se traduit en y intégrant les
mécanismes de la vision, de l’audition, du toucher, de l’ouïe et du goût. La perception
est responsable de l’interaction entre l’agent et l’environnement pour qu’il puisse se
déplacer, manipuler des objets, et ainsi pouvoir réagir à la rétroaction provenant de
l’environnement et des autres agents. Une approche basée sur la vision offre une
méthode universelle pour transmettre de l’information à partir de l’environnement vers
l’agent dans le contexte de la recherche de chemins, de l’évitement d’obstacles, de la
représentation interne des connaissances avec les mécanismes d’apprentissage et
d’oubli [Renault et al., 1990].

Dans le domaine de la simulation multi-agents, un agent est souvent défini comme une
entité évoluant dans un environnement qu’elle peut percevoir et dans lequel elle peut
agir [Franklin & Graesser, 1997]. La perception est donc essentielle à un humain
virtuel ou un agent pour que ses comportements soient en fonction de son
environnement immédiat.

• Émotions : Les émotions sont des états affectifs intenses caractérisés par une brusque
perturbation physique et mentale [Bérubé, 1991]. Les émotions peuvent donc être la

-12-

cause de certaines réactions de l’agent. Certains objets, agents ou actions perçus
peuvent engendrer des émotions chez l’agent. Ainsi, les émotions ressenties par un
agent sont causées par la perception de son environnement [Thalmann, 2000].

• Comportements : Le module comportemental est évidemment très important lors de la
modélisation des mécanismes d’un agent virtuel. C’est par ce mécanisme qu’est
représenté le processus de prise de décision qui pousse l’agent à effectuer une action.
Le comportement doit décider, à partir d’entrées (émotions, perceptions, souvenirs),
l’action résultante sur l’environnement ou sur soi-même.

Le comportement peut être vu d’une façon hiérarchique. Le modèle comportemental
décompose un comportement complexe en sous-comportements beaucoup plus simples
jusqu’à ce qu’un comportement élémentaire soit atteint [Pelletier, 2003].

• Actions : Lorsque le module comportemental a décidé quelle est l’action à exécuter, il
doit avoir la possibilité de le faire. De la même façon qu’un humain ne peut pas voler,
certaines actions doivent être modélisées et d’autres non pour respecter la cohérence de
l’univers à simuler.

Les actions permettent l’interaction avec l’environnement et les autres agents. Ainsi,
les agents sont en mesure de communiquer et de modifier leur entourage, ce qui garde
la dynamique de la simulation très active.

• Mémoire : La mémoire est la capacité de stocker et de récupérer de l’information
provenant de la perception de l’agent. Le comportement d’un agent variera en fonction
de son expérience passée. S’il a déjà utilisé un objet, il n’aura pas à réapprendre tout le
processus de son utilisation. De la même façon, s’il se souvient d’un endroit en
particulier, il n’aura pas à consulter une carte pour s’orienter. Ce sont des exemples
simples qui démontrent que les modèles où la mémorisation est absente sont des
modèles peu convaincants puisqu’il n’y a aucune adaption des agents.

-13-

Voici donc les mécanismes que Thalmann décrit comme étant essentiels pour une
modélisation cohérente d’un humain virtuel dans une simulation virtuelle.

1.2 Objectifs

Lorsque l’on examine attentivement les mécanismes de Thalmann décrits précédemment, l’un
d’eux semble être à la base de tous les autres. Il s’agit, bien sûr, de la perception. Privé de la
perception, un agent serait incapable d’interagir, de raisonner et d’agir sur son environnement,
ce qui est contraire à la définition de Franklin et Graesser [Franklin & Graesser, 1997]. Il
existe certaines techniques pour modéliser la perception dans un environnement virtuel, mais
ces techniques ne sont pas adaptées au contexte de notre projet. Il nous faut un mécanisme
permettant à des milliers d’acteurs de percevoir l’environnement dynamiquement et en temps
réel. C’est donc un grand pas de doter les humains virtuels de la perception mais ils doivent
également être en mesure de mémoriser ce qu’ils ont perçu. La mémoire est aussi un des
mécanismes que Thalmann décrit pour la modélisation d’un acteur virtuel. Cependant, à notre
connaissance, il n’existe, dans la littérature, aucun modèle qui rendre compte avec précision
des mécanismes de perception et de mémoire dans un contexte temps réel. Quelques
recherches en psychologie décrivent les grandes lignes et les caractéristiques d’un modèle de
mémoire, mais sans plus. De plus, ces recherches ne sont pas appliquées au domaine de la
simulation virtuelle et nous devons être en mesure d’implanter ces concepts afin de les
matérialiser.

Notre objectif dans ce mémoire est donc de définir et d’implanter un modèle complet de
perception et de mémoire dans le contexte d’une simulation multi-agent en temps réel. Nous
allons conceptualiser un modèle de mémoire, caractériser ses mécanismes, détailler et
implanter le modèle dans un système de simulation en temps réel. Ces travaux sont motivés
par le fait qu’aucun modèle de perception et de mémoire ne présente un niveau de détails
satisfaisant pour pouvoir être adapté et implanté dans un contexte de simulation multi-agent.
La finalité de ce mémoire devrait donc conduire à un modèle de mémoire efficace dont les
fonctionnalités reflètent celles de la mémoire humaine.

-14-

1.3 Démarche et présentation du mémoire

La première étape de ces recherches a été l’exploration d’ouvrages en sciences cognitives sur
les sujets de la perception, de la mémoire et de l’apprentissage. L’objectif était d’avoir une
idée claire sur le fonctionnement des mécanismes du cerveau humain. Évidemment, ces
recherches bibliographiques en psychologie nous ont amené aux limites de la connaissance
que les chercheurs ont des processus cognitifs. Nous avons quand même répertorié des
avancées intéressantes qui nous ont permis d’établir un modèle relativement cohérent par
rapport aux mécanismes humains compte tenu évidemment du contexte dans lequel il est
développé. Les résultats de ces recherches bibliographiques sont présentés dans le chapitre 2.

Par la suite, nous avons proposé un modèle complet de perception et de mémoire basé sur les
concepts présentés précédemment. Pour chacun des concepts proposés, nous avons défini et
implanté tous les mécanismes que le modèle comprenait. Pour ce faire nous avons, encore une
fois, effectué une revue scientifique pour découvrir que la documentation sur la perception et
la mémorisation dans un contexte d’une simulation virtuelle multi-agent en temps réel n’était
pas très abondante. Cependant, avec les sources trouvées, nous avons pu construire une base
solide pour finalement développer nos propres mécanismes de perception et de mémorisation
qui sont présentés dans le chapitre 3.

Une fois ces mécanismes définis, nous les avons introduits dans la simulation multi-agent
(chapitre 4) pour vérifier le bien fondé de notre modélisation et ainsi obtenir des résultats
concrets sur la faisabilité et la performance d’une telle approche (chapitre 5).

-15-

____________________________________

Chapitre 2

Recherches antérieures sur la mémoire
____________________________________

-16-

2 Recherches antérieures sur la mémoire

L’objectif d’une partie du projet MAGS est de développer un modèle de perception et de
mémorisation pour un système multi-agent. Nous cherchons donc à simuler, le plus
exactement possible, les mécanismes humains qui interviennent dans des situations de
mémorisation de l’environnement. Il est évident que, pour y arriver, il est essentiel de
comprendre les mécanismes cognitifs impliqués dans ce qui nous préoccupe : la perception et
la mémoire. Le but de ce chapitre est donc d’explorer le domaine de la psychologie cognitive
afin d’identifier les concepts généraux reliés à la mémoire humaines.

La première étape consiste à parcourir l’évolution historique des dernières décennies à la
recherche des avancées qui ont marqué l’histoire de la recherche sur la mémoire. Ensuite, nous
nous attarderons plus précisément sur les concepts et les mécanismes qui interviennent dans la
mémorisation. Finalement, nous étudierons les différents modèles de mémoire développés
jusqu’ici.

2.1 Historique des recherches sur la mémoire

La recherche scientifique en psychologie n’est apparue que dans la moitié du 19e siècle. C’est
donc une science très jeune qui a rapidement évolué surtout grâce aux nouveaux outils
technologiques développés durant les dernières décennies. Depuis le commencement,
l’apprentissage a été un important champ de recherche pour les scientifiques. L’une des
raisons qui ont poussé les recherches a été la théorie de l’évolution de Darwin parue en 1859
[Darwin, 1859]. Les chercheurs voulaient savoir comment se fait l’adaptation d’un membre
individuel d’une espèce donnée pendant sa vie. Il fallait donc comprendre la relation entre
l’adaptation générale d’une espèce et l’apprentissage individuel de l’individu. Cette question
est encore aujourd’hui très présente dans les différents sujets d’études.

Depuis ce temps, les théories de l’apprentissage ont occupé les chercheurs pendant plus d’un
siècle avant qu’ils ne s’intéressent plus sérieusement aux caractéristiques de la mémorisation
en tant que concept indépendant. L’apprentissage et la mémoire sont des concepts qui ont été
beaucoup entremêlés au commencement des recherches. Le terme mémorisation était presque

-17-

complètement absent. Il n’était pas rare d’utilisé le terme de l’apprentissage pour parler de la
mémorisation d’un élément. L’une des raisons était que la mémorisation d’un élément,
indiquait que nous avions appris cet élément. En fait, nous savons aujourd’hui que mémoire et
apprentissage sont des mécanismes très différents. Donc il ne faut pas être surpris si le terme
apprentissage revient souvent dans les études sur la mémorisation du début du siècle. Nous
allons ici nous intéresser à l’histoire et à l’évolution du concept de mémorisation afin de
mieux comprendre l’orientation des recherches actuelles.

Hermann Ebbinghaus (1850-1909)
Ebbinghaus a été le premier à effectuer une étude rigoureuse de la mémoire humaine, qu’il
publie en 1885 : Über das Gedächtnis (« Concerning memory »). Ebbinghaus se prend lui-
même comme cobaye dans ses expériences. Dans l’une de ses expériences, il devait apprendre
une liste de 13 syllabes aléatoires pour ensuite les répéter dans le même ordre et sans erreurs.
Il mesurait ensuite le temps nécessaire pour réapprendre la liste. Ebbinghaus était intéressé par
la facilité de l’apprentissage lorsque les concepts ont déjà été appris (le délai entre les deux
apprentissages était pris en considération). Dans l’exemple de la liste, il a gagné 64.3% de
temps entre les deux apprentissages (1156 sec (1ère fois) – 467 sec (2ième fois) / 1156 = 64.3%).
Avec ces résultats, il a obtenu ce qu’il appelle la courbe de rétention (Figure 2.1).

Fonction de rétention

60
55
Temps gagné %

50
45
40
35
30
25
20
0 200 400 600 800
Heures de délai entre les apprentissages

Figure 2.1 : Fonction de rétention de Ebbinghaus

-18-

L’apport d’Ebbinghaus est surtout au niveau de la méthodologie expérimentale pour l’étude
des phénomènes de la mémoire. Il a proposé la courbe de rétention et la courbe
d’apprentissage qui sont des outils encore très utilisés de nos jours.

Ivan Petrovich Pavlov (1849-1936)
À l’origine, Pavlov travaillait sur la physiologie de la digestion, ce qui lui valut le prix nobel
de médecine en 1904. Une partie de ses recherches consistait à mesurer le taux de salivation
des chiens lorsqu’il introduisait de la nourriture dans leurs mâchoires. Il a, par la suite,
découvert qu’après un certain nombre d’essais, les mesures exactes n’étaient plus possibles
parce que les chiens salivaient dès que Pavlov entrait dans la pièce. C’est à ce moment qu’il
commenca l’étude de ce phénomène connu maintenant sous le nom de conditionnement
classique [Pavlov, 1927]. La technique de base commence avec un stimulus non-conditionné
(« unconditionned stimulus » ou US) qui invoque une réponse non-conditionnée
(« unconditionned response » ou UR). Par exemple, la nourriture est un US et la salivation est
un UR. Ensuite, le US est combiné avec un stimulus conditionné (CS) comme une cloche.
Après un certain nombre d’essais, le CS est capable d’invoquer lui-même une réponse chez le
cobaye. Lorsqu’une réponse se produit suite au CS, on appelle cette réaction une réponse
conditionnée (CR). La Figure 2.2 illustre bien le conditionnement classique de Pavlov.

-19-

Temps
(a) Combinaison initiale

Présentation de la séquence : CS US
(cloche) (Nourriture)

Réponse : UR
(Salivation)

(b) Réponse conditionnée

Présentation de la séquence : CS US
(cloche) (Nourriture)

Réponse : CR UR
(Salivation) (Salivation)
(c) Extinction

Présentation de la séquence : CS
(cloche)

Réponse : CR
(Salivation)

Figure 2.2 : Procedure d'expérimentation de Pavlov

Nous ne discuterons pas davantage du conditionnement dans ce document. Cependant
quelques phénomènes de bases établis par Pavlov (1927) ont quand même leur importance :

1- Acquisition : L’amplitude de la réponse conditionnée peut être exprimée comme une
fonction du nombre d’essais de la combinaison du US et du CS. La Figure 2.3 montre
que le CS augmente avec le nombre de répétitions de l’expérience.

-20-

Acquisition

16

14

12
Salivation CS

10

8 Salivation CS

6

4

2

0
0 2 4 6 8 10 12 14

Nombre de répétitions de l'expérience

Figure 2.3 : Acquisition d'une réponse conditionnée

2- Extinction : Qu’arrive-t-il lorsque le stimulus non conditionné (US) n’est plus combiné
avec le stimulus conditionné (CS) ? La réponse conditionnée va diminuer si on
augmente le nombre d’essais pour laquelle aucun US n’est présenté. Ce processus est
connu sous le nom d’extinction. La fonction d’extinction du conditionnement est
similaire à la fonction de rétention de la mémoire (Figure 2.4). Il y a cependant une
différence entre les deux méthodes puisque la fonction de rétention est obtenue en
faisant intervenir des délais d’attentes sans présenter de stimulus.

-21-

Extinction

14

12

Salivation CS 10

8
Salivation CS

6

4

2

0
0 2 4 6 8 10 12


Figure 2.4 : Processus d'extinction dans le conditionnement classqiue

3- Reprise spontanée : Quelquefois après une série d’extinctions, le CS est présenté de
nouveau sans le US. L’amplitude de la réponse montre souvent des signes de reprise.
4- Ordonnancement temporel : Pavlov a remarqué que le conditionnement fonctionne
beaucoup mieux lorsque le CS (cloche) est présenté avant le US (nourriture).

Pavlov a donc catégorisé le conditionnement classique comme étant réflexif et automatique.
Les recherches actuelles tendent cependant à décrire le phénomène avec une vue beaucoup
plus cognitive. Encore aujourd’hui le conditionnement est souvent pointé comme étant un
processus simple et à la base de l’apprentissage.

Edward L. Thorndike (1874-1949)
Thorndike étudiait une situation d’apprentissage quelque peu différente. Il enfermait un chat
dans une boite et le chat devait apprendre comment sortir de la boite pour accéder à la
nourriture qui était à l’extérieur. La boite était munie d’un petit levier qu’il fallait actionner
pour ouvrir la porte et ainsi se libérer. Thorndike s’intéressait à la rapidité d’apprentissage du
chat pour sortir suite à de nombreux essais dans la boite. Ses observations ont conduit au fait
qu’au début, le chat se comportait au hasard bougeant d’un coin à l’autre de la boite sans
savoir quoi faire jusqu’à ce que, par chance, il actionne le levier pour sortir. Plus le nombre
d’essais augmentait, plus la durée du comportement hasardeux du chat diminuait, jusqu’à ce

-22-

qu’il soit capable de sortir de la boite très rapidement. Ce type d’apprentissage à été qualifié
par Thorndike comme étant un apprentissage par essais et erreurs (« trial-and-error learning »)
illustré par la Figure 2.5.

Courbe d'apprentissage

70

60
Temps pour sortir (sec)

50

40
Temps

30

20

10

0
0 5 10 15 20 25


Figure 2.5 : Courbe d'apprentissage de Thorndike

Le processus d’apprentissage étudié par Thorndike s’appelle le conditionnement instrumental.
Comme dans Pavlov, une réponse est apprise suite à un stimulus. Ce qui diffère c’est que dans
la boite de Thorndike, le stimulus est la boite et la réponse est l’action permettant d’ouvrir la
boite. Il serait intuitif de penser que le stimulus est la nourriture à l’extérieur mais Thorndike
explique que celle-ci joue un rôle de renforcement plutôt que de stimulus. Ainsi, Thorndike
pense que « un lien stimulus-réponse sera formé à chaque fois qu’un renforcement suit la
réponse en présence du stimulus » [Thorndike, 1898].

Clark L. Hull (1884-1952)
De 1930 à 1970, la psychologie américaine a été dominée par une série de grandes théories de
l’apprentissage. Parmi ces théories, la plus influente fût sûrement celle de Hull appelée théorie
du comportement. L’idée de base de Hull était de développer une théorie systématique
permettant d’expliquer tous les comportements. La théorie finale de Hull [Hull, 1952]
comportait plusieurs équations qui se résument en celle-ci :

-23-

E = (H x D x K) - I

Le but de cette équation (la réponse « E ») était de prédire le potentiel de réaction. Ce potentiel
est déterminé par la probabilité, la vitesse et la force avec lesquels un comportement répondra
à un stimulus. Ainsi, les réponses potentielles pour un rat enfermé dans un labyrinthe sont de
tourner à gauche, de tourner à droite ou de s’arrêter. La réponse avec le potentiel de réaction le
plus fort sera la réponse adoptée par le rat. Selon la théorie de Hull, le potentiel de réaction
serait une fonction des facteurs H, D, K et I.

H - Force de l’habitude (Habit Strength). H représente la force de l’association construite
entre le stimulus et la réponse des essais précédents.

D - Energie (Drive). Selon Hull, les comportements ne sont pas seulement le résultat d’une
habitude comme le suggère Thorndike. Hull propose que l’état d’énergie d’un organisme soit
un agent énergisant pour l’habitude. Si l’énergie est à zéro, toute la force du monde lié à
l’habitude ne produira aucune réponse.

K - Motivation (Incentive Motivation). L’habitude et l’énergie ne sont pas suffisantes pour
expliquer les comportements. Un rat entraîné dans un labyrinthe pour chercher de la nourriture
va s’arrêter s’il sait que la nourriture a été enlevée. Si la quantité de nourriture diminue, les
performances du rat déclinent. La motivation est donc une mesure de la quantité et du délai de
la récompense.

I – Inhibition. L’inhibition reflète la fatigue et l’effet d’extinction des essais pour lesquels la
récompense n’est plus présentée.

Ce que Hull met en évidence dans sa théorie, c’est la relation existant entre l’apprentissage et
la motivation. L’apprentissage ne suffit pas à créer des comportements; il doit aussi y avoir de
la motivation.

-24-

Lorsque l’on fait une rétrospective de la théorie de Hull, on s’aperçoit que les efforts ont été
incomplets et imparfaits. Cela devenait de plus en plus apparent avec le développement de
logiciels informatiques capables de prédire de tels comportements basés sur ces théories. Il
n’en demeure pas moins que les recherches de Hull demeurent toujours une référence dans les
théories récentes de l’apprentissage et de la mémoire.

Edward C. Tolman (1886-1959)
Les théories de l’apprentissage comme celles de Hull ou de Thorndike ont fait l’objet de
plusieurs critiques dans la communauté scientifique. La critique la plus influente fût celle
d’Edward Tolman.

La première démonstration implique l’apprentissage latent, précédemment mentionné par
Thorndike avec « law of effect ». L’expérience de base de Tolman et Honzik consiste en un
labyrinthe ayant 14 points où le rat devait effectuer un choix. Trois groupes de rats ont été
utilisés pendant 17 jours parcourant 1 fois par jour le labyrinthe. Le premier groupe de rat
avait toujours de la nourriture à la fin du parcours tandis que le deuxième groupe n’avait
aucune récompense. Le troisième groupe, quant à lui, s’est vu présenter de la nourriture
seulement après le 11ième jour de l’expérience. La Figure 2.6 présente la performance des trois
groupes tout au long de l’expérience.

-25-

Expérience de Tolman

12
10 Aucune
8 récompense
Erreurs

Toujours une
6
récompense
4
Récompense après
2 11 jours
0
0 5 10 15 20
Jours

Figure 2.6 : Résultat de l'expérience de Tolman

L’expérience indique le nombre de mauvais choix effectués par les rats tout au long du
parcours pour atteindre la sortie du labyrinthe. Le groupe ayant eu de la nourriture le 11ième
jour a dramatiquement augmenté ses performances le 12ième jour jusqu’à surpasser le groupe
qui a toujours été renforcé. Selon Tolman, les rats non renforcés (pas de nourriture)
apprennent quand même tout le labyrinthe. Cependant, leur apprentissage est en latence;
lorsqu’un but fut introduit, ils ont transformé leur apprentissage en performance. Ainsi, pour
Tolman, le renforcement n’est pas nécessaire à l’apprentissage mais il est nécessaire pour la
performance.

Newell & Simon (1961)
Lorsque le behaviorisme commença à éprouver des difficultés expérimentales dues à la
complexité de l’être humain, une nouvelle méthode pour la construction de théorie vit le jour.
Cette méthode, basée sur la simulation par ordinateur, a beaucoup attiré l’attention des
chercheurs en psychologie. L’approche a été développée par Allen Newell et Herbert Simon,
deux collaborateurs à l’université Carnegie Mellon qui oeuvraient dans le domaine de
l’intelligence artificielle (IA).

-26-

Newell et Simon montrent que la simulation par ordinateur peut utiliser la puissance de cette
technologie pour effectuer des prédictions de théories scientifiques complexes. La technique
de simulation a bouleversé la nature théorique de la psychologie.

Newell et Simon font plus que de la simulation: influencés par le développement de l’IA, ils
mettent en relation la cognition humaine et l’ordinateur. C’est à partir de ce moment
qu’émerge la métaphore de l’ordinateur qui a vraiment été difficilement acceptée par les
psychologues. Pour eux, le cerveau humain est très différent d’un ordinateur et cette théorie
basée sur l’analogie de la cognition et d’un ordinateur semble être une erreur [Rumelhart &
McClelland, 1986]. Par la suite, Newell et Simon développèrent plusieurs simulations pour
des problèmes d’apprentissage et de cognition. Cependant, ce n’est pas ce qui a forgé leur
place dans l’histoire: leur grande contribution s’est faite au niveau de la résolution de
problèmes.

La plus grande difficulté des théories précédentes était de déterminer la relation entre la
connaissance (ce que l’organisme apprend par expérience) et les comportements. Quelques
théories comme celles de Thorndike et Hull combinent ces deux concepts et ne font aucune
différence entre la connaissance et les comportements. Newell et Simon montrent comment la
connaissance peut être séparée de la partie comportementale. Suivant cette voie, ils montrent
que la théorie du comportement appliquée rigoureusement pourrait permettre des constructions
mentales. Cette démonstration met en pièces le doute contre le mentalisme que Watson avait
énoncé dans les années 50. Suite à cela, Newell et Simon établissent les bases d’une révolution
cognitive transformant ainsi tous les champs de la psychologie y compris l’apprentissage.

Ce qu’il faut retenir du travail de Newell et Simon, c’est ce qu’ils appelaient le GPS (General
Problem Solver) [Newell & Simon, 1972]. Le GPS est une simulation par ordinateur utilisant
le déploiement de la connaissance en résolution de problèmes de la façon suivante.

1- Identifier la différence majeure entre la situation courante et le but à atteindre; il faut se
concentrer sur le but.
2- Choisir une action susceptible d’éliminer cette différence (opérateur)

-27-

3- Si l’opérateur est applicable, l’appliquer. Sinon, définir un sous-but qui rendra
l’opérateur applicable et reprendre à l’étape 1.

Newell et Simon (1972) donnent cet exemple tiré de la vie de tous les jours pour expliquer
leur analyse.

1- But : Je veux amener mon fils à l’école. Quelle est la différence entre ce que j’ai et ce
que je veux? C’est la distance.
2- Opérateur : Qu’est-ce qui change la distance? Mon automobile.
3- Applicable ? Mon automobile ne fonctionne pas!
Nouveau but : Que faut-il pour qu’elle fonctionne? une nouvelle batterie.
1- But : Me procurer une nouvelle batterie....
2- ...

L’exemple complet se trouve dans leur ouvrage de 1972 mais le concept important de la
théorie est celui de sous-buts. À l’aide des sous-buts, il est possible d’organiser des
comportements cohérents en réponse à des situations très complexes. Ceci représente une
avancée majeure par rapport au concept de réponses de Skinner.

Newell et Simon montrent donc que la simulation par ordinateur peut être utilisée pour
modéliser des processus cognitifs complexes. De plus, ils montrent qu’à l’aide de leur
approche GPS, il est possible de convertir la connaissance en comportements.

Modèle de mémoire de Atkinson & Shiffrin, 1968
C’est en 1968 que Richard Atkinson et Richard Shiffrin publiaient une théorie sur la mémoire
humaine. Cette théorie amena une vision nouvelle sur la nature de la mémoire humaine qui,
jusqu’ici, avait été un peu négligée au profit des théories de l’apprentissage. Leurs travaux
marquaient l’arrivée de l’ère moderne, qui influença tous les développements futurs dans
l’étude de l’apprentissage animal et humain.

-28-

Ils amenèrent l’idée que la mémoire était constituée de deux unités de stockage : la mémoire à
court terme et la mémoire à long terme. La mémoire à court terme est considérée comme une
mémoire temporaire ne pouvant contenir qu’une petite quantité d’information. L’exemple
classique de ce type de mémoire est lorsque l’on veut se rappeler d’un numéro de téléphone:
un numéro de sept chiffres se retient bien, mais une difficulté s’ajoute lorsque l’indicatif
régional de trois chiffres est ajouté. C’est donc une mémoire temporaire et fragile car, si la
personne subit une légère distraction, elle oubliera rapidement le numéro. La façon de retenir
l’information dans la mémoire à court terme est de se la répéter encore et encore. Ce processus
de répétition de l’information est appelé « rehearsal ». La mémoire à long terme, à l’opposé,
est reconnue pour être un endroit où la connaissance repose de façon permanente; de plus, elle
ne présente pas de limitation apparente de capacité.

L’idée de base de la distinction de ces deux types de mémoire existe depuis un certain nombre
d’années. Broadbent (1957) a été l’un des premiers à les décrire. Atkinson et Shiffrin
rassemblèrent ces idées en une théorie précise, exprimée sous forme d’un modèle
mathématique et d’un modèle de simulation informatique. La Figure 2.7 illustre la base de leur
théorie. L’information arrive à la mémoire à court terme par le biais du processus de
perception. Ensuite pour que l’information soit transférée dans la mémoire à long terme, il faut
répéter cette information. À chaque répétition il y a une chance que l’information se déplace
vers la mémoire à long terme. Ainsi, l’augmentation du nombre de répétitions d’une
information augmente la probabilité de rétention de celle-ci dans la mémoire à long terme.
Étant donné l’espace limité dans la mémoire à court terme, la répétition d’une nouvelle
information entraîne la perte d’une autre information.

-29-

Répétition

Mémoire à Mémoire à
Information Tranfert
court terme long terme

Déplacé

Figure 2.7 : Théorie de la mémoire de Atkinson & Shiffrin

Suite à la théorie innovatrice de Atkinson et Shiffrin faisant la distinction entre la mémoire à
court terme et la mémoire à long terme, de grandes questions soulevèrent la communauté
scientifique. La structure, l’organisation et les conditions de récupération de l’information sont
des avenues importantes qui n’ont pas été mentionnées.

Le fait que maintenant les psychologues proposent de nouvelles théories suite aux échecs des
théories précédentes représente un avancement considérable. La section 2.1 a montré que la
psychologie s’est déplacée au-delà des arguments verbaux pour se préciser et ainsi produire
des modèles qui peuvent être testés donc maintenues ou rejetés. Nous avons pu comprendre
les enjeux des recherches en psychologie en nous positionnant correctement sur les concepts
importants de la mémoire humaine.

-30-

2.2 Théories de la mémoire

L’histoire des recherches sur la mémoire est relativement jeune et évidemment très complexe.
Les dernières décennies ont beaucoup développé les méthodes expérimentales (voir section
précédente) et, suivant cela, les théories cognitives ont commencé à émerger. Il est évident que
les « preuves » de ces théories sont empiriques, mais celles-ci constituent néanmoins une
avancée dans le domaine de la recherche en psychologie. Voici donc les principales théories
concernant successivement la mémoire perceptuelle, la mémoire à court terme, la mémoire de
travail et la mémoire à long terme. Nous allons, pour chacun de ces types de mémoires,
détailler les phénomènes et les mécanismes qui leur sont rattachés dans le but de comprendre
leur fonctionnement.

2.2.1 Mémoire perceptuelle

La première question à se poser est la suivante : comment l’information présente dans
l’environnement s’enregistre-t-elle dans une mémoire permanente? Le système perceptuel,
comme celui de la vision ou de l’audition, transforme les signaux arrivant aux capteurs (œil,
oreille, etc.) en représentation perceptuelle. Cette représentation doit être stockée quelque part
assez longtemps pour pouvoir être analysée et ainsi créer la représentation correspondante.
Beaucoup de recherches se sont orientées dans le but d’étudier les propriétés de ces endroits
temporaires qui stockent l’information de la vision ou de l’audition.

L’une des premières expériences concluantes sur le sujet fût celle de Sperling [Sperling, 1960]
qui traça une courbe du nombre d’items mémorisés dans la mémoire visuelle selon le temps
d’exposition de l’information (Figure 2.8). La conclusion fût qu’après avoir enlevé le stimulus
visuel, la mémoire visuelle du sujet contenait toute l’information mais celle-ci s’effaçait très
rapidement. En 1967, Neisser [Neisser, 1967] supposa que la mémoire visuelle reflétait
l’activation neuronale responsable du système visuel. Sakitt [Sakitt, 1976], quant à elle,
énonça l’idée que la mémoire était située dans les photorécepteurs de la rétine. Elle montra
que les propriétés de la mémoire visuelle étaient très semblables aux propriétés sensitives
présentes dans l’utilisation d’une vision nocturne. Selon cette analyse, la mémoire visuelle se

-31-

comparerait à l’image résiduelle d’un éclair dans la nuit. En 1983, Haber [Haber, 1983] remit
en question l’idée puisque l’humain ne perçoit pas le monde seulement par des flashs.
Coltheart (1983) lui répondit que la majorité de l’information acquise est obtenue dans les
premières 50 ms de fixation (les yeux étant presque toujours en mouvement pour scruter les
objets).

Sperling
Mean number of letters

3,5
3
2,5
recalled

2
1,5
1
0,5
0
0 0,2 0,4 0,6 0,8 1
Delay of Tone, (Sec)

Figure 2.8 : Résultat du rapport de Sperling

Plusieurs chercheurs ont donc élaboré des théories sur la structure et les propriétés de cette
mémoire visuelle. Cependant, il n’y a aucun concensus établi sur la nature de celle-ci; la seule
chose sur laquelle ils s’entendent tous, c’est qu’elle existe !

2.2.2 Mémoire à court terme

La mémoire à court terme a été très critiquée au cours du temps. Personne ne semblait en
accord avec les différentes théories proposées. Il faut rappeler que la mémoire à court terme a
été introduite uniquement pour expliquer les différences notables que la théorie de la mémoire
à long terme n’expliquait pas.

Les données empiriques recueillies au cours des années ont permis d’identifier certains
phénomènes reliés à la mémoire en générale. Il était très difficile de comprendre et d’expliquer
toutes ces données si l’introduction d’une mémoire à court terme n’était pas faite entre la

-32-

mémoire perceptuelle et la mémoire à long terme. Cette section considère donc les
phénomènes et les mécanismes de la mémoire à court terme en tentant de comprendre les
théories et les différents problèmes associés.

2.2.2.1 Effets de la répétition

Les premières études montrèrent que plus une information était répétée, plus elle était
mémorisée [Rundus, 1971]. Ce résultat venait confirmer le modèle de Atkinson & Shiffrin
proposé en 1968. Cependant, l’étude de Glenberg, Smith et Green en 1977 [Glenberg, 1977]
ne pût corroborer cette théorie suite à l’une de leur expérience. Les sujets devaient mémoriser
un nombre de quatre chiffres pendant 2 secondes pour ensuite répéter un mot pendant 2, 6 ou
18 secondes et finalement redire le nombre précédemment appris. Le nombre d’essais de
l’expérience fût de 64. Après l’expérience, les chercheurs demandèrent aux sujets de se
rappeler du mot qui avait été répété. Les sujets pensaient que l’expérience portait sur la
mémorisation du nombre et non du mot. Les résultats furent donc désastreux : 11, 7 et 12 % de
réussite pour 2, 6 et 18 secondes de répétition respectivement. Cette étude montre qu’il n’y
aurait pas de relations entre le nombre de répétitions et la mémorisation. Une autre expérience
de Craik et Watkins (1973) montrait qu’aucune relation ne pouvait être faite entre le nombre
de répétitions et la probabilité de se rappeler l’information.

Si le fait de répéter l’information n’influence pas la mémoire, alors quel est le phénomène qui
détermine notre mémorisation ? Rundus [Rundus, 1971] trouva une relation entre le nombre
de répétitions et la mémoire mais, à la lumière des expériences précédentes, nous savons qu’il
y a une variante. En 1972, Craik et Lockart [Craik & Lockart, 1972] proposaient une théorie
voulant que pour mémoriser correctement, l’information doit être répétée à un niveau de
profondeur acceptable. En d’autres termes, la répétition passive n’améliore pas la
mémorisation. La théorie a été passablement critiquée en raison du concept de profondeur qui
était trop vague. Il n’en reste pas moins que selon les expériences, la répétition à elle seule
n’augmente pas la mémorisation. Cela vient confirmer le modèle de Atkinson et Shiffrin selon
lequel l’information se transfère dans la mémoire à long terme par la répétition verbale.

-33-

2.2.2.2 Regroupement (Chunking) et capacité

L’organisation de la mémoire à court terme est effectuée d’une façon bien précise, sous forme
de regroupements ou « chunks ». Essayez de lire la série « A T W B I Y T G Q W E», pour
ensuite la répéter. Si vous n’avez aucune erreur, c’est que vous disposez d’une mémoire
immédiate très efficace sinon, vous risquez de faire 2 ou 3 erreurs. Par contre, si vous faites la
même expérience avec la série « N O N E F F I C A C E », vous allez remarquer qu’elle se
retient beaucoup plus facilement. En fait, ces deux séries de 11 lettres ne se classent pas de la
même façon dans la mémoire à court terme. La première série comprend 11 lettres n’ayant
aucun lien entre elles, il est donc difficile d’effectuer des regroupements. La seconde série, par
contre, peut être regroupée en 2 « chunks », soit « NON » et « EFFICACE » ce qui facilite la
mémorisation. La mémoire à court terme peut retenir environ 7 chunks ± 2 [Miller, 1956]. Il
est possible d’emmagasiner beaucoup d’information dans la mémoire perceptuelle et beaucoup
d’information dans la mémoire à long terme. Cependant, le transfert de toute cette information
d’une mémoire à l’autre est difficile puisqu’il faut la traiter dans la mémoire à court terme qui
a une capacité très limitée. Il y a donc une énorme limitation sur la quantité d’éléments que
nous pouvons mémoriser [Miller, 1956 ; p.95].

Évidemment, la solution à la limite de capacité de la mémoire à court terme se trouve dans la
caractéristique qui est de regrouper l’information: cela nous permet de mémoriser beaucoup
plus d’éléments. Cependant, la capacité de regrouper des éléments dépend directement des
stimuli en relation avec l’observateur. Certains stimuli sont plus facilement groupables chez
certaines personnes parce qu’elles ont une expérience différente en rapport avec le matériel
présenté. Par exemple, un anglophone aura plus de difficulté qu’un francophone pour retenir
une série de mots en français.

La mémoire à court terme a donc une capacité de stockage ou de traitement limitée à environ
sept « chunks ». La façon de regrouper l’information en « chunks » est aussi l’une des
principales caractéristiques de la mémoire à court terme et cela permet d’augmenter la quantité
d’information retenue.

-34-

2.2.2.3 Rétention et oubli

La mémoire semble s’effacer au fil du temps. Plusieurs expériences déterminent que la perte
de la mémoire est une fonction du temps. Nous avons précédemment présenté les travaux
d’Ebbinghaus portant sur la fonction de rétention. La fonction de rétention démontrait
comment la performance de la mémoire diminuait avec le temps. Toutes les fonctions de
rétention ont sensiblement le même comportement: initialement, l’oubli est rapide mais la
courbe s’estompe aussi rapidement. Mais est-ce que la perte d’information n’est fonction que
du temps ?

Il existe deux grandes théories pour expliquer l’oubli dans la mémoire à court terme. La
première théorie suppose que la trace de l’information qui est en mémoire décroit avec le
temps (decay hypothesis). La seconde hypothèse suppose que l’oubli survient suite à l’ajout de
nouvelles informations stockées en mémoire. Cela causerait donc de l’interférence sur les
informations déjà présentes dans la mémoire à court terme (interference hypothesis).

Si l’hypothèse selon laquelle l’information s’efface progressivement en mémoire est juste, la
variable déterminante pour savoir si oui ou non l’information est récupérable est le temps
écoulé. Plus le délai est long, plus l’oubli est fort et vice versa. Par contre, si l’oubli est le
résultat de l’interférence entre les informations, le facteur déterminant devrait être la nature de
l’information qui survient au moment présent. Plus il y a de liens entre les informations
présentes dans la mémoire à court terme, plus l’interférence augmente ce qui résulte en une
augmentation de l’oubli.

Évidemment, les recherches [Baddeley, 1998, 1996] montrent qu’il ne s’agit pas de l’une ou
l’autre des hypothèses mais bien d’une combinaison des deux. Beaucoup d’études ont été
effectuées sur les circonstances du phénomène de l’oubli dans la mémoire à court terme
[Brown & Hulme, 1995 ; Kieras, Meyer, Mueller & Seymour, 1998]. C’est un domaine très
complexe ou aucune conclusion claire n’a été proposée. C’est pourquoi nous mentionnons le
phénomène sans trop nous y attarder. Des modèles récents de la mémoire de travail et de la
mémoire à court terme proposent des fonctions de rétention liées au temps d’extinction et à

-35-

l’interférence [Dosher, 1999 ; Dosher & Ma, 1998 ; Lewandowsky & Murdock, 1989; Rubin
& Wenzel, 1996; Wickelgren, 1970]. Cependant, ces modèles sont très difficiles à utiliser dans
le contexte de notre projet car les fonctions ont besoin d’informations très précises sur
l’acquisition et l’encodage des éléments dans la mémoire, ce que nous n’avons pas.

2.2.2.4 Différence d’encodage

Un argument permettant de séparer la mémoire à court et à long terme fût la différence
d’encodage de l’information dans ces deux dernières. Il semblait que l’encodage dans la
mémoire à court terme était de nature sensorielle. Une expérience classique de Kintsch et
Buschke (1969) montra la distinction entre ces deux mémoires. L’expérience consistait à
présenter visuellement 16 mots aux sujets au rythme d’un mot toutes les deux secondes.
Ensuite ils demandèrent aux sujets de répéter tous les mots dans la liste qui suivaient un mot
en particulier. L’hypothèse était que les sujets répétaient les derniers mots de la liste dans leur
mémoire à court terme. Suivant cela, les sujets devraient avoir de bons résultats lorsque les
derniers mots de la liste sont demandés puisqu’ils sont répétés. Ce résultat fût observé tel
qu’attendu et ce phénomène fût appelé recency effect. La mémorisation du reste de la liste
dépend de la mémoire à long terme.

Kintsch et Bushke raisonnèrent sur le fait que la mémoire à court terme était de type verbal. Il
y aurait de l’interférence acoustique si les mots de la liste avaient une sonorité semblable
(exemple : sea et see). Si on demandait au sujet de répéter les mots suivant see, il pourrait
répéter les mots suivant sea. Les problèmes devraient être plus nombreux vers la fin de la liste
étant donné l’encodage acoustique de la mémoire à court terme. Quant aux mots du début de
la liste, ils devraient se produire une confusion sémantique si des synonymes sont présents
(sea et ocean). La raison est que les premiers mots de la liste sont dans la mémoire à long
terme, qui se veut une mémoire sémantique.

Les hypothèses de Kintsch et Bushke furent vérifiées et ces chercheurs conclurent qu’il y avait
une différence d’encodage entre la mémoire à court terme et la mémoire à long terme.

-36-

Évidemment, la théorie fût critiquée mais l’idée de base de la différence d’encodage entre les
deux mémoires fût respectée.

2.2.3 Mémoire de travail

Il existe une multitude de mémoires permettant de maintenir provisoirement l’information
disponible. Il y a le système sensoriel qui retient brièvement l’information qu’il reçoit pour
que l’organisme ait une chance de l’encoder dans une mémoire permanente. L’information
peut aussi être maintenue dans des tampons sensoriels par la répétition (slave rehearsal
processes) [Baddeley, 1986]. Toutes ces mémoires transitoires sont utilisées pour guider le
traitement de l’information. Pour être juste dans nos propos, il faut donc parler de ces types de
mémoire comme étant la mémoire de travail. La mémoire de travail amenée par Baddeley
diffère de la mémoire à court terme sur les points suivants. Premièrement, la mémoire de
travail se compose de trois composantes servant au traitement parallèle de l’information. Il y a
le système central (central executive) qui est un contrôleur d’attention soutenu par deux
systèmes esclaves : le phonological loop et le visuo-spatial sketch pad.

Visuo- Phonological
Spatial Central Loop
sketch pad executive

Figure 2.9 : Représentation de la mémoire de travail de Baddeley

Le système phonological loop comprend un endroit de stockage de l’information ainsi qu’un
mécanisme de répétitions (rehearsal process). Ce système semble être impliqué dans
l’apprentissage à long terme phonologique comme dans l’acquisition de nouveaux mots par
exemple.

Le deuxième système esclave, visuo-spatial sketch pad, est un système qui stocke et manipule
des images visuelles. Il est impliqué dans l’apprentissage et la mémorisation par imagerie.

-37-

Le système central, quant à lui, est la composante la plus complexe et la moins comprise de la
mémoire de travail. Ce système contrôle les deux systèmes esclaves tout en assurant un lien
avec la mémoire à long terme. Le système central aurait aussi une capacité de traitement de
l’information limitée ce qui expliquerait le phénomène du nombre magique de Miller.

2.2.4 Mémoire à long terme

Selon une citation célèbre de Edridge-Green (1900), « la mémoire est la fonction la plus
importante de notre cerveau… Sans la mémoire, toute l’expérience acquise serait inutile. »
Cela énonce bien l’utilité et l’importance de la mémoire en général. Cependant, la mémoire à
long terme reflète encore mieux cette citation, car c’est avec cette structure que la
mémorisation permanente est effectuée. Cette section traite de la mémoire à long terme, de sa
structure et de ses mécanismes.

2.2.4.1 Structure
Ces dernières années, les chercheurs ont tenté de catégoriser les différentes fonctions de la
mémoire à long terme. Le résultat fût la subdivision de la mémoire à long terme en plusieurs
catégories.

Mémoire à long terme

Déclarative Non Déclarative

Faits Événements Aprentissage Habileté Conditionnement
non associatif

Figure 2.10 : Taxonomie de la mémoire selon Squire (1993)

-38-

Il existe plusieurs organisations et subdivisions de la mémoire à long terme mais la plus
courante dans la littérature est la taxonomie de Squire (1993). Comme le montre la Figure
2.10, la grande distinction si situe entre la mémoire déclarative (mémoire explicite) et la
mémoire non déclarative (mémoire implicite). La mémoire déclarative stocke la connaissance
de la mémoire à long terme pouvant être récupérée de façon consciente. En d’autres termes, le
fait de récupérer l’information dans la mémoire déclarative veut dire que cette information est
consciente et que vous savez qu’elle est disponible. De l’autre côté, la mémoire non
déclarative ou implicite stocke la connaissance qui peut influencer le comportement sans une
implication consciente de votre part. Notre revue bibliographique ne traite que de la mémoire
déclarative étant donné la nature du projet que nous développons. Il n’est pas, à ce stade-ci,
pertinent d’explorer la façon dont le cerveau stocke l’information implicite, puisque notre
système ne considère pas directement ce genre de distinction. Le but de nos recherches est de
développer un modèle de mémoire déclaratif pour la mémorisation d’événements, d’objets,
d’états ou de localisation spatiale. Nous ne traitons pas de conditionnement ou d’apprentissage
à ce stade-ci du projet. Il n’est donc pas nécessaire de s’attarder sur les théories de la mémoire
implicite.

La mémoire déclarative ou explicite se compose de deux structures : la mémoire épisodique et
la mémoire sémantique. Si vous vous demandez quel est le nom de famille de votre mère, vous
faites appel à de l’information dans la mémoire épisodique. Lorsque vous récupérez cette
information, vous être conscient de celle-ci et vous pouvez verbalement énoncer ce nom. La
mémoire épisodique sert aussi à stocker l’histoire. C’est l’habileté mentale à revivre certaines
situations pour en extraire des informations et pour anticiper sur le futur [Wheeler, Struss &
Tulving, 1997]. En revanche, si je vous demande ce qu’est un nom de famille, vous irez
chercher l’information dans la mémoire sémantique qui contient votre connaissance générale
du monde. La question vous demande de relier des concepts et des idées, incluant votre
connaissance sur la façon d’exprimer ces concepts et ces idées dans un langage donné.
Lorsque l’information est récupérée, elle devient explicite : le concept est maintenant devenu
conscient et vous pouvez y faire appel.

-39-

Lorsqu’on s’attarde aux mécanismes de la mémoire à long terme, on s’apperçoit que ce sont
sensiblement les mêmes que ceux présents dans la mémoire à court terme. Il y a le phénomène
de la répétition qui aide la mémorisation d’un élément. La théorie de Craik et Lockhart sur
l’attention s’applique de la même façon que dans la mémoire à court terme. L’organisation de
l’information est aussi semblable et considère des regroupements de ce qui est mémorisé
(chunking). La fonction de rétention réagit de la même façon dans la mémoire à long terme
que dans la mémoire à court terme. Les hypothèses sur celle-ci sont aussi les mêmes :
interférence et diminution graduelle de la trace (decay hypothesis). Cependant, l’information
semble s’oublier moins rapidement que dans la mémoire à court terme. Est-ce la fonction de
rétention qui est différente ou est-ce la force de la trace dans la mémoire à long terme qui est
supérieure ? Est-ce que l’interférence joue un rôle moins dominant étant donné la capacité
illimitée de la mémoire à long terme ? Toutes ces questions ont amené certains chercheurs
[McKoon & Ratcliff, 1986; Tulving, 1989] à s’interroger sur la raison d’être de la mémoire à
court terme puisque tous les mécanismes de la mémoire à long terme sont suffisants pour
expliquer le comportement de la mémoire à court terme [Anderson, 1993]. C’est ainsi qu’ils
ont proposé une hypothèse selon laquelle la mémoire à long terme ne serait qu’une seule et
même structure composée de plusieurs mécanismes de traitement.

2.3 Les modèles de mémoire

Nous avons étudié différentes théories portant sur la mémoire en explorant les propriétés des
mémoires (structure, rétention, encodage, etc.). Il est maintenant temps de regarder ce que la
théorie a produit concernant les modèles de la mémoire. Il faut bien comprendre que, en
psychologie, il existe une différence entre les théories et les modèles. Les théories sont des
avenues proposées pour expliquer un phénomène expérimental sur un sujet bien précis (par
exemple la théorie de la rétention de la mémoire à court terme). Les modèles, de leur côté,
rassemblent toutes ces théories pour former un tout cohérent qui devrait valider et prédire les
phénomènes associés aux mécanismes de mémoire. Jusqu’ici, nous n’avons vu que des
théories sur la mémoire à l’exception du modèle de Atkinson & Shiffrin qui a été présenté
pour sa distinction historique. Les modèles n’ont pas une place très proéminente dans la
recherche expérimentale en psychologie. Cependant, ils seront très utiles dans l’étude et la

-40-

conception de notre modèle de mémoire. Cela nous permettra de nous concentrer sur les
relations entre les théories et la modélisation des mécanismes de mémoire tout en explorant les
différentes façons de représenter des mécanismes cognitifs.

2.3.1 Le modèle SAM

Étant donné que l’architecte principal de SAM fut Richard Shiffrin, il n’est pas étonnant de
retrouver plusieurs propriétés du modèle de double stockage [Atkinson & Shiffrin, 1968]. La
mémoire à court terme est vue comme un tampon à capacité limitée permettant deux choses.
Premièrement, elle affecte quel item sera stocké dans la mémoire à long terme et
deuxièmement, elle est utilisée pour assembler les requêtes pour l’accès à la mémoire à long
terme (semblable à la mémoire de travail). La mémoire à long terme, quant à elle, est
modélisée comme étant un ensemble illimité d’interconnexions entre concepts. L’information
dans cette mémoire se veut permanente et non effaçable. Tout ce qui se rapproche du
phénomène de l’oubli n’est qu’un échec lors de la récupération des données.

Le concept clé de l’architecture de SAM est l’image. Une image est un ensemble
d’interconnexions contenant de l’information sur l’item lui-même, sur le contexte dans lequel
l’item a été appris, et sur les relations avec les autres images. Le processus d’association se fait
dans la mémoire à court terme. Lorsque la capacité du tampon est excédée, une règle de
remplacement détermine quel objet sera perdu. La première version de SAM en 1981
proposait que chaque item dans le tampon avait la même probabilité d’être remplacé. Dans les
versions suivantes [Gillund & Shiffrin, 1984], la règle remplaçait l’item le plus vieux dans le
tampon. Le concept de répétition est également présent afin d’augmenter la force des
associations dans la mémoire. La force d’une association entre deux items ou entre un item et
son contexte dépend du temps que ces deux objets passeront ensemble dans la mémoire à
court terme. Suite à cela, un modèle assez complet de récupération et de reconnaissance est
élaboré dans Gillund & Shiffrin 1984. Même si SAM est en mesure d’expliquer une grande
variété de phénomènes psychologiques, il fait quand même l’objet de quelques critiques. Par
exemple, le modèle ne prend pas en considération l’attention ou le niveau de traitement de
l’information (conscience).

-41-

2.3.2 MINERVA 2

Le but premier du développement de MINERVA2 [Hintzman, 1988] était d’expliquer les
phénomènes de la mémoire épisodique et de la mémoire sémantique. Étant donné que ces
mémoires ont un niveau d’abstraction assez élevé, il fallait émettre plusieurs hypothèses au
départ :
1. Seulement les traces épisodiques sont stockées en mémoire,
2. La répétition crée plusieurs traces d’un même item en mémoire,
3. Une requête contacte simultanément toutes les traces en mémoire,
4. Chaque trace est activée selon la similarité de la requête de récupération.

Le point 2 soulève une affirmation importante car MINERVA2 suggère que la répétition
augmente la force de la trace en mémoire non pas par renforcement, mais bien par redondance,
en produisant des copies multiples en mémoire. Ceci diffère des autres modèles dans lesquels
c’est la force de la trace de l’item qui est augmenté.

L’affirmation de ces hypothèses vient donc élever le niveau du modèle au-delà de
l’application que nous désirons en faire. Il n’est donc pas très pertinent pour nous d’étudier
plus en détails ce modèle. C’est un modèle intéressant mais la nature même des problèmes
qu’il aborde n’est pas d’une grande importance pour nos agents qui sont dans un contexte
particulier. C’est pourquoi nous n’aborderons pas non plus certains modèles comme TODAM
[Murdock, 1997], REM [Shiffrin & Steyvers, 1997] ou les modèles connectionismes.

2.3.3 Modèle de mémoire de SOAR

Le modèle de mémoire de SOAR [Newell, 1990] propose trois mécanismes reliés à la
mémoire, soit l’acquisition, la récupération et l’accès. La définition de l’apprentissage du
modèle est intimement reliée à la mémoire. Selon Newell, l’apprentissage fait référence au
mécanisme d’acquisition de la mémoire mais aussi à celui de la récupération. Newell prétend

-42-

que l’apprentissage n’est pas seulement l’acquisition de nouvelles connaissances mais aussi la
façon de récupérer ces nouvelles connaissances.

2.3.3.1 Hypothèses de SOAR
Pour débuter, étudions les différentes hypothèses que SOAR fait à propos de la mémoire et de
l’apprentissage.
1- La première hypothèse est l’unité fonctionnelle de la mémoire à long terme (functionnal
unity of long-term memory). Tous les modules de la mémoire à long terme devraient
consister en une mémoire de reconnaissance. Cette mémoire devrait être uniforme et
devrait contenir toute la connaissance, qu’elle soit épisodique, sémantique ou procédurale.
Cela n’implique cependant pas un encodage unique pour toute la connaissance stockée
dans la mémoire à long terme. Plusieurs niveaux peuvent être utilisés avec, pour chacun
d’eux, des mécanismes différents. Par exemple, un ordinateur est fondamentalement
composé de circuits manipulant des 0 et des 1. Cependant, les niveaux plus abstraits ne
traitent pas nécessairement des 0 et des 1. Ils peuvent posséder différents mécanismes
exploitant pourtant ce même système. Il en est de même pour le cerveau humain qui est
fondamentalement composé de neurones. Ces neurones peuvent former différents systèmes
s’exploitant de manière très différente même si la structure physique de base est la même.

2- La deuxième hypothèse concerne l’apprentissage par chunks (chunking-learning
hypothesis). Dans SOAR, tout l’apprentissage à long terme s’effectue par regroupement
(chunking). L’unité de l’apprentissage est le morceau ou chunk. Newell admet que le
« chunking » n’est pas le seul mécanisme de l’intelligence mais il est, selon lui, suffisant
pour supporter toutes les directions de l’hypothèse de l’apprentissage par « chunks ».

3- La troisième considération de Newell est la fonctionnalité de la mémoire à court terme.
Une architecture ne serait pas complète sans l’intégration d’une mémoire à court terme
servant à fermer la boucle entre tous les éléments d’une mémorisation. SOAR appelle cette
mémoire la mémoire de travail. Par sa nature, cette mémoire est temporaire et change au
rythme des opérations du système.

-43-

2.3.3.2 Théorie qualitative de SOAR
Nous allons maintenant nous concentrer sur la théorie qualitative de l’apprentissage de SOAR.
Cette théorie est intéressante puisqu’elle vient mettre en relation plusieurs théories de la
mémoire que nous avons vues précédemment.
1- Tout ce qui est appris provient d’une activité qui consistait à accomplir un but (goal-
oriented activity). C’est probablement la caractéristique la plus importante du mécanisme
de chunking. Pour apprendre (ou mémoriser), l’organisme doit avoir un objectif à
atteindre. Il n’a pas le but d’apprendre puisque l’apprentissage n’est pas délibéré. Nous
acquérons seulement la connaissance nous permettant d’accomplir notre but.
2- Une des propriétés les plus intéressantes pour nous est celle concernant l’apprentissage par
répétition. La répétition est le mécanisme par lequel l’information est retenue dans la
mémoire à court terme. Dans le modèle de Atkinson et Shiffrin, la répétition était
considérée comme le seul mécanisme permettant à l’information dans la mémoire à court
terme de se transférer dans la mémoire à long terme. Comme nous l’avons vu, cette
hypothèse a été critiqué par la théorie Craik et Lockhart (depth-of-processing). Suite à
cela, SOAR indique que la répétition a des effets positifs sur la rétention de la mémoire si
ce qui est répété est d’intérêt. Si aucune tâche n’est effectuée et que la répétition n’est
qu’un comportement passif, alors l’acquisition à long terme ne pourra pas s’effectuer.
SOAR est donc en accord avec la théorie de Craik et Lockhart.
3- La dernière propriété concerne le regroupement (chunking) qui serait, pour plusieurs, la
façon dont la mémoire est organisée. Newell se base sur les résultats de DeGroot en 1965
et de Chase & Simon en 1973 sur la perception d’un jeu d’échecs. Une personne doit
examiner un jeu d’échecs pendant 5 secondes et ensuite reproduire de mémoire la position
de toutes les pièces. Un maître d’échecs fait un excellent travail (en moyenne 23 sur 25
pièces sont placées correctement) tandis que les résultats du débutant sont vraiment
désastreux (en moyenne 3 ou 4 sur 25). En fait, ce test de mémoire perceptuelle est le test
le plus rapide pour déterminer la compétence aux échecs. Le modèle qui explique ce
phénomène le fait en termes de regroupements. Le maître d’échec acquiert, à travers son
expérience, la capacité d’effectuer des liens fonctionnels et spatiaux entre les pièces du
jeu. Le regroupement permet au maître de caractériser un arrangement complexe de

-44-

plusieurs pièces en seulement quelques chunks. Le débutant, quant à lui, considère
simplement une pièce par chunk, ce qui lui permet d’acquérir seulement la position de
quelques pièces.

Ces propriétés concernent la mémoire en général, mais quelle est exactement l’opinion de
Newell concernant la mémoire à court terme et les mécanismes de transfert vers la mémoire à
long terme? Le modèle SOAR ne considère pas vraiment la mémoire à court terme étant
donné la confusion qui règne concernant son existence physique [Crowder, 1976]. SOAR
considère plutôt une mémoire temporaire servant à exécuter la tâche courante (mémoire de
travail). Il est donc nécessaire de remplacer la connaissance contenue dans la mémoire de
travail lorsque la tâche courante change. Ce remplacement peut être effectué de plusieurs
façons : par un déplacement d’informations, par un déplacement des processus manipulant ces
informations ou par une modification du chemin d’accès. Le phénomène de rétention est
représenté assez simplement : l’information reste accessible dans la mémoire de travail tant
que la tâche courante n’est pas achevée.

L’architecture de la mémoire de SOAR se compose donc de différents modules jouant chacun
un rôle important. La mémoire de travail est intimement liée à la perception, aux réactions
motrices et à l’accès à l’information nécessaire pour résoudre une tâche (Figure 2.11).

-45-

Figure 2.11 : Modèle de mémoire de SOAR [Newell, 1990]

Les propriétés de la mémoire dont SOAR rend compte sont, selon Newell, assez cohérentes
par rapport aux caractéristiques observées chez l’être humain. Il se base sur des observations
empiriques, mais il prend aussi en considération une connaissance assez complète de la
littérature en psychologie. Il y a quand même un aspect important de la mémoire qui n’est pas
modélisé : l’oubli de la connaissance dans la mémoire de production (mémoire à long terme).

2.3.4 Modèle de mémoire de l’architecture ACT-R

Le modèle de mémoire de ACT-R [Anderson, 1990] possède deux systèmes de mémoire à
long terme : la mémoire procédurale et la mémoire déclarative. Plusieurs mécanismes sont
associés à ces mémoires permettant ainsi d’ajouter et de maintenir l’information. ACT-R est
basé sur la théorie de l’analyse rationnelle de Anderson. Suivant cela, le système cognitif est
entièrement optimisé en fonction de son environnement.

Un premier exemple du rôle de l’analyse rationnelle est la mémoire déclarative. Les éléments
de la mémoire déclarative sont appelés chunks et sont l’équivalent des chunks de SOAR.
Chaque chunk possède une valeur d’activation représentant la probabilité que le chunk soit

-46-

sollicité dans le contexte courant. Pour être en mesure d’estimer cette valeur, les mécanismes
d’apprentissage doivent garder toujours un œil attentif sur l’environnement. Deux facteurs
sont pris en compte : combien de fois le chunk a été utilisé dans le passé et combien de temps
s’est écoulé depuis sa dernière utilisation.

Ensuite, ACT-R possède une mémoire procédurale où la connaissance est représentée par des
règles de production. Chaque règle est associée à un ou plusieurs paramètres.

ACT-R définit une pile de buts (Goal-Stack) servant à empiler dynamiquement des chunks
pour des usages temporaires. Comme le nom l’indique, seulement le chunk du dessus de la
pile est accessible à un moment donné. Ce mécanisme est similaire à la mémoire de travail des
théories cognitives ainsi qu’à celle définie par SOAR.

Les mécanismes de l’architecture de la mémoire de ACT-R sont définis par des formules
mathématiques et explicites, ce qui permet une modélisation plus directe comparativement au
modèle de Newell. Suivant cela, une équation de l’accumulation de la force de rétention suite
à la pratique a été proposée par Anderson & Fincham (1999). La force de la trace en mémoire
est caractérisée comme suit : F = ∑ ti-d où ti est le temps écoulé de la ie pratique depuis
l’acquisition de l’information. La constante « d » représente le taux d’apprentissage pouvant
varier d’une personne à l’autre. Donc, la somme de tous les temps écoulés des pratiques de la
donnée depuis son acquisition est calculée pour former la force de la trace en mémoire de
l’élément mémorisé.

2.3.5 EPIC

SOAR et ACT-R sont des architectures qui se concentrent sur la cognition centrale, c’est à
dire les mécanismes liés directement à la mémoire et à l’apprentissage. EPIC (Executive-
Process Interactive Control) [Kieras & Meyer, 1997] insiste plutôt sur l’importance de la
cognition périphérique, c’est-à-dire tous les mécanismes qui interagissent avec
l’environnement (perception, actions, etc.). Les auteurs affirment que la cognition
périphérique est un facteur déterminant pour la performance d’une tâche. La Figure 2.12

-47-

montre bien l’importance des systèmes périphériques en proposant un ensemble de
processeurs moteurs et perceptuels. Le module perceptuel envoie les informations qu’il reçoit
directement à la mémoire de travail de façon complètement asynchrone. La particularité de
cette architecture est que plusieurs buts peuvent être représentés de façon non hiérarchique. De
plus, plusieurs buts peuvent être actifs dans le même cycle (traitement parallèle) en autant
qu’ils n’utilisent pas la même ressource périphérique.

Figure 2.12 : EPIC architecture [Kieras & Meyer, 1997]

EPIC suppose ainsi que les contraintes et limitations de l’architecture sont dues à la structure
des organes sensoriels et moteurs. Ce sont ces organes qui limitent l’apport et la transmission
de l’information.

-48-

2.3.6 3CAPS

Enfin, le modèle 3CAPS [Just & Carpenter, 1992] avance que les limitations du système
cognitif sont liées de la capacité de la mémoire de travail. 3CAPS définit trois types de
mémoires, soit la mémoire de travail, la mémoire procédurale et la mémoire déclarative. Selon
la théorie de la capacité, si le maximum d’éléments est atteint dans la mémoire de travail, les
processus de production activent moins d’éléments que ce dont ils ont besoin. Cela a pour
effet d’oublier des éléments prématurément. Le modèle 3CAPS interprète ce phénomène
comme une source de différences individuelles. L’architecture de 3CAPS ne prend cependant
pas en compte l’apprentissage.

2.4 Conclusion sur l’état de l’art sur la mémoire

À ce stade-ci, il est important de discerner les grandes composantes d’un modèle de mémoire
et d’identifier les principales fonctionnalités de ces mêmes composantes. C’est donc ce que
nous avons fait dans ce chapitre en présentant l’historique, les théories et les modèles associés
à la mémoire.

Plusieurs théories, phénomènes et modèles n’ont pas été présentés dans cette courte revue
bibliographique sur la mémoire. Les recherches dans ce domaine sont actuellement très actives
et beaucoup d’incertitude persiste dans en psychologie cognitive. Bien que nous ayons omis
plusieurs travaux, toutes les références bibliographiques présentées donneront un excellent
point de départ pour les recherches plus précises dans ce domaine. Notre but n’est pas de
rapporter toutes les recherches sur la mémoire des dernières décennies, mais simplement de
cibler les principaux phénomènes et mécanismes qui seront utiles dans le développement d’un
modèle de mémoire dans le cadre de notre projet multi-agent.

-49-

____________________________________

Chapitre 3

Notre modèle de mémoire
____________________________________

Modèle cognitif de mémoire dans un environnement virtuel

Modèle cognitif de mémoire dans un environnement virtuel

Recommandé

Recommandé

Contenu connexe

En vedette

En vedette (20)

Similaire à Modèle cognitif de mémoire dans un environnement virtuel

Similaire à Modèle cognitif de mémoire dans un environnement virtuel (20)

Plus de NSim Technology

Plus de NSim Technology (6)

Modèle cognitif de mémoire dans un environnement virtuel