L'espace intellectuel du CRDT : Analyse lexicale des titres des publications du Centre
Voir les autres présentations pour la suite du projet
Dossier complet ici : https://www.researchgate.net/institution/Universite_du_Quebec_a_Rimouski_UQAR
Ouvrage ici : https://www.uqar.ca/uqar/recherche/unites_de_recherche/grideq/edition/parution_territoire_du_crdt.pdf
3. Hypothèses
Hypothèse (rappel) : selon l’acception traditionnelle de la science, le « territoire »
du CRDT peut être conçu comme un espace intellectuel, constitué des construits
scientifiques (empiriques, méthodologiques, théoriques) de ses membres ; enjeu :
la définition conceptuelle du « développement territorial » ou du « territoire ».
L’analyse est modeste et limitée : plusieurs voies sont possibles, mais faute
d’histoire conceptuelle complète de la production des sciences régionales
québécoises ou de celle du CRDT (de type Cloutier et al., 2011 ; cf. quand même
RERU, 2012, Massicotte, 2008 ; Robitaille et Proulx, 2014 ),
Choix d’une analyse textuelle des titres des productions et de la construction
d’arbres lexicaux qui seront l’objet d’une double lecture :
– l’analyse systématique de l’ensemble des productions scientifiques du
CRDT, afin d’expliciter une définition globale du territoire et du
développement territorial ; cf. idée d’un « grand récit » des
transformations du territoire au Québec depuis le début des années 2000
(cf. l’acception classique de la science).
– l’observation des dynamiques localisées de production scientifique (au
niveau des pôles constitutifs du CRDT), pour examiner s’il existe différents
modèles locaux (ou « petits récits ») pour examiner leur éventuelle
convergence dans une définition globale (cf. l’acception « réaliste » de la
science)
4. Cadre
théorique
(1/2)
Face aux acceptions classiques d’une connaissance universelle se
construisant par l’abstraction du monde profane, hypothèse ancienne
d’une genèse localisée des théories scientifiques
Cf. le « point capital » du mémoire du GRIDEQ en 1975 déposé à la
commission Healy sur les études supérieures en sciences humaines
en 1975 :
« les universités périphériques ont quelque chose de nouveau à apporter au
monde scientifique, particulièrement en sciences humaines », parce que « le
type de problème abordé et la façon de le faire sont liés à un contexte socio-
culturel spécifique »; ceci déboucherait sur « le développement d'une science
universelle adaptée à des ensembles plus restreints », et à des objets peu
couverts par les « grandes universités urbaines » (Harvey, 1975)
Trevor J. Barnes et les travaux actuels sur l’existence de modèles
scientifiques locaux qui ont d’abord pour objet non de réduire les
particularités territoriales par abstraction vers un ordre logique
supérieur, mais au contraire de fonder la connaissance sur une
entreprise d’élucidation de la constellation changeante et (au moins
partiellement) spécifique de ces particularités (Barnes et Hayter)
5. Cadre
théorique
(2/2)
Selon la conception réaliste de la science, les théories ont pour
fonction de mettre en récit (de relier) les faits (leur flou, leur
contingence, leur substance) au lieu de les décontextualiser par la
formalisation :
– La densité empirique ouvre à des concepts denses ou complexes
(ex. le débat entre Ann Markusen et les « Fuzzy Concepts » et Jamie
Peck sur le « Fuzzy Old World » ; cf. aussi les staples d’Harold Innis,
dont la signification intrinsèque et l’applicabilité contextuelle sont
discutés dans le cadre de comparaisons entre des ensembles denses
et complexes (cf. Barnes et Hayter et les économies ressources) ; cf.
réflexivité
– Une limite cependant : cette déconstruction peut conduire au post-
modernisme (où la science est un récit « profane » comme un autre)
et doit être rééquilibrée par un effort parallèle de reconstruction :
la science peut prétendre à un statut spécifique (certes relatif)
d’entreprise d’élucidation visant à l’avancement de la connaissance
dans une optique de progrès collectif (Burawoy : les tensions de la
pratique scientifique entre « orthodoxie » et ouverture de la science)
6. Démarche
Deux étapes sont nécessaires pour combiner :
Une étape de déconstruction pour poser à plat les éléments (objets,
concepts, notions) récurrents dans la production du CRDT dans son
ensemble (cf. logique de dislocation chez Barnes) et délimiter les éléments
moteurs dans la définition scientifique du territoire du CRDT (comme
configuration floue et complexe, dotée d’un certain ordonnancement) ;
Une étape de reconstruction, pour saisir les liens entre ces éléments, qui
peuvent adopter des configurations différentes selon les perspectives et
selon la configuration territoriale de production de la science (cf. logique de
relocation ou de relocalisation des analyses scientifiques), pour suivre la
piste de F. Harvey : quels modèles locaux, caractérisés par des objets
spécifiques à chaque territoire ou présentant une configuration spécifique ?
(Ex. : foresterie en Outaouais, enjeux urbains au Saguenay, pêche et ruralité
dans l’Est-du-Québec, etc.).
8. L’analyse
lexicale
des titres
Méthode de l’analyse lexicale
Famille de l’analyse de données statistiques textuelle
Observe le lexique utilisé
Vise à répondre à « de quoi parle-t-on ? »
N’examine pas le sens du texte, mais le lexique utilisé :
la fréquence des termes employés
les liens entre les éléments des énoncé(s)
Proche, mais différente, d’autres démarches comme la cartographie cognitive
(manière dont la pensée est structurée), ou l’analyse de contenu.
(Guérin-Pace, 1997; Fallery, Rodhain, 2007; Lebart, Salem, 1994)
9. Objectifs de
l’analyse
lexicale
1062 titres
Indicateurs des thématiques privilégiées du CRDT
Objectifs :
Mettre à jour les « formes lexicales » utilisées et leur
fréquence
Repérer les liens entre elles (cooccurrences)
Observer leur évolution (deux périodes : 2003-8 et 2009-14)
Observer les variations locales (pôles de rattachement)
Ont également permis d’observer les collaborations entre les institutions
10. Étapes de
l’analyse
lexicale
Démarche supportée par le logiciel IRaMuTeQ
• formes actives (nom, verbe, adjectifs, …)
• formes supplémentaires (articles, mots de liaison, …)
Catégorisation
des mots
• Deux niveaux possibles
• La lemmatisation :
verbes à l’infinitif, noms et adjectifs au masculin-singulier
(territoriales -> territorial)
• La stemmatisation :
élimine les suffixes et préfixes, retient la racine commune
(territorial, territorialiser -> territoire)
• Définition de termes clés : territoire, région, rural, Québec
(avec développement, social, local, et cas)
Traitement
de racinisation
• Ici, les titres
Découpage
en unités de
contexte
• Présence / absence de chaque forme dans chaque segment
Création d’une
matrice
11.
12. Limites de
l’analyse
lexicale
Un outil avec une portée heuristique certaine, mais :
(1) des choix méthodologiques non neutres,
(2) certaines limites : considère le texte comme des mots
regroupés dans des unités, mais sans prendre en compte leur
articulation, le contexte et l’organisation du texte.
Pour aller plus loin, une bonne connaissance du corpus est ainsi
nécessaire : les résultats obtenus doivent être considérés comme
des pistes d’analyses nécessitant une analyse plus complète.
14. Les formes lexicales les plus fréquentes (sauf « cas ») constituent le cœur de
l’entreprise épistémologique du CRDT : québec, développement, territoire,
région, social, rural et local
Peu surprenante en soi, ces formes renvoient aux divers concepts, notions aux
objets qui rassemblent les chercheurs (cf. perspective œcuménique) ; toutefois,
cette observation peut être affinée pour découvrir un triangle imparfait :
– En termes de fréquence, la surprise vient de la place du « territoire », qui
n’arrive qu’en 3ème position (avec 213 occurrences), après le duo de tête :
québec (261) et développement (258). Ces trois formes distancent
nettement les suivantes (région : 152 ; social : 143), tandis que le territoire
occupe une position particulière, moins évidente que québec et
développement mais plus centrale que toutes les autres.
– La fréquence des liens confirme ce triangle imparfait : les mêmes trois
thèmes sont fortement présents et fortement liés, mais de manière inégale :
le lien le plus fréquent est entre développement et territoire (83) suivi de près
par développement - québec (79), alors que le lien québec - territoire,
également important, est inférieur (53), plus proche du duo développement -
région (51).
Formes lexicales principales – CRDT (2003-2014)
Forme lexicale nombre
québec 261
développement 258
territoire 213
région 152
social 143
rural 138
cas 104
local 90
15. Dans le temps long, quelques tendances :
– La prépondérance du thème du
développement dans les premières
années (plus de 30% en 2005), suivi par
une baisse modérée (entre 20 et 25% en
2010-14)
– La stabilité relative du thème québec
(systématiquement au dessus de 20% et
dépassant 35% en 2006)
– L’instabilité majeure du thème
territoire qui, de proportion initialement
basse (moins de 10% en 2004) devient
nettement présent (35% en 2008) avant
de s’effondrer (autour de 10% en 2011)
puis de remonter (près de 24% en 2014).
Ces trois thèmes centraux s’imposent dans la
période 1, avant de décliner relativement
Évolution de la fréquence des thèmesprincipaux dans les titres
16. Catégories
de thèmes
Dans le temps long (pour le CRDT), trois catégories de thèmes :
– Les thèmes centraux (développement et québec) qui sont
souvent présents et stables dans les titres
– Les thèmes périphériques qui sont soit instables (rural,
région) soit moins présents (local) soit les deux (social)
– Le thème « intermédiaire » du territoire, qui est instable
au point d’être parfois omniprésent (en 2008) et parfois
quasi-négligeable (autour de 10% en 2004, 2011 et 2013)
Pour aller plus loin, il est possible de s’appuyer sur une mise en
forme graphique pour constituer des arbres lexicaux de la
production du CRDT, dans son ensemble ou selon les pôles.
17. Quelques
pistes de
lecture
…
La lecture de ces arbres lexicaux peut être guidée par deux
perspectives :
– « L’esprit de géométrie », qui vise à faire ressortir les
grands ensembles thématiques et leurs relations, pour
dégager une logique d’ensemble (voire un aperçu de la
structure générale) des thèmes caractérisant la
production du CRDT
– « L’esprit de finesse », qui vise au contraire à regarder la
structure interne à chaque regroupement thématique,
pour examiner leurs lignes de force et suggérer des pistes
d’élucidation des logiques de ces univers thématiques
En conservant seulement la première approche (et en
attendant la lecture plus subtile réalisée dans les ateliers),
proposition d’une lecture possible des thèmes privilégiés par
le CRDT, focalisée sur les rapports entre le noyau central et les
thèmes plus périphériques …
22. Méthode
(4)
Débat sur la
racinisation
Lemmatisation :
• Plus adaptée pour les langues latines (risque d’ambiguité)
• ICI : Lemmatisation sur l’ensemble du corpus
Stemmatisation :
• Avantage : augmente le nombre des liens observables
• Inconvénient : perte possible d’informations (dénature le
sens)
• ICI : Stemmatisation manuelle
Pour faire ressortir les thèmes principaux et leurs
trajectoires (territoire / territorial, région / régional, rural /
ruralité, Québec / québécois, avec développement, social
et local)