De nombreux outils de diffusion de données territoriales existent. Chaque jour, de nouveaux indicateurs de plus en plus fins sont développés et mis à disposition du public comme des décideurs locaux. Ces données et indicateurs sont diffusés via différents portails internet dont l’appropriation par les acteurs est à ce jour difficilement quantifiée et qualifiée. Une étude conjointe entre le Commissariat Général à l’Égalité des Territoires (www.cget.gouv.fr) et le laboratoire CIMEOS – MSH de Dijon, de l’Univ. de Bourgogne Franche-Comté a été lancée en 2016 afin de construire une vision concertée de l’utilisation pratique par les territoires des connaissances produites nationalement, afin d’en comprendre l’impact, d’en évaluer la prégnance dans la construction des politiques publiques au niveau local comme national. Comment des démarches de diagnostic et d’observation s’inscrivent par exemple dans des dynamiques d’intelligence territoriale actées par les acteurs locaux ?
Dans un contexte de quartiers dits « prioritaires », amenés à se transformer au gré des innovations sociales, l’intérêt est ici de comprendre comment les acteurs se sont approprié des outils d’observation du territoire pour affiner leurs stratégies et améliorer la qualité de leurs actions.
Notre enquête, menée auprès d’élus, d’associatifs, de bureaux d’études, comme de producteurs et diffuseurs de données, permet d’éclairer de nouveaux modes de communication organisationnelle. Ce projet, revêtant la forme d’une recherche-action, s’intéresse dans un second volet à la production d’indicateurs par et pour les parties prenantes d’un territoire, à leur implication en amont de la réflexion et de la définition des besoins. Il questionne donc les acteurs sur l’organisation, la production et l’usage des informations territoriales. La méthodologie adoptée combine une enquête par entretiens semi-directifs, de l’analyse des contenus et des discours, et de la veille informationnelle territoriale.
L’analyse des entretiens porte sur la perception des acteurs territoriaux de l’utilisation des données socio-économiques, des indicateurs, et de leur transformation en actions concrètes. Les résultats qui en découlent serviront à la rationalisation des pratiques dans une démarche socio-pragmatique, tournée vers des réalisations s’inscrivant dans la transition socio-écologique.
INTI2016 161124 La catalysation de l’Economie Sociale et Solidaire à travers...
Inti17 bogota-masselot djahanchahi-fr
1. Données territoriales en ESS :
entre usages et co-construction
Cyril MASSELOT & Stéphane DJHANCHAHI
Laboratoire CIMEOS EA 4221, Université de Bourgogne
Franche-Comté
International
Network of
Territorial
Intelligence
4. Contexte & Problématique
Comment s’articulent ces données
dans les missions des acteurs ?
Comment transforment-elles les territoires ?
Données
nationales
distribuées par
des
observatoires
« Nouvelles »
données
produite par la
généralisation
d’outils
sociotechniques
Nouveau
paysage de la
donnée
5. Hypothèses
– Les nouvelles données impliquent de nouveaux
usages en construction
– Il existe des freins à leur utilisation par les acteurs,
allant de leur foisonnement à des difficultés d’accès
d’ordre pratique
– La co-construction des indicateurs favorise leur
utilisation et la transformation de la connaissance en
actions
11. Corpus
• 13 acteurs au sein de 11 structures différentes, toutes ayant une
utilisation ou production de la donnée :
– 1 membre d’une institution liée à l’éducation
– 2 universitaires (ayant effectué des missions pour diverses institutions)
– 3 agents de collectivités territoriales (de Franche Comté et de
Bourgogne, en préfecture et en mairie)
– 7 membres d’associations (pour l’emploi, la prévention, la solidarité
ou encore l’environnement)
• Selon les critères de B. Pincemin (1999) de qualité d’un corpus textuel :
– Signifiance : acteurs pertinents ; diversité de sources, sur un même
sujet, structure les conditions d’interprétabilité.
– Acceptabilité : représentation fidèle des propos tenus ; pas de
contraintes externes ; mais 12h40 d’échanges, représentant 117 pages
de texte, 89163 mots complétude à améliorer.
– Exploitabilité : les mêmes règles d’unité de temps, ainsi que de
composition, donc bonne homogénéité ; volume à améliorer pour plus
de finesse.
• Analyse cognitive et communicationnelle du discours avec Iramuteq
(Ratinaud 2009) et production de graphes des similitudes (Vergès &
Bouriche 2001)
20. Données
« classiques »
« Nouvelles »
données
Données
locales
Données
nationales
Et ensuite ?…
??
21. Merci pour votre attention
Thank you for your attention
Gracias por su atención
Vă mulţumesc pentru atenţie
Köszönöm a figyelmet
謝謝您的關注
Grazie per la vostra attenzione
Vielen Dank für Ihre Aufmerksamkeit
Kiitos huomiota
Σας ευχαριστώ για την προσοχή σας
Dziękuję za uwagę
Спасибо за Ваше внимание
İlginiz için teşekkürler
الهتمامكم شكرا
22. Conclusion…
• La méconnaissance de la donnée conduit à divers écueils :
– Coûts évitables
– Productions en doublon avec d’autres organismes
– Carences dans la représentation du territoire donc dans la
définition de l’action publique
• Les producteurs, acteurs et utilisateurs de la donnée sont plus
efficients dans certaines conditions :
– « on sait quoi en faire quand on sait comment c’est fait »
– « on sait comment la faire quand on sait pour quoi c’est fait »
• La co-construction des indicateurs semble la plus importante pour
leur usage dans les politiques publiques
• Les usages des données dépendent fortement de leur médiation.
• Ces médiations et usages s’entendent en tenant compte des
spécificités territoriales d’échelle et de culture.
23. • Benamirouche, R. (2016). Le système d’information territorial comme levier
stratégique en santé. Revue d'Épidémiologie et de Santé Publique, 64, S19.
• Commenges, H. (2013). L'invention de la mobilité quotidienne. Aspects
performatifs des instruments de la socio-économie des transports (Doctoral
dissertation, Université Paris-Diderot-Paris VII).
• De Sede-Marceau, M. H., & Moine, A. (2001). Systémique et bases de données
territoriales. Des concepts et des outils pour une gestion raisonnée des
territoires. Revue internationale de géomatique, 11(3-4), 333-358.
• Degenne, A., Vergès, P. (1973). Introduction à l’analyse de similitude. Revue
française de sociologie, 14 (4), 471-511.
• DiClemente C. C. (2003). Addiction and Change : how addictions develop and
addicted people recover, Guilford Press.
• Emery, J. (2016). La ville sous électrodes : de la mesure à l'évaluation de la
pollution atmosphérique automobile (Doctoral dissertation, Université
Bourgogne Franche-Comté).
• Flament, C. (1981). L’Analyse de Similitude, une Technique pour les
Recherches sur les Représentations Sociales. Cahiers de Psychologie Cognitive,
1, 375- 395.
• Flament, C., Rouquette, M.L. (2003). Anatomie des idées ordinaires : comment
étudier les représentations sociales. Paris : Armand Colin.
Bibliographie
24. • Galibert. O, Aubert F., Hilal M., Girardot J.J., Masselot C., et al. (2015). Territoires
urbains en transition. Monographie d’un quartier populaire en résilience écologique.
Editions universitaires de Dijon, http://eud.u-bourgogne.fr/468-territoires-urbains-en-
transition-9782364411562.html, 2015, Sociétés, 978-2-36441-156-2. <http://eud.u-
bourgogne.fr/>. <halshs-01251061>
• Haddad, M. (2008). Intelligence territoriale et observatoires socio-économiques et
environnementaux : un processus d'intelligence territoriale adapté (PITA) à l'observatoire
de Menzel Habib au sud de la Tunisie (Doctoral dissertation, Université de Metz).
• Hare, I. (2016). Les stratégies des diffuseurs de données ouvertes en Région. Open-data
et collectivités territoriales : Entre usages et production, quels enjeux ?, non-précisé.
• Hopkins, R. (2011). Manuel de Transition, de la dépendance au pétrole à la résilience
locale. Editions Écosociété et revue Silence (traduit de The Transition Handbook, 2009,
ISBN 978-2-923165-66-0)
• Kaufmann, J. C. (2011). L'entretien compréhensif. Armand Colin.
• Laporte, A., Dubreuil, M., Jean-Gilles, E., Madelin, B., & Balazard, H. (2016). Convier les
citoyens des quartiers populaires : prendre en compte leur expertise et favoriser leur
pouvoir d’agir. Revue d'Épidémiologie et de Santé Publique, 64, S101-S102.
• Masselot C. (2014). « Co-construire l’information territoriale pour des actions
concertées. » In J.-J. Girardot & H. Neffati, (ed.). L'intelligence territoriale, 25 ans déjà !
Cahiers d'Administration, supplément au n° 244, pp. 45-49.
• Maurel, P. (2012). Signes, Données et Représentations Spatiales : Des éléments de sens
dans l'élaboration d'un projet de territoire intercommunal.: Application au territoire de
Thau (Doctoral dissertation, Université de Toulon).
Bibliographie
25. • Marchand, P. & Ratinaud, P. (2012). L’analyse de similitude appliquée aux corpus textuels : les
primaires socialistes pour l’élection présidentielle française (septembre-octobre 2011). Actes
des 11eme Journées internationales d’Analyse statistique des Données Textuelles (JADT), 687-
699.
• Morin E. (1990). Introduction à la pensée complexe. Paris : Le Seuil
• Pélissier D. (2016). "Comment préparer l’analyse de textes de sites Web grâce à la lexicométrie
et au logiciel Iramuteq ?," dans Présence numérique des organisations, 14/04/2016,
https://presnumorg.hypotheses.org/187.
• Pélissier D. (2016). « Initiation à la lexicométrie, Iramuteq, novembre 2016, V4,
https://presnumorg.hypotheses.org/
• Pincemin B. (1999). Construire et utiliser un corpus : le point de vue d’une sémantique textuelle
interprétative. Communication présentée à la Conférence TALN’99, Cargèse, 12-17 juillet 1999,
Actes pp. 26-36.
• Ratinaud, P. (2009). Iramuteq : Interface de R pour les Analyses Multidimensionnelles de Textes
et de Questionnaires. Repéré à www.iramuteq.org
• Reinert, M. (1983). "Une méthode de classification descendante hiérarchique : application à
l'analyse lexicale par contexte." Cahiers de l'analyse des données 8.2 : 187-198.
<http://eudml.org/doc/88079>.
• Reinert, M. (1990). ALCESTE : une méthodologie d’analyse des données textuelles et une
application : Aurélia de Gérard de Nerval. Bulletin de méthodologie sociologique, 26, 24-54.
Bibliographie
26. • Roux, E. et Feyt, G. (2011). Les observatoires territoriaux : sens et enjeux. Volume 14 de
Travaux - Délégation interministérielle à l'aménagement et à la compétitivité des territoires. La
Documentation Française, Datar.
• Toffler A. (1980). The Third Wave, ed. Bantam Books, New York.
• Vergès, P. & Bouriche, B. (2001). L’analyse des données par les graphes de similitude. Sciences
Humaines. (Disponible sur www.scienceshumaines.com/).
• Textes de référence
• Arrêté du 16 septembre 2003 portant sur les classes de précision applicables aux catégories de
travaux topographiques réalisés par l’État, les collectivités locales et leurs établissements
publics ou exécutés pour leur compte
• Loi n° 78-753 du 17/07/1978 : Dite loi CADA qui reconnaît à toute personne un droit d’accès et
de réutilisation des données publiques
• Directive Européenne 2003/98/CE : complète la loi du 17/07/1978 notamment au regard de la
Commission d’Accès aux Documents Administratifs
• Directive Européenne 2007/2/CE : dite directive INSPIRE, établissant une infrastructure de
données géographiques pour la Communauté Européenne
Bibliographie
Notes de l'éditeur
Le CGET pilote des observatoires : onpv, i.vill, sig.ville
Travaille avec des données labellisées issues du niveau national (donc de l’INSEE en fait)
Au dela des questions de difficulté d’accès à certaines données: manque, rétention etc. évoqués lors des présentations de nos confrères…
Nous : ce qui est mis à disposition est-il utile et comment est-ce utilisé?
Surtout des données INSEE
Données labellisées
Mais nouvelles données (open, self, big… data) produites par les acteurs dans leurs missions sur le terrain
« les acteurs ont la donnée avant les statisticiens » comme l’a dit Julien Perreault mardi
Nous nous posions des questions précises quant à la transformation en action mais :
On a surtout vu émerger différentes catégories d’acteurs qui, selon leur appartenance organisationnelle et institutionnelle, ont différentes « culture de la donnée » et ainsi différentes pratiques, à préciser bien en amont de la description des impacts que l’on pourra observer sur la transformation des territoires
Donc on doit en comprendre que les choses évoluent
=>Problématique plus générale
pour connaître leur utilisation mais aussi leur culture de la donnée
Recherche des observatoires et recherche en ligne (avec le service Veille du Réseau transition)
Première étape : tentative de veille
Les publications sont trop sporadiques pour prétendre à l’exhaustivité
Seconde étape: recherche par mots clefs dans les moteurs généralistes
Constitution d’un répertoire lexical autour de l’action sociale et environnementale
Ajout d’une liste de termes liés à l’observation et à l’étude de phénomène sociaux.
Combinaison à la liste des territoires étudiés
Retrouver les sources d’information sur les territoires pour éprouver la possibilité de se créer une représentation fidèle de ceux-ci
Seconde étape, nous avons exploité notre répertoire lexical pour interroger les moteurs de recherches généralistes. Les requêtes se sont affinées en partant du niveau régional pour aboutir au niveau le plus fin de la recherche avec les noms des principales communes ciblées.
La connaissance des observatoires nationaux
La culture de la donnée ou data literacy des acteurs
Le rôle du cursus professionnel, formation etc.
L’organisation de l’information territoriale
Les types d’usages et de productions
Analyse communicationnelle
Approche quanti-qualitative : profils de discours
Mais la plupart ne connaissaient pas les observatoires du CGET, pourtant tous connaissaient les données INSEE, mais aussi s’orientaient eux-mêmes sur la toile pour trouver leurs informations (en plus de produire parfois leurs propres indicateurs à partir du terrain)
Ratinaud, P. (2009). Iramuteq : Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. www.iramuteq.org
Vergès, P. & Bouriche, B. (2001)
=> Pour voir les profils de discours
Les formes les plus fréquemment présentes dans les propos tenus sont représentées ici sous la forme d’un nuage de mots, qui illustre l’univers sémantique global construit, où « donnée » et « territoire » apparaissent comme les deux premiers piliers des discours. Cela donne donc une première indication sur ces deux sujets cœur de notre étude, comme l’indique ce tableau des formes actives les plus présentes dans le corpus, triées par ordre décroissant de fréquence.
PUIS Analyse AFC + CDH (méthode Reinert)
L’Analyse Lexicale par la Classification de l’Ensemble des Segments de Textes (CDH, Reinert, 1983, 1990) permet d’aboutir à la définition de trois classes lexicales, illustrées ici par ce dendrogramme :
Ce graphique représente les différents profils de discours, leur organisation les uns par rapport aux autres, par la forme de l’arbre (branches tracées et les structurant), leurs tailles respectives, et la trentaine de formes actives les plus fréquentes (+/- 2 selon la taille de la graphie des termes).
L’examen tout d’abord de la forme de l’arbre obtenu montre un premier niveau de tendances et nuances.
Le corpus se construit en effet en trois profils de discours différents, répartis dans un premier temps en deux branches principales de l’arbre : la classe 2, à droite et en vert ici, constitue une branche à part. Les classes 1 (rouge) et 3 (bleu) se regroupent dans la seconde branche principale, à gauche de l’illustration. Cette forme démontre que ces deux groupes de discours sont fortement différents, ce que nous allons interroger plus finement par la suite.
La taille des classes indique deux phénomènes à prendre en compte : la classe 1 constitue 39,5% du corpus et la classe 2, 41,3%. Ce sont des scores assez semblables ici, alors que la classe 3, avec 19,1% du corpus, n’en arrive qu’à la moitié. Les classes ne sont donc pas réparties de manière homogènes dans le corpus (plus spécifiquement, il s’agit de leur répartition en segments de texte par rapport au nombre de segments total). Ainsi, cette répartition insiste à nouveau sur l’importance de la branche spécifique de la classe 2, et signale le poids significatif de la classe 1 et moins remarquable de la classe 3. Les propos tenus regroupés dans la classe 3 l’ont été moins fréquemment et moins intensément, c’est donc une classe lexicale à part.
PREMIERES INTERPRETATIONS POSSIBLES (mais ne pas s’étendre cf. l’afc).
Un premier regard force à constater que la forme générale du nuage obtenu est un triangle, formé de trois sommets composés par les trois classes obtenues :
De deux « patates » assez homogènes, la verte et la rouge, opposées toutes deux à la fois sur l’axe 1 (classe 1 rouge à gauche principalement / à cheval à la marge vs classe 2 verte à droite) et sur l’axe 2 (classe 1 rouge en haut, très nettement vs classe 2 verte en bas et à cheval à la marge).
Et de la troisième classe bleue beaucoup moins homogène, plus distendue dans l’espace.
On observe ainsi que la classe 2, verte, est organisée réellement autour des termes principaux (« donnée, bourgogne, base, indicateur… ») d’une manière homogène. Ce profil est suffisamment compact pour attester de sa réalité concrète.
D’une manière comparable, la classe 1, rouge, présente également un certain regroupement, moins compact cependant.
Cette forme en triangle permet de poser les observations suivantes :
Les trois profils de discours sont fortement différents, dans l’ordre décrit ci-dessous,
> La classe 2 verte s’oppose tout d’abord aux deux autres classes, de chaque côté de l’axe 2, le long de l’axe 1,
> Les classes 1 rouge et 3 bleue se distinguent le long de l’axe 2, réparties de chaque côté de l’axe 1.
> Nous obtenons ainsi trois discours distincts à interpréter, selon ces nuances : la classe 2, verte, étant la plus différente des deux autres, est à examiner en premier lieu. Nous aborderons les deux autres par la suite.
dans cette classe, les discours tournent autour des usages des données territoriales, ce qui nous amène à renommer notre classe ainsi. La notion de l’environnement est également confirmée, par la présence des formes repérées. Elles renvoient pour certaines directement à la thématique dont nous pouvons ici repérer une plus grande diversité (« pollution, air, qualité, naturaliste, biodiversité, énergie, nucléaire, espèce, naturel »), soit à des dispositifs liés à la protection de l’environnement et au développement durable (« SINP, OPTEER, Ademe, ARS, INSEE, Alter, observatoire, outil, cigogne »)
Ajoutons à cela le fait que le dendrogramme nous présente cette classe 2 comme formant une des deux premières branches à elle seule, et l’on obtient alors un profil de discours bien spécifique dénotant une culture professionnelle spécifique, ici les usages des données territoriales liées à l’environnement, comme si ces professionnels d’une part présentent une expertise significative et réelle sur ces aspects (donnée – territoire – environnement), et dans le même temps en parlent d’une manière distinctive qui semble exclure les autres discours, en s’accaparant ces notions. Nuançons toutefois cette vision : la teneur des propos peut également
Ce qui est structurellement remarquable dans cette classe 1 c’est le peu d’importance exposée par les mots-clés (relativement aux autres classes, et aux habitudes rencontrées dans ces analyses), les formes représentatives de la classe étant plutôt dans des caractères beaucoup moins frappants que les autres.
Les formes qui apparaissent confirment les premières hypothèses posées précédemment : un champ lexical et sémantique organisé autour de l’action, du projet, avec de nouveaux termes qui apparaissent comme « comité de pilotage, communautaire, accompagner, expérience, bosser, écrire, réunion, habitant, citoyen, élu, maire… ». On est très nettement ici moins sur les données et leurs usages, que dans le champ de l’agir, du faire, au sein de dispositifs d’action de terrain réunissant élus et citoyens.
On a également une vision plus locale du territoire et de ses relations internes, illustrée par la forme « petit » ici en exergue.
On rencontre effectivement des mentions de territoires plus « petits » que dans la classe 2 : des communes (« Besançon, Dijon, Longvic » proches de « petit »), ainsi que « périphérie, agglomération », échelles moins larges que dans la classe 2, on est ici plutôt au niveau local, d’où cette notion d’agir localement.
Ex. (…) l’IRIS par exemple ça, ça vous convient vous pour vos missions et vous trouvez que c’est des fois trop large ou trop petit. (Acteur associatif)
On observe ainsi en fait trois groupes dans cette classe :
Un « paquet » centralisateur, jouant une sorte de rôle de médiateur, autour des notions de social, de dispositif, de service public et d’état,
Un groupe assez éparpillé, tendant à s’échapper vers le haut, autour du champ de la politique de la Ville, des jeunes et des quartiers,
Et enfin le groupe assez massif, tirant vers la pointe inférieure gauche, construisant une isotopie autour de l’éducation et de la cohésion, de la tranquillité, de la réussite, de la sécurité, laissant supposer qu’il y a un lien fort entre ces notions, de cause à effet par exemple.
La notion territoriale est ici très intéressante, car est présente à sa manière dans chacun des profils de discours tenus : plutôt selon des préoccupations régionales dans la classe 2, autour de « petits » territoires dans la classe 1, et propre à la politique de la Ville et des quartiers dans la classe 3.
C’est une autre manière de représenter « la proximité et les relations entre les éléments » d’un corpus (C. Flament, 1981). Pour des questions de lisibilité, nous avons ici sélectionné les termes dont la fréquence est supérieure ou égale à 60.
La taille des textes des sommets est ici proportionnelle à l’effectif de la forme. Plus la forme est présente, plus sa taille sera grande.
La largeur des arêtes, des branches, est proportionnelle à la valeur l’indice retenu, c’est-à-dire ici à la valeur des cooccurrences : plus la banche est importante (large), plus le lien est fort en termes de cooccurrence, donc plus les formes liées apparaissent fréquemment dans des mêmes environnements, segments de texte.
Les acteurs des territoires ne sont pas prioritairement formés à la construction de représentation de leur territoire grâce à de la donnée.
Bien que les acteurs connaissent les données qu’ils manipulent, on peut parler plus largement d’une méconnaissance de la donnée, de ses origines et sources à ses usages.
Des productions locales en termes de représentation du territoire émergent à partir des données nationales, couplées aux données locales, dans une dialectique la plupart du temps à sens unique
Cette représentation permet de prendre du recul entre les méthodes vues précédemment : le nuage de mot initial ne se préoccupe que des fréquences, et ne tient pas compte des cooccurrences.
L’AFC et la CDH opèrent des rapprochements ou éloignements fondés sur les cooccurrences tout d’abord, en tenant compte des fréquences ensuite.
L’analyse de similitude (ADS) représente les similitudes entre des segments de texte où apparaissent plus fréquemment telle ou telle forme, tout en faisant figurer également par la taille des branches l’importance des cooccurrences, donc des apparitions dans des segments de texte, dans des contextes, semblables.
En guise d’illustration, on peut représenter les observatoires sur deux axes, que l’on pourrait diviser en trois en séparant nouvelles données et données propres afin d’accentuer encore leur diversité
Ce qui pose problème, c’est la multiplicité des sources
Comment repérer l’innovant et le local, pour contribuer au niveau national?
Qu’est ce qui est réellement utile sur le terrain ??
Méconnaissance
=> de son origine pour les utilisateurs
mais aussi de son usage pour les producteurs