Compte-rendu de l'atelier "Avons-nous besoin d'Infolab ?", qui s'est déroulé le 15 juin, au 104, pendant Futur en Seine.
Organisé par la FING, programmes Open Data et Innovation DemocraTIC
2. SOMMAIRE
1 – Pourquoi ce sujet ?
2 – Qu’est-ce que l’InfoLab désigne ?
3 - Les différents niveaux de médiation identifiés
4 – Cartographie de dispositifs existants
5 – Quatre scénarios/situation d’usages imaginés par les
participants
3. 1 - POURQUOI CE SUJET…… ?
Nous vivons dans un monde de données, entourés de données, qui parfois nous concernent directement, parfois pas du
tout. Et ce, premièrement sans en avoir même conscience, deuxièmement sans avoir les compétences nécessaires à la
compréhension, l'analyse, la collecte, la manipulation de données, etc.
Quelles sont ces données ? Par exemple :
• Les données du web : le web est un éco-système de base de données interconnectées, où les données se développent de
manière exponentielle (linked data). Une grosse partie de ces données est produite par les traces d'usages sur le web, et
les contenus postés (web2).
• Les données produites par les usages de tous nos "devices" : téléphone, box, équipement électroménager : tous ces
équipements génèrent de la donnée, le plus souvent récupérée directement par les fournisseurs de services, les opérateurs,
et ne transitant même pas par l'usager (qui ne sait même pas que ces données là existent, et disent tant de choses sur lui).
• Les données publiques, ouvertes de plus en plus par les acteurs publics (et par quelques acteurs privés) : données
produites dans le cadre des activités de service public, et qui concernent les territoires, les habitants, etc.
• Les données prédictives : les données produites par l'analyse, l'anticipation, la projection à partir des annonces de co-
voiturage, le site arrive à produire des données prédictives du trafic - façon "bison futé").
• Les données personnelles : toutes les données produites par les usages, et par la consommation (données bancaires,
données de consommation énergétique au domicile, d'usages des téléphones, données de consommation au supermarché,
etc.). Des données qui en disent long sur les usagers, et que les usagers ne possèdent pas tout. Cela alimente le profiling,
le marketing ciblé, etc.
Malgré l'ampleur du développement des données, peu de personnes se préoccupent aujourd'hui des "médiations"
nécessaires aux individus pour exercer leur pouvoir de maîtrise et de décisions.
=> L'atelier "Avons-nous besoin d'Infolabs ?" s'est donné pour objectif d'approfondir les besoins potentiels de
médiation.
4. 2 – QU’EST-CE QU’ON ENTEND PAR « INFOLAB » ?
Lire l’article collectif : http://www.internetactu.net/2012/05/15/avons-nous-besoin-dinfo-labs/
A ce stade de la réflexion, nous désignons par InfoLabs
Des moyens – outils – médiations,
- à la fois techniques – humains – espaces-lieux,
- accessibles et structurés de manière à ce que les acteurs puissent être en capacitéde s’en saisir et d’agir par eux-
mêmes,
- de façon individuelle ou collective.
C’est-à-dire de :
- (co-)produire des données ;
- (ré-)utiliser des données et les transformer en informations utiles.
3 – AUTOUR DE LA PRODUCTION – RÉUTILISATION - MANIPULATION DE
DONNÉES, QUELS SONT LES DIFFÉRENTS NIVEAUX DE MEDIATION
NECESSAIRES ?
- Sensibiliser aux enjeux de l’Open Data et faire connaître les jeux de données de disponibles ;
- Identifier des données ;
- Identifier les sources, savoir les analyser, les comprendre ;
- Savoir collecter des données, les nettoyer, les agréger ;
- Savoir analyser des jeux de données, trouver les congruences, les recoupements, et savoir analyser des croisements
de données => statisticiens, analystes ;
- Savoir réaliser des infographies, datavisualisation ;
- Apprendre à décrypter des images, des graphes.
5. 4 – CARTOGRAPHIE DES DISPOSITIFS DE MÉDIATION EXISTANTS
Un certain nombre de dispositifs existent aujourd’hui, qui proposent des formes de médiation multiples (à la fois dans
le champ de la production et de la réutilisation de données) :
- soit durable, soit éphémère, soit ponctuel ;
- soit en présentiel, soit en distanciel ;
- soit de manière gratuite, soit de manière commerciale ;
- portés par des acteurs publics, ou privés, ou associatifs, ou acteurs de la recherche ;
- à destination d’individus, de collectifs, d’entreprises… ;
- proposant la manipulation de données publiques, privées, personnelles, ouvertes, API, ou « fermées ».
Voir la cartographie suivante. Cette liste n’est pas exhaustive, et peut être complétée, commentée : sur le
réseau social de la FING
7. 5 – DES SCÉNARIOS/ SITUATIONS D’USAGE POSSIBLES
Voici quelques idées, avancées par les participants, de situations d’utilisation des données. Celles-ci nécessitent toutes des
formes de médiation : soit de l’ordre de l’outil, soit des médiations humaines (de compétences, d’expertise, etc.).
• Outil de visualisation et d’analyse des données relatives aux subventions attribuées par les acteurs publics aux
associations, ou aux dotations des conseils de quartier ;
• Dans le cadre de projets urbains : pour organiser la concertation entre acteurs publics, privés et habitants ;
• Autour des données électorales : pouvoir analyser soi-même des résultats électoraux en recoupant des données, en en
croisant (par exemple avec des données sociaux-économiques, etc.) ;
• Outil de visualisation de la fréquentation des lieux publics et ainsi pouvoir mieux décider à quelle piscine on va, à quel
moment, etc. ;
• Travailler autour d’une éthique de la gestion de données : comment s’y prendre, à quoi faire attention, etc.
Ces médiations peuvent être éphémères, locales, ouvertes, liées à des projets, professionnelles, invitant au bricolage, etc.
4 situations d’usages ont été approfondies et développées.
1 - L’infolab comme outil de concertation dans un projet urbain.
2 – La « manufacture des données » : une fabrique d’opinion à disposition des citoyens
3 – Le « Data Label »
4-
9. 1/ Situation de départ : un projet de 2/ Découverte de l'infolab : un lieu de partage de données
concertation est mis en place
Papa actif dans la vie de l'école de ses enfants, Joséphin sait qu'un
Joséphin, habitant de Beaulieu, aperçoit sur des terrains repérés pour l'installation de l'incinérateur est très
son arrêt de bus habituel, une souvent fréquenté pour des classes vertes.
communication publique au sujet du projet Lors d’une réunion de concertation, les animateurs présentent aux
d'installation d'un nouvel incinérateur de habitants « L’infolab » : un outil mis à disposition, et agrégeant toutes
déchets dans le département. les informations et les données relatives au territoire impacté, aux
Une concertation avec les habitants est activités qui y sont menées. Tout le monde peut participer à alimenter
ouverte. en le dispositif en études, données brutes, informations, et faire valoir
Son premier sentiment est celui d’un refus un point de vue.
net « Pas question d’avoir un incinérateur Ainsi, à côté des énormes rapports de consultants ou de
près de chez soi !». Puis il lit sur Internet controverses scientifiques, il aperçoit des données et des informations
toutes sortes d’informations, parfois de tout type relatives à son territoire, publiées aussi bien par les
contradictoires : les études sur le traitement acteurs publics, que par des associations locales, des habitants :
des déchets sont nombreuses et présentent • une association de randonneurs a publié les cartes de leur itinéraires
tantôt l'incinérateur comme une promesse régulièrement empruntés…
énergétique, tantôt comme une catastrophe • un groupe d'étudiant en biologie a partagé ses travaux sur la flore
écologique de l'autre... environnante du canton d'à-côté
• la gendarmerie a fourni des informations sur le réseau routier du
« Pourquoi un tel projet ? », « et mon avis à territoire et les routes abandonnées.
moi, il compte ? ». Assailli de doutes et de ...
questions, et se sentant directement Il est très simple de publier soi-même des informations, des données,
concerné, Joséphin décide de participer à la grâce à l’aide en ligne, très didactique (vérification des formats,
concertation. conseils méthodo sur le renseignement des données, outils mis à
disposition...) Mais il est aussi possible de venir avec lors des
réunions « Discutez de vos données ».
10. 3/ De quoi s'agit-il ? : un outil favorisant la mise en
débat et une vision enrichie d'un territoire 4/ Apports et freins
La plateforme de partage de données est mise en place par • Enrichissement du projet technique : les données
le prestataire de la concertation. Ce tiers-garant assure les partagées, crowdsourcées, apportent une vision plus
conditions du bon déroulement des réunions publiques, fine du territoire. Ces « savoirs d'usage » peuvent
l'équité des temps de paroles entre parties prenantes. Plus servir d'indicateurs au maître d'ouvrage.
encore, la complexité autour du traitement des données
impose un vrai travail d’accompagnement et de pédagogie. • Enrichissement du débat : la donnée partagée,
Les informations sont nettoyées, triées par thématiques, contextualisée et mise en regard avec d'autres
classées selon leur catégorie (géographique, statistique...), données apportent des arguments supplémentaires.
mélangées avec les contributions en ligne. Des graphiques Les citoyens peuvent « peser » dans le débat.
et des cartes OSM sont générées petit à petit, avec les
corrections de certains habitants. Cela permet à chaque • Le problème de la prise en main de la donnée,
contributeur de détailler et d’argumenter son point de vue. surtout en «direct » demande la présence d'un expert.
Joséphin a travaillé préalablement avec cette équipe pour • En question : la neutralité de l’expert qui aide les
donner une datavisualisation dans le temps et dans habitants à publier leurs jeux de données, et à en
l’espace du jeux de données qu’il possédait sur les activités construire une analyse argumentée.
des classes vertes les dix années précédentes. Lors d’une
réunion « Discutez de vos données », proposées aux Le problème de la qualité : comment garantir des
habitants, il a pu présenter en 15 min aux services données pertinentes et fiables ?
techniques accompagnant le projet l’impact d’un tel projet
sur les activités vertes des écoles primaires (obligation
d’aller beaucoup plus loin, risques sanitaires, etc.).
Les productions sont récupérées par le prestataire et
soumises aux experts génie civil du projet. Les discussions
en ligne et des réunions informelles sont organisées entre
habitants.
Les arguments les plus polémiques bénéficient d'une
exposition médiatique dans la presse locale. Le débat se
poursuit intégrant toutes ces ressources qui donnent « à
voir » les vécus de chacun.
11. S2 –
« LA MANUFACTURE DES DONNÉES » : UNE
FABRIQUE D’OPINION À DESTINATION DES
HABITANTS
12. 1/ Situation de départ : une interrogation personnelle….
Jean, un citoyen vigilant et inquiet de l’évolution de l’Europe, cherche à se faire une opinion sur la crise économique, et à
mieux comprendre les mécanismes de la monnaie et de la dette en Europe.
La lecture de la presse ne lui permet pas de répondre complètement à ses interrogations, et il n’y trouve jamais les chiffres
économiques / les données brutes, à partir desquelles il aimerait se forger une opinion personnelle. Son ambition est aussi
d’alimenter son blog personnel, et de partager ses analyses. Mais avant de se lancer, il aimerait approfondir la question…
2/ Découverte de l'infolab « La Manufacture des données »
Plusieurs voies de médiation s’offrent à lui :
Il décide d’aller dans un centre de documentation sur les affaires européennes. La Documentaliste lui présente toutes
les coupures de presse, les études, les rapports que le Centre a collectés. Cela le documente, l’aide à y voir un peu plus
clair, mais très vite il se rend compte que pour continuer à construire sa réflexion, et à convaincre d’autres personnes que
lui, il lui faudra donner à voir des chiffres multiples, et de nouveaux rapports entre eux. Bref à construire une véritable
démonstration. Or, s’il bloggue volontiers sur son temps libre, il n’est pas non plus étudiant, et ne peut pas y passer ses
journées entières….
Il a découvert une start-up qui propose (aux acteurs publics, entreprises et même aux particuliers) des prestations
d’analyses de données. Mais ne connaissant pas l’orientation politique ou idéologique de cette structure, il n’a pas confiance
en cette forme de médiation. Il n’a pas l’argent non plus pour payer la prestation. Il y renonce.
Il va voir dans un espace de co-working, où il sait qu’on pourra l’aider à rentrer en contact avec des personnes ayant les
compétences nécessaires, et qu’il n’a pas (développeur-statisticien, infographiste…). Mais il n’arrive à convaincre personne
de répondre à sa demande : il ne s’agit pas d’un « projet professionnel ou d’un projet collectif » au sens fort du terme… Bien
que ça puisse le devenir, pense-t-il…
Il va dans un EPN : les animateurs l’aident à développer des recherches sur le web pour identifier de nouveaux jeux de
données que la Documentaliste n’avait pas référencé. Mais n’étant pas spécialistes du sujet, ils ne peuvent pas
l’accompagner plus loin. C’est eux qui indiquent à Jean l’existence de la « Manufacture de données ».
13. 3/ De quoi s'agit-il ? 4/ Apports et freins
Ce dispositif rassemble des compétences diverses (analystes • Modèle économique de ce dispositif :
statisticiens, journalistes, développeurs, infographistes- • modèle associatif citoyen fonctionnant par
designers). Ces personnes se structurent en petites équipes bénévolat, par échanges de compétences
projet en fonction des demandes qui leur sont faites. Ils proposent • modèle mixte : subventionné et faisant peu
3 modes de travail possibles : payé les prestations aux citoyens, mais faisant
payé plus chers les entreprises ou les
ð P1 : Construire un dossier de presse argumenté organisations ;
L’équipe fournit à l’usager des analyses déjà construites, par • modèle variable selon la prestation fournie
plusieurs bords « idéologiques ». Un peu à la façon des (possibilité 1, 2 ou 3).
journalistes, et en allant un cran plus loin que les documentalistes,
ils mettent en perspective les différents analyses identifiées, et
aident l’usager à décrypter les sous-entendus idéologiques sous- • Peut-on normer la recherche d’informations et le
jacents ; temps de construction d’une réflexion ?
ð P2 : Manipuler des données • Qui cela intéressera-t-il au-delà des étudiants et des
l’équipe collecte pour l’usager différents jeux de données : ils lui catégories intellectuelles ++ ?
expliquent d’où viennent les données (explication sur les sources :
qui sont les fournisseurs, quel présupposé cela peut-il induire,
etc.) ; ce qui les caractérise (panel concerné, durée, récurrence,
périmètre, etc.) ; ils livrent quelques infos graphies primaires
(graphiques, etc.). L’usager, à partir de ces matériaux, doit encore
analyser les informations, et construire ses analyses.
ð P3 : Devenir rédac chef !
c’est le parcours que choisit Jean
L’équipe l’accompagne sur un temps limité (3 fois 3 heures), pour
analyser les matériaux disponibles récoltés par eux et par lui.
Jean devient, le temps du projet, une sorte de « rédacteur en
chef », disposant d’une équipe à son service. Et il construit ainsi
son propre « dossier de presse personnel » sur la problématique.
14. S3 –
« LE DATA LABEL » : pour des données de qualité
15. 1/ Situation de départ
Léa se déplace en vélo dans sa ville pour ses parcours maison-travail mais également pour ses parcours personnels. Elle
souhaite bénéficier d’informations fiables s sur la géolocalisation des arceaux de stationnement dans sa ville. Pour l’instant
ces informations ne sont disponibles nulle part….
Elle contacte les services de la Voirie de la Ville. Un agent public la renvoie vers des fichiers pdf en ligne qui indiquent les
différents points de localisation. Il lui explique qu’elle peut trouver quelques informations complémentaires sur la plateforme
de données ouvertes que la Ville a ouvert depuis peu. Rien n’est proposé en revanche en matière de datavisualisation des
données liées aux mobilités douces, car les jeux de données fournis par l’opérateur de transport sont incomplets. Le contrat
passé avec eux s’étalant sur plus de 5 années encore, il n’est pas possible d’envisager autre chose…
Faute de mieux, l’agent la met en contact avec deux associations “Vélos Citoyens” et DataLabel.
En consultant la plateforme de données, Léa s’aperçoit rapidement que les données ne sont pas homogènes selon les
quartiers de la ville. C’est un chantier gigantesque 1) que de devoir compulser des fichiers de natures différentes : excel,
pdf. ; 2) de combler les données manquantes des différents quartiers.
2/ Découverte de l’InfoLab “Data Label”
Léa prend contact avec les deux associations.
- L’association « Les Vélos citoyens » lui explique qu’ils sont en train d’élaborer une cartographie des pistes cyclables dans
la ville. Mais ils ne veulent pas ouvrir leurs données au grand public car elles sont de nature très diverses, dépassent la
simple cartographie des pistes, et ne sont pas suffisamment fiables, d’après eux. Pour passer à l’échelle, il faudrait que la
co-production de données soit beaucoup plus importante.
- Léa rencontre ensuite l’InfoLab “DATA LABEL” : une association réunissant des activistes du partage des données :
citoyens, agents de collectivités territoriales, animateur du DATA LABEL, bénévoles numériques. Les membres du DATA
LABEL vérifient les jeux de données en notant leur niveau d’exhaustivité et d’interopérabilité. Ils lancent régulièrement des
appels à contribution ou enrichissement, pour croiser les données officielles avec des données issues du terrain.
Léa comprend que la consolidation, le partage et la publication des données liées aux mobilités douces passeront par le
travail en commun de ces différents acteurs : la Ville, l’association Vélos Citoyens, et le DataLabel. Elle décide de les mettre
en contact et de devenir bénévole au sein du DataLabel.
16. 3/ De quoi s'agit-il ? 4/ Apports et freins
Le collectif DataLabel joue un rôle d’agrégateur et de facilitateur. Les apports:
Agrégateur car il réunit dans le cadre de ses actions des acteurs - répondre au hyatus entre les sachants et les autres,
publics, associatifs, privés, et des bénévoles citoyens pour l’association DataLabel permet d’inclure différents
travailler à une plus grande qualité des données. acteurs et ainsi d’ouvrir l’Open Data à des néophytes.
Facilitateur car les bénévoles vérifient les jeux de données - apparition du bénévole numérique qui viendrait
versés, les mettent dans un format standart et ouvert permettant compulser des fichiers numériques mais on peut
leur réutilisation et leur croisement avec d’autres données. imaginer associer des collectifs de marcheurs qui au
cours de leurs sorties vérifieraient des jeux de
Les collectivités jouent le jeu d’indiquer un niveau de qualité et de données…
fiabilité des données à la source. DATALABEL participe à faire
augmenter la qualité (richesse, mise jour) des jeux de données. - La maîtrise des données par les collectivités
territoriales est une demande forte. La labellisation
conjointe entre les collectivités et la société civile
Outre son réseau de bénévoles, la force du collectif DATA LABEL permet une transparence dans leur construction et
est de mobiliser des communautés pour aller vérifier les données donc une appropriation, ainsi qu’un enrichissement.
ou les enrichir (cartoparties, opération de crowdsourcing, etc.). Cette étape permet à deux acteurs de se connaître et
de mesurer les contraintes de chacun. Cela peut être
Le collectif DataLabel joue le jeu de reverser les jeux de données le point de départ de nouvelles coopérations.
travaillé et vérifié (mais non exhaustif), sur la plateforme publique,
en lui attribuant un label. Celui-ci indique le degré de vérification, Les freins :
de remaniement, d’enrichissement pra crowdsourcing, …
- la difficulté de constituer des collectifs de citoyens
suffisamment nombreux, compétents pour échapper
Ayant participé au processus de labellisation, Léa a ainsi pu aux « professionnels » de la participation
convaincre et aider l’association à alimenter une carte « Vélos
citoyen », via Open Street Map. - la prise en main des données demande un niveau
expert pour son analyse, sa manipulation
18. 1/ Situation de départ
Julien, un data journaliste en herbe, souhaite se faire connaître par une publication qui attire l’attention.
Il a l’idée de publier un article à la fois pédagogique et accrocheur sur les inégalités d’accès à l’enseignement supérieur
dans le monde. Il décide pour cela d’aller rencontrer l’UNICEF et de les convaincre de lui donner accès à des jeux de
données sur l’éducation, complétant celles trouvées sur le site de l’OCDE et de la Banque mondiale.
L’UNICEF est partant, sous la condition d’interpeller suffisamment le lecteur. Julien se rend compte qu’il lui faudra manier
le texte et les images pour être percutant.
La datavisualisation lui apparaît le moyen idéal pour faciliter la diffusion des analyses chiffrées, et accroître l’effet sur le
lecteur.
Ses compétences graphiques sont limitées, mais il sait que la Ville regorge de graphistes indépendants. La semaine
prochaine se tiendra justement un « data-Apero » auquel il décide de se rendre.
Il y découvre avec surprise un espace partagé de compétences dédié à la manipulation de données, appelé « Atelier de
données ». Concrètement, lors du data-Apéro, cela prend d’abord la forme d’un poster avec deux colonnes affichant -
je cherche et je propose. Via un Qrcode, les participants accèdent à l’espace vivier de compétences, au site web
et aux conservations twitter. Julien pénètre alors dans « la communauté ».
2/ Constitution d’un infolab éphémère
Un designer de services et un programmeur se sont signalés comme étant disponibles pour des collaborations de data-
visualisation. Après une première rencontre, et des envies communes, ils décident d’informer « l’Atelier de données » et
l’UNICEF qu’ils vont organiser ensemble un workshop éphémère, ouvert à des participants externes éventuels. D’autres
participants pourront venir se greffer, cela décuplera les forces. Les projets seront publiés en licence Creative Commons.
L’UNICEF comprend alors la force de frappe possible autour de ce projet, et décide de soutenir le workshop en finançant
les meilleurs datavisualisations.
L’Atelier leur propose un espace de coworking adhoc pour accueillir la rencontre. La fonction agenda du site permet de
diffuser cette information et de faire connaitre au réseau le projet sous-jacent. Le sujet a attiré l’attention d’un groupe de
lycéens de la ville qui souhaitent relayer l’initiative sur leur journal interne.
Cela a fait effet boule-de-neige, et la presse locale s’y est intéressée à son tour. Julien réussit ainsi à construire une
datavisualisation, accompagné d’un dossier d’analyse, qui trouve des échos multiples : presse locale, réseau UNICEF,
journal du lycée, etc.
20. 3/ De quoi s'agit-il ? 4/ Apports et freins
L’Atelier de données constitue avant tout une dynamique Apports :
collaborative. Il crée du lien en réseau, en mettant en relation les • Ce dispositif « léger », réunit une certaine
compétences les unes avec les autres, favorise les rencontres communauté d’acteurs, prêts à s’investir dans des
entre des personnes, des ressources, et permet de croiser les projets, des actions.
idées. • Il favorise la collaboration entre des acteurs qui
ne se connaissaient pas au départ, en permettant
Il s’incarne comme un canal d’information partagé. Du poster au le croisement des idées, la recherche de
site internet le dispositif de l’atelier favorise la communication et la compétences.
collaboration offlin entre les différents acteurs. • Il maille réseau physique et réseau virtuel.
Mais il initie aussi des rencontres physiques, en lien avec un • Il fonctionne sur du donnant-donnant : chacun
réseau de partenaires d’espaces de co-working. Le dispositif tisse apporte son contribution.
des liens entre la rencontre et le réseau physique et virtuel. • Le caractère ouvert et informel des rencontres
permet à tout type d’acteurs volontaires d’y
Il favoriser l’émergence d’infolab éphémère. prendre part (associations, acteurs privés, publics,
etc.)
Le dispositif « Atelier de données » est animé spontanément par
la communauté. Il ne nécessite pas d’animateur particulier. En
revanche il prend appui sur des formats de rencontres déjà Freins :
existants : DataApéro, CAféCarrefour, Hackaton, BarCamp • Le dispositif nécessite un financement a minima
« initial » : mise en place de la plateforme
collaborative, hébergement du site, etc.
• Le dispositif adresse un public de spécialistes
essentiellement, et déjà habitués à ce type de
relations, d’interactions, de collaborations.
• Il est invisible pour le grand public.
• Ce dispositif ne permet pas d’accompagner des
projets dans le temps.