SlideShare une entreprise Scribd logo
La révolution des données
numériques
Une conférence de Simon Chignard et Charles Nepote,
proposée par la Fing,
Propos liminaires
De quoi parle-t-on ?
Données ? De quoi parle-t-on ?
Des atomes d’information structurés et factuels :
mesures, statistiques, description, coordonnées, horaires,
budgets, données en temps réel, etc.
Plus précisément, par exemple :
hauteur, longueur, durée, délai, matière, quantité,
consommation, prix, températures, vitesses, etc.
Données <> médias
Données <> documents
Données <> informations
Données numériques ?
Atomes d’information manipulables sans transformation par des
systèmes informatiques
Données numériques ou pas ?
Données numériques ?
Atomes d’information manipulables sans transformation par des
systèmes informatiques
Données numériques
ou pas ?
La donnée: un objet difficile à saisir
La donnée c’est intangible (on ne peut pas la toucher).
La donnée c’est toujours construit, contrairement à ce que laisse
croire l’étymologie du mot (latin datum: ce qui est donné, qui ne
fait pas débat, ce qui est exogène).
Yann-Moulier Boutang: “se méfier du naturalisme des données”
Quantifier (au sens: mettre en nombre), c’est faire des choix,
établir des priorités, … Même les unités de mesure sont des
conventions construites (ex. 1 mètre)
Et si la donnée était une matière
première… ce serait ?
Portrait-robot de la donnée comme
matière première
Une matière première de plus en plus disponible
que l’on produit en plus grande quantité, de manière consciente ou
inconsciente (“traces numériques”)
dont les coûts de production, de collecte et de stockage diminuent
chaque année
Une matière qui ne s’épuise pas quand on la consomme
qui prend de la valeur quand elle circule, pas quand on la stocke
(thésaurisation)
Une matière dont la valeur est souvent dans la réutilisation, pas
uniquement dans l’usage initial
1. Un nouveau monde de
données
Le paysage des données ?
1984
Réseau Sentinelles
2008 - Google Flu Trends
1984 - 2015
Sentinelles, Google Flu Trends: même ambition mais pourtant
source de données, intentionalité, méthodes différentes
coeur de métier vs. sous-produit de l’activité principale
porté par l’acteur public vs. par une multinationale
...
1984-2015
On passe d’une donnée rare à une donnée abondante
Ce qui change (1) : la production
Modes de production et d'exploitation ont fortement évolué
Puissance de traitement, de stockage, de mise en réseau
Finesse et multiplication des capteurs
Informatique personnelle (dont base de données)
Capteurs « grand public » (météo, santé, GPS, etc.)
... et vont continuer d'évoluer
Capteurs personnels toujours plus fins et touchant toujours plus
de domaine (montre verte, capteurs ingérables)
Internet des objets
“Digital labour”
Mesure de soi (quantified self)
… vers un nouveau web : le web des données
Ce qui change (1) : la production
Bracelet de mesure corporelle
jawbone.com
Ce qui change (1) : la production
La montre verte
Des capteurs moins chers
tomorrow-lab.com : DIY Traffic viewer
Ce qui change (2) : les producteurs
Le crowdsourcing : la coproduction des données par les “foules”
Des pratiques anciennes toujours plus poussées en botanique,
astronomie, etc.
Un champ du crowdsourcing qui paraît sans limite
OpenStreetMap dans la cartographie
Données environnementales (montre verte)
Cartographie des caméras de surveillance
Capteurs « do it yourself » en tous genres pour moins de 100€ :
comptage d'automobiles, mesures de consommations énergétiques,
etc.
Multisourcing (privé-public / privé-privé / public-privé-public)
Ce qui change (2) : les producteurs
L'extraction des données des
infobox de wikipédia
+
pages de catégories listant les
œuvres conservées dans tel
musée
=
reconstitution possible de
véritables petits catalogues des
oeuvres
openstreetmap.org : de qualité fréquemment supérieure à la concurrence
Ce qui change (2)
OpenFoodFacts
nest : thermostat apprenant :
collecte vos données d'usage pour anticiper vos besoins
Ce qui change (2)
asthmapolis : capteur connecté d'inhalation de ventoline et réseau communautaire au
service des asthmatiques (alerte, cartographies...)
Ce qui change (1 et 2) :
production/producteurs
Des producteurs toujours plus nombreux
Individus de tous types : adultes, enfants, professionnels, amateurs, etc.
Organisations de tous types : entreprises, acteurs publics, associations,
communautés (parfois informelles)
Des producteurs militants aux motivations les plus diverses
Des “malgré eux”, obligés de produire des données pour accéder
à un service
Des M. Jourdain, qui produisent des données sans même le
savoir
Qui ne produit pas de données ? Qu’est-ce qui ne produit pas
de données ?
Ce qui change (3) : la quantité, les
big data
Une quantité de données accumulée chaque jour plus
vertigineuse
Cette quantité autorise de nouvelles perspectives
construire des modèles ne sert plus à rien ...
... les réponses sont dans ces très grands volumes de données
La “fin de la théorie” ? (Chris Anderson)
Ce qui change (4) : la pluralité des
sources
Plein de manières différentes de mesurer le même phénomène
(les “proxies”)
Exemple: “Combien de touristes sur les Champs Elysées ?”
Enquête quantitative sur le terrain
Analyse des transactions de cartes bancaires (commerces)
Analyse des logs de connexion de téléphonie (Orange, SFR)
Repérage des photos prises sur les lieux et publiés sur Flickr
… mais aussi à partir des tweets (cf. Tourists vs. Locals page suivante)
Conséquence : les données-monopoles sont de plus en plus
rares et bien souvent, si vous n’ouvrez pas vos données, d’autres
le feront à votre place
Tourists vs. Locals
Ce qui change (5) :
1 donnée => de multiples usages
Une donnée n’a plus un seul usage pré-déterminé (valeur de
réutilisation)
On parle d’autonomisation de la donnée
Une donnée génère également d’autres données qui auront
d’autres usages (ombre portée)
Certaines données racontent beaucoup d’autres choses que
leurs usages premiers :
Analyse des logs de connexion de téléphonie (Orange, SFR)
Contenus publiés sur les grandes plate-formes web 2.0 (Flickr, Twitter,
Facebook, Foursquare, etc.)
les requêtes passées aux moteurs de recherche
le wifi de votre téléphone
etc.
Ce qui change (5) :
1 donnée => de multiples usages
Projet BANO : base adresse nationale en open data, illustration de la pluralité des
sources (cadastre + open data local + contributeurs OSM)
Ce qui change (6) : l’ouverture des
données (open data)
Une idée de départ : les données produites par les acteurs
publics devraient être réutilisables
Une idée déjà à l’oeuvre dans les communautés “Open*” :
Wikipédia, Wikidata, OpenStreetMap, OpenFoodFacts, etc.
Une idée qui s’étend aux entreprises
Un champ qui booste l’innovation car les données sont rendues
très accessibles
Ce qui change (2+4+6) : l’ouverture
des données (open data)
pluralité des producteurs
(dont extension des co-producteurs)
+
pluralité des sources (proxies)
+
sources en open data
=
Si vous n’ouvrez pas vos données,
d’autres le feront à votre place
Ce qui change (7) : les données liées
des données exprimées dans une même "langue" (RDF)
des identifiants uniques réutilisables pour chaque donnée (URI).
Ex. http://data.bnf.fr/11907966/victor_hugo/
des requêtes multi-sources indépendantes des outils (SPARQL)
des bases de données reliées entre elles
bien adapté aux grands volumes de données froides : données
encyclopédiques, bibliothéconomie, muséographie, référentiels
administratifs, etc.
Ce qui change (7) : les données liées
Ce qui change (8) : les données,
éthique et privacy
On dépasse le cadre des données personnelles stricto sensu :
des données qui deviennent réidentifiantes
La société face aux défis du big data : vers de nouvelles formes
de régulation
Par ailleurs, toutes les données sont-elles bonnes à partager
Ce qui change : nouveau paysage,
nouveau vocabulaire
Les data : les données. La data : le matériau
Le crowdsourcing, une entrée par le mode de production :
données collectées collaborativement, par les « foules »
Big Data, une entrée par la quantité et la technique : « grosses
données », volumes de données TRÈS importants
Small Data : des données pertinentes adaptées à la
compréhension humaine, une entrée par les usages et usagers
Open Data vs Closed Data (peu utilisé), une entrée par le droit :
des données librement réutilisables (+ faciles d’accès)
Self Data : des données relatives à soi, une entrée par la
destination
Le quantified self : “quantification de soi”, une pratique de collecte
de données par soi-même, sur soi-même
Que fait-on avec les
données ?
Plein de trucs !
On répond à des questions
Quel est le prénom masculin le plus donné à Nice au cours des 5
dernières années ?
Combien de femmes ont une licence sportive de handball dans
ma commune ?
Quelle commune de France accueille le plus grand nombre de
personnes redevables de l’ISF (impôt de solidarité sur la fortune)
?
Qui sont les 200 premiers titres de presse aidés par l’Etat en
2013 ?
Combien d’accidents corporels en 2012 sur la route que
j’emprunte tous les matins ?
...
On prend des décisions
Dois-je ouvrir mon magasin dans cette rue du centre-ville ?
Est-ce que cette formation me permettra de trouver un emploi
rapidement ?
Est-ce que c’est rentable d’investir dans des panneaux solaires
dans ma commune ?
Est-ce qu’il vaut mieux prendre les avions d’Air France ou ceux
d’Easy Jet entre Nice et Paris ?
On représente des phénomènes
complexes
Visualisation de l’offre de transports de Rennes dans une vidéo
On représente des phénomènes
complexes / on débat
La répartition des aides à la presse en France (Samuel Azoulay à
partir de données data.gouv.fr)
On représente des phénomènes
complexes / on influence
Les morts par arme à feux
ont baissé après le vote
de la loi “Stand Your
Ground” ?
On représente des phénomènes
complexes / on révèle
Les noms de rues comme
révélateurs des inégalités
hommes-femmes ?
On vous fait des recommandations
On essaie de prédire l’avenir
FiveThirtyEight
pause 5’
à suivre : les données ce n’est pas trivial
Les données, c’est pas
trivial
Les difficultés que l’on rencontre,
les défis que cela nous pose
L’objet “donnée”
On ne croise pas des données tous les matins en sortant dans la
rue
On ne peut pas “toucher” des données (intangible)
Un objet ingrat, aride
Des données de qualité variable (1)
Des données de qualité variable (2)
Les Mairies de France ? (par Christian Quest)
Des données peu standardisées
Touche la plupart des données hors quelques domaines comme :
les transports (GTFS)
les données géographiques (GPX, KML, etc.)
les oeuvres (Dublin core, MARC, etc.)
...
Un des gros problèmes de “l’offre” actuelle
Des conséquences lourdes
pas de capitalisation des savoirs techniques
des données difficiles à croiser (ex. prénoms)
un marché et des usages qui peinent à décoller
Des données pas faciles à trouver
Les liens profonds sont souvent mal référencés sur les moteurs
de recherche, il faut donc d’abord identifier la source qui peut
héberger les données…
Exemple: quelle est la qualité des eaux de baignade des plages
de Vallauris - Golfe Juan ?
recherche sur Google
site de la municipalité avec données datant de 2011 …
un site dédié au niveau national, mais difficile à trouver
Des données avec lesquelles on
raconte n’importe quoi ?
Source des données:
OMS via Gapminder
Corrélation ne fait pas
causalité !
Des données pas faciles à manipuler
Gros fichiers : exemple fichier des licenciés sportifs par commune
de France : fichier .csv de 120 Mo
TRÈS GROS fichiers : exemple, le DAMIR (Dépenses
d'assurance maladie hors prestations hospitalières)
un fichier de 30 Go pour une année
1 milliard 500 millions de lignes pour 6 ans
formats techniques (OSM)
L’open data a-t-il changé
tout ça ?
Les transformations de l'open data
Open Data - Rencontre Bi-départementale des EPN 26-07
Ce que l’open data a effectivement
produit (5 ans plus tard)
Les acteurs publics, un des premiers réutilisateurs : un des succès
indéniables et un vrai facteur de modernisation de l'action publique
Pour les acteurs publics, également, un rôle “d’enabler” (capacitation)
assumé et lisible : revalorisation de l’action publique, rapprochement
avec les nouveaux acteurs économiques, etc.
Quelques vrais services utiles aux populations
Les données comme objet de débat
La possibilité de jouer, d’explorer, de manipuler de vrais données pour
acculturer et faire grandir tous les acteurs
Un paysage des usagers très
mitigé
En deuxième lieu, un profil type : un individu, jeune, mâle, geek
Souvent militant
Assez souvent étudiant, en libéral ou en inter-contrat
Recherchant une visibilité ou du fun : méritocratie, montrer son savoir-
faire pour se « vendre », s'amuser...
D'autres publics présents mais très minoritaires
Des start-ups, quelques PME « techno », des chercheurs, à peu près
aucune PME traditionnelle
Peu de business « pure » open data
Peu ou pas de femmes, d'enfants, de personnes âgées
Peu d'association, de médias
… un paysage des usagers qui
s’explique aisément
Aridité des matériaux : de sèches colonnes de chiffres et de code
Une pertinence et une qualité des données aléatoires qui oblige à un
gros travail de retraitement et/ou de croisement
Une importante barrière technique à l'usage
Un vrai manque de lisibilité du côté de l'offre :
Des données pas assez présentes là où sont les gens
Un manque d'éditorialisation qui ne facilite pas la compréhension
Des sachants plus portés sur le code que sur de la médiation
Une acculturation aux données encore faible
Capacitation du plus
grand nombre
Écosystème riche
et ouvert
Une appropriation
large par l’ensemble
du tissu économique
Une réelle
appropriation de
l'économie sociale et
solidaire
Donner du pouvoir à
ceux qui en ont déjà
Un sujet de spécialistes
en vase clôt
La naissance de
monopoles industriels
De meilleurs services
pour des citoyens aisés
et insérés
La médiation aux données, besoin
criant mais peu adressé
Très peu d’acteurs
EPN à travers les cartoparties
les “cantines” numériques, espaces de co-working, etc.
quelques très rares spécialistes (ANACT, Altercarto…)
Quelles médiations
la mode des événements “en cloche” : hackathons, concours, camps,
cartoparties, etc.
une vraie stimulation de l’écosystème local ...
... mais beaucoup de déchet, le soufflé retombe vite
un vrai besoin de médiations continues
La médiation aux données :
quelques principes
Rendre lisible, tangible, sensible, à l’échelle des individus
Manipuler, apprendre par le “faire” : tant qu’une personne n’a pas
manipulée, elle ne se rend pas compte de ces problèmes
Produire des données : un bon producteur/ouvreur de données est un
bon réutilisateur
Une démarche ouverte et collective, parce qu’avec des choses si
neuves l’apprentissage collectif est tellement plus efficace
Le nouveau monde de données requiert de nouvelles médiations qui
sont en cours d’invention, de test.
???
En 1973, 16000 habitants de
Mazamet et la Prévention routière
livrent une campagne qui marque
toute la France.
Développer des outils
Initier,
expérimenter et
déployer
des méthodes
de médiation
autour de la
donnée
Le 02 octobre 2015 HappyTIC 2015 – Grenoble
#Dataviz_rra : exemple d’outils
Le 02 octobre 2015 HappyTIC 2015 – Grenoble
Développer les ressources
Le 02 octobre 2015 HappyTIC 2015 – Grenoble
Favoriser l’émergence d’un réseau d’acteurs
impliqués dans l’ouverture, la diffusion, la
collecte, le traitement et la médiation de la
donnée
Développer les usages
Le 02 octobre 2015 HappyTIC 2015 – Grenoble
Convaincre les
acteurs publics de
l'intérêt de
l’ouverture et de la
réutilisation des
données.
Open Data - Rencontre Bi-départementale des EPN 26-07
L’infolab, un “lab” ouvert pour les
données
Dès l’origine pensé pour défendre 3 valeurs :
ouvert
accessible
continu
3 grandes missions de médiation :
initiation/formation
“incubation”
débat
Une très grande variété de formes : thématique, en réseau, de
branche, spécialisé sur des publics, etc.
Parmi les résultats de la campagne
Infolab
Parmi les résultats de la campagne
Infolab
Un travail sur les compétences relatives aux données
Une charte des infolabs en version beta
Un portail de référence pour la communauté : http://infolabs.io
En cours de finalisation ou publication :
La conception/test/documentation d’un ensemble de méthodologies de
base, clé en main, pour non-spécialistes
Une base de données collaborative de plus de 170 ressources utiles à
la médiation aux données
Un module de formation à la médiation aux données
Plus de 20 projets/réflexions d'infolabs en cours : Lyon, Grenoble,
Brest, Poitou-Charentes, Marseille, Axa, GRdF, etc.
Tous nos travaux sont réutilisables sous licence Creative Commons
CC-BY
Parmi les résultats de la campagne
Infolab

Contenu connexe

Tendances

Competitic - Découvrez et utilisez l open data - numerique en entreprise
Competitic - Découvrez et utilisez l open data - numerique en entrepriseCompetitic - Découvrez et utilisez l open data - numerique en entreprise
Competitic - Découvrez et utilisez l open data - numerique en entreprise
COMPETITIC
 
2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?
Jacques PRIOL
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
noucher
 
Sensibilisation open-data 2017
Sensibilisation open-data 2017Sensibilisation open-data 2017
Sensibilisation open-data 2017
Claire Gallon
 
Open Data, de quoi parle-t-on ?
Open Data, de quoi parle-t-on ?Open Data, de quoi parle-t-on ?
Open Data, de quoi parle-t-on ?
Simon Chignard
 
Etats des lieux de l'Open Data culturel en France et en Europe
Etats des lieux de l'Open Data culturel en France et en EuropeEtats des lieux de l'Open Data culturel en France et en Europe
Etats des lieux de l'Open Data culturel en France et en Europe
Calimaq S.I.Lex
 
Sfsic14 140605-ibekwe-san juan-big science
Sfsic14 140605-ibekwe-san juan-big scienceSfsic14 140605-ibekwe-san juan-big science
Sfsic14 140605-ibekwe-san juan-big science
SFSIC Association
 
L'ouverture des données publiques (Open Data) : pour quoi faire ?
L'ouverture des données publiques (Open Data) : pour quoi faire ?L'ouverture des données publiques (Open Data) : pour quoi faire ?
L'ouverture des données publiques (Open Data) : pour quoi faire ?
Simon Chignard
 
Presentation généraliste sur les réutilisation des données publiques
Presentation généraliste sur les réutilisation des données publiquesPresentation généraliste sur les réutilisation des données publiques
Presentation généraliste sur les réutilisation des données publiques
Fing
 
Presentation Open Data Région
Presentation Open Data RégionPresentation Open Data Région
Presentation Open Data Région
liberTIC
 
Pour ou contre l'ouverture des données et contenus culturels ?
Pour ou contre l'ouverture des données et contenus culturels ?Pour ou contre l'ouverture des données et contenus culturels ?
Pour ou contre l'ouverture des données et contenus culturels ?
Calimaq S.I.Lex
 
L'exception TDM dans la loi numérique : mérites, limites et perspectives
L'exception TDM dans la loi numérique : mérites, limites et perspectivesL'exception TDM dans la loi numérique : mérites, limites et perspectives
L'exception TDM dans la loi numérique : mérites, limites et perspectives
Calimaq S.I.Lex
 
Open Data & Big Data au sein du SI RH
Open Data & Big Data au sein du SI RHOpen Data & Big Data au sein du SI RH
Open Data & Big Data au sein du SI RH
Hubert Herberstein
 
L’open data : un axe pour la modernisation des pouvoirs publics
L’open data : un axe pour la modernisation des pouvoirs publics L’open data : un axe pour la modernisation des pouvoirs publics
L’open data : un axe pour la modernisation des pouvoirs publics
Inetum
 
Histoire d'e l'Internet et de la Presse en ligne
Histoire d'e l'Internet et de la Presse  en ligneHistoire d'e l'Internet et de la Presse  en ligne
Histoire d'e l'Internet et de la Presse en ligne
Tunisie-SIC
 
Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Libre Accès aux publications scientifiques : quelles incidences de la loi num...Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Calimaq S.I.Lex
 
Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)
Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)
Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)
Mairie de Paris
 
Exploration de données : un environnement juridique en évolution
Exploration de données : un environnement juridique en évolutionExploration de données : un environnement juridique en évolution
Exploration de données : un environnement juridique en évolution
Calimaq S.I.Lex
 

Tendances (19)

Competitic - Découvrez et utilisez l open data - numerique en entreprise
Competitic - Découvrez et utilisez l open data - numerique en entrepriseCompetitic - Découvrez et utilisez l open data - numerique en entreprise
Competitic - Découvrez et utilisez l open data - numerique en entreprise
 
2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?2017 : l'année de la "data territoriale" ?
2017 : l'année de la "data territoriale" ?
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Sensibilisation open-data 2017
Sensibilisation open-data 2017Sensibilisation open-data 2017
Sensibilisation open-data 2017
 
Open Data, de quoi parle-t-on ?
Open Data, de quoi parle-t-on ?Open Data, de quoi parle-t-on ?
Open Data, de quoi parle-t-on ?
 
Etats des lieux de l'Open Data culturel en France et en Europe
Etats des lieux de l'Open Data culturel en France et en EuropeEtats des lieux de l'Open Data culturel en France et en Europe
Etats des lieux de l'Open Data culturel en France et en Europe
 
Sfsic14 140605-ibekwe-san juan-big science
Sfsic14 140605-ibekwe-san juan-big scienceSfsic14 140605-ibekwe-san juan-big science
Sfsic14 140605-ibekwe-san juan-big science
 
L'ouverture des données publiques (Open Data) : pour quoi faire ?
L'ouverture des données publiques (Open Data) : pour quoi faire ?L'ouverture des données publiques (Open Data) : pour quoi faire ?
L'ouverture des données publiques (Open Data) : pour quoi faire ?
 
Presentation généraliste sur les réutilisation des données publiques
Presentation généraliste sur les réutilisation des données publiquesPresentation généraliste sur les réutilisation des données publiques
Presentation généraliste sur les réutilisation des données publiques
 
Presentation Open Data Région
Presentation Open Data RégionPresentation Open Data Région
Presentation Open Data Région
 
Pour ou contre l'ouverture des données et contenus culturels ?
Pour ou contre l'ouverture des données et contenus culturels ?Pour ou contre l'ouverture des données et contenus culturels ?
Pour ou contre l'ouverture des données et contenus culturels ?
 
L'exception TDM dans la loi numérique : mérites, limites et perspectives
L'exception TDM dans la loi numérique : mérites, limites et perspectivesL'exception TDM dans la loi numérique : mérites, limites et perspectives
L'exception TDM dans la loi numérique : mérites, limites et perspectives
 
Open Data & Big Data au sein du SI RH
Open Data & Big Data au sein du SI RHOpen Data & Big Data au sein du SI RH
Open Data & Big Data au sein du SI RH
 
Guide data culture
Guide data cultureGuide data culture
Guide data culture
 
L’open data : un axe pour la modernisation des pouvoirs publics
L’open data : un axe pour la modernisation des pouvoirs publics L’open data : un axe pour la modernisation des pouvoirs publics
L’open data : un axe pour la modernisation des pouvoirs publics
 
Histoire d'e l'Internet et de la Presse en ligne
Histoire d'e l'Internet et de la Presse  en ligneHistoire d'e l'Internet et de la Presse  en ligne
Histoire d'e l'Internet et de la Presse en ligne
 
Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Libre Accès aux publications scientifiques : quelles incidences de la loi num...Libre Accès aux publications scientifiques : quelles incidences de la loi num...
Libre Accès aux publications scientifiques : quelles incidences de la loi num...
 
Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)
Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)
Open Data, introduction, état des lieux et débats (université d'été 2012 EIVP)
 
Exploration de données : un environnement juridique en évolution
Exploration de données : un environnement juridique en évolutionExploration de données : un environnement juridique en évolution
Exploration de données : un environnement juridique en évolution
 

Similaire à Open Data - Rencontre Bi-départementale des EPN 26-07

Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
olivier
 
4 tendances de 2014 qui vont refaire le monde
4 tendances de 2014 qui vont refaire le monde4 tendances de 2014 qui vont refaire le monde
4 tendances de 2014 qui vont refaire le monde
Giorgio Pauletto
 
CapCom13: CN4: Comment aborder l'ère du Big Data ?
CapCom13: CN4: Comment aborder l'ère du Big Data ?CapCom13: CN4: Comment aborder l'ère du Big Data ?
CapCom13: CN4: Comment aborder l'ère du Big Data ?
Cap'Com
 
20100211 Partage De DonnéEs Publiques V2
20100211    Partage De DonnéEs Publiques V220100211    Partage De DonnéEs Publiques V2
20100211 Partage De DonnéEs Publiques V2
Fing
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
olivier
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privée
Sylvia Fredriksson
 
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Stéphane Possamai
 
02 big data definition
02 big data definition02 big data definition
02 big data definition
Patrick Bury
 
02 big data definition
02 big data definition02 big data definition
02 big data definition
Patrick Bury
 
Avons-nous besoin d&rsquo;infolabs ?
Avons-nous besoin d&rsquo;infolabs ?Avons-nous besoin d&rsquo;infolabs ?
Avons-nous besoin d&rsquo;infolabs ?
Fing
 
20150604 AFDIT Conf A Meillassoux BIG DATA VF
20150604 AFDIT Conf A Meillassoux BIG DATA VF20150604 AFDIT Conf A Meillassoux BIG DATA VF
20150604 AFDIT Conf A Meillassoux BIG DATA VF
Andre Meillassoux
 
Impact de la technologie dans le quotidien des gens
Impact de la technologie dans le quotidien des gensImpact de la technologie dans le quotidien des gens
Impact de la technologie dans le quotidien des gens
zaccio
 
La veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvantLa veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvant
Christophe Deschamps
 
Internet demain : quelques tendances
Internet demain : quelques tendancesInternet demain : quelques tendances
Internet demain : quelques tendances
Hugues Aubin
 
4. Algorithmes
4. Algorithmes4. Algorithmes
4. Algorithmes
Benoit Lacherez
 
Web 3.0 : les objets connectés
Web 3.0 : les objets connectésWeb 3.0 : les objets connectés
Web 3.0 : les objets connectés
EASI-IE | Votre agence en Intelligence Stratégique
 
Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...
Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...
Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...
Bodyspacesociety Blog
 
ZOne DEV #lemobile20 2011 2J
ZOne DEV #lemobile20 2011 2JZOne DEV #lemobile20 2011 2J
ZOne DEV #lemobile20 2011 2J
servicesmobiles.fr
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
Mouhsine LAKHDISSI
 
Itinéraire de découverte Internet 2009
Itinéraire de découverte Internet 2009Itinéraire de découverte Internet 2009
Itinéraire de découverte Internet 2009
Florence Devouard
 

Similaire à Open Data - Rencontre Bi-départementale des EPN 26-07 (20)

Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
4 tendances de 2014 qui vont refaire le monde
4 tendances de 2014 qui vont refaire le monde4 tendances de 2014 qui vont refaire le monde
4 tendances de 2014 qui vont refaire le monde
 
CapCom13: CN4: Comment aborder l'ère du Big Data ?
CapCom13: CN4: Comment aborder l'ère du Big Data ?CapCom13: CN4: Comment aborder l'ère du Big Data ?
CapCom13: CN4: Comment aborder l'ère du Big Data ?
 
20100211 Partage De DonnéEs Publiques V2
20100211    Partage De DonnéEs Publiques V220100211    Partage De DonnéEs Publiques V2
20100211 Partage De DonnéEs Publiques V2
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privée
 
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
 
02 big data definition
02 big data definition02 big data definition
02 big data definition
 
02 big data definition
02 big data definition02 big data definition
02 big data definition
 
Avons-nous besoin d&rsquo;infolabs ?
Avons-nous besoin d&rsquo;infolabs ?Avons-nous besoin d&rsquo;infolabs ?
Avons-nous besoin d&rsquo;infolabs ?
 
20150604 AFDIT Conf A Meillassoux BIG DATA VF
20150604 AFDIT Conf A Meillassoux BIG DATA VF20150604 AFDIT Conf A Meillassoux BIG DATA VF
20150604 AFDIT Conf A Meillassoux BIG DATA VF
 
Impact de la technologie dans le quotidien des gens
Impact de la technologie dans le quotidien des gensImpact de la technologie dans le quotidien des gens
Impact de la technologie dans le quotidien des gens
 
La veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvantLa veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvant
 
Internet demain : quelques tendances
Internet demain : quelques tendancesInternet demain : quelques tendances
Internet demain : quelques tendances
 
4. Algorithmes
4. Algorithmes4. Algorithmes
4. Algorithmes
 
Web 3.0 : les objets connectés
Web 3.0 : les objets connectésWeb 3.0 : les objets connectés
Web 3.0 : les objets connectés
 
Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...
Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...
Paola TUBARO - Web et Privacy : sur le prétendu renoncement à la vie privée d...
 
ZOne DEV #lemobile20 2011 2J
ZOne DEV #lemobile20 2011 2JZOne DEV #lemobile20 2011 2J
ZOne DEV #lemobile20 2011 2J
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Itinéraire de découverte Internet 2009
Itinéraire de découverte Internet 2009Itinéraire de découverte Internet 2009
Itinéraire de découverte Internet 2009
 

Plus de Garlann Nizon

2022 02-10 slides présentation fdn médiation numérique drôme
2022 02-10 slides présentation fdn médiation numérique drôme2022 02-10 slides présentation fdn médiation numérique drôme
2022 02-10 slides présentation fdn médiation numérique drôme
Garlann Nizon
 
V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...
V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...
V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...
Garlann Nizon
 
Utilisateurs santé mentale &amp; numérique vf
Utilisateurs santé mentale &amp; numérique vfUtilisateurs santé mentale &amp; numérique vf
Utilisateurs santé mentale &amp; numérique vf
Garlann Nizon
 
Catalogue des services de la médiation numérique en Drôme Ardèche
Catalogue des services de la médiation numérique en Drôme ArdècheCatalogue des services de la médiation numérique en Drôme Ardèche
Catalogue des services de la médiation numérique en Drôme Ardèche
Garlann Nizon
 
Apidae
ApidaeApidae
Open data et participation 31mars17
Open data et participation 31mars17Open data et participation 31mars17
Open data et participation 31mars17
Garlann Nizon
 
OpenData et médiation numérique
OpenData et médiation numériqueOpenData et médiation numérique
OpenData et médiation numérique
Garlann Nizon
 
Open Data en pratique
Open Data en pratiqueOpen Data en pratique
Open Data en pratique
Garlann Nizon
 
Opendata introduction 31mars17
Opendata introduction 31mars17Opendata introduction 31mars17
Opendata introduction 31mars17
Garlann Nizon
 
Manifeste des tiers lieux
Manifeste des tiers lieuxManifeste des tiers lieux
Manifeste des tiers lieux
Garlann Nizon
 
2016.05.26 epn et tiers lieux
2016.05.26   epn et tiers lieux2016.05.26   epn et tiers lieux
2016.05.26 epn et tiers lieux
Garlann Nizon
 
Presentation coraia26mai
Presentation coraia26maiPresentation coraia26mai
Presentation coraia26mai
Garlann Nizon
 
Presentation promeneurs
Presentation promeneurs Presentation promeneurs
Presentation promeneurs
Garlann Nizon
 
Promeneurs du net 07
Promeneurs du net 07Promeneurs du net 07
Promeneurs du net 07
Garlann Nizon
 
Intervention epn annonay
Intervention epn annonayIntervention epn annonay
Intervention epn annonay
Garlann Nizon
 
Presentation2
Presentation2Presentation2
Presentation2
Garlann Nizon
 
Promeneurs
PromeneursPromeneurs
Promeneurs
Garlann Nizon
 
Jeux vidéo en_bibliothèque
Jeux vidéo en_bibliothèqueJeux vidéo en_bibliothèque
Jeux vidéo en_bibliothèque
Garlann Nizon
 
Bib sansfrontière
Bib sansfrontièreBib sansfrontière
Bib sansfrontière
Garlann Nizon
 
Bib sansfrontière
Bib sansfrontièreBib sansfrontière
Bib sansfrontière
Garlann Nizon
 

Plus de Garlann Nizon (20)

2022 02-10 slides présentation fdn médiation numérique drôme
2022 02-10 slides présentation fdn médiation numérique drôme2022 02-10 slides présentation fdn médiation numérique drôme
2022 02-10 slides présentation fdn médiation numérique drôme
 
V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...
V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...
V ramel projet de recherche numediss-rencontre médiateurs drôme_10 fev 2022...
 
Utilisateurs santé mentale &amp; numérique vf
Utilisateurs santé mentale &amp; numérique vfUtilisateurs santé mentale &amp; numérique vf
Utilisateurs santé mentale &amp; numérique vf
 
Catalogue des services de la médiation numérique en Drôme Ardèche
Catalogue des services de la médiation numérique en Drôme ArdècheCatalogue des services de la médiation numérique en Drôme Ardèche
Catalogue des services de la médiation numérique en Drôme Ardèche
 
Apidae
ApidaeApidae
Apidae
 
Open data et participation 31mars17
Open data et participation 31mars17Open data et participation 31mars17
Open data et participation 31mars17
 
OpenData et médiation numérique
OpenData et médiation numériqueOpenData et médiation numérique
OpenData et médiation numérique
 
Open Data en pratique
Open Data en pratiqueOpen Data en pratique
Open Data en pratique
 
Opendata introduction 31mars17
Opendata introduction 31mars17Opendata introduction 31mars17
Opendata introduction 31mars17
 
Manifeste des tiers lieux
Manifeste des tiers lieuxManifeste des tiers lieux
Manifeste des tiers lieux
 
2016.05.26 epn et tiers lieux
2016.05.26   epn et tiers lieux2016.05.26   epn et tiers lieux
2016.05.26 epn et tiers lieux
 
Presentation coraia26mai
Presentation coraia26maiPresentation coraia26mai
Presentation coraia26mai
 
Presentation promeneurs
Presentation promeneurs Presentation promeneurs
Presentation promeneurs
 
Promeneurs du net 07
Promeneurs du net 07Promeneurs du net 07
Promeneurs du net 07
 
Intervention epn annonay
Intervention epn annonayIntervention epn annonay
Intervention epn annonay
 
Presentation2
Presentation2Presentation2
Presentation2
 
Promeneurs
PromeneursPromeneurs
Promeneurs
 
Jeux vidéo en_bibliothèque
Jeux vidéo en_bibliothèqueJeux vidéo en_bibliothèque
Jeux vidéo en_bibliothèque
 
Bib sansfrontière
Bib sansfrontièreBib sansfrontière
Bib sansfrontière
 
Bib sansfrontière
Bib sansfrontièreBib sansfrontière
Bib sansfrontière
 

Open Data - Rencontre Bi-départementale des EPN 26-07

  • 1. La révolution des données numériques Une conférence de Simon Chignard et Charles Nepote, proposée par la Fing,
  • 3. Données ? De quoi parle-t-on ? Des atomes d’information structurés et factuels : mesures, statistiques, description, coordonnées, horaires, budgets, données en temps réel, etc. Plus précisément, par exemple : hauteur, longueur, durée, délai, matière, quantité, consommation, prix, températures, vitesses, etc. Données <> médias Données <> documents Données <> informations
  • 4. Données numériques ? Atomes d’information manipulables sans transformation par des systèmes informatiques Données numériques ou pas ?
  • 5. Données numériques ? Atomes d’information manipulables sans transformation par des systèmes informatiques Données numériques ou pas ?
  • 6. La donnée: un objet difficile à saisir La donnée c’est intangible (on ne peut pas la toucher). La donnée c’est toujours construit, contrairement à ce que laisse croire l’étymologie du mot (latin datum: ce qui est donné, qui ne fait pas débat, ce qui est exogène). Yann-Moulier Boutang: “se méfier du naturalisme des données” Quantifier (au sens: mettre en nombre), c’est faire des choix, établir des priorités, … Même les unités de mesure sont des conventions construites (ex. 1 mètre)
  • 7. Et si la donnée était une matière première… ce serait ?
  • 8. Portrait-robot de la donnée comme matière première Une matière première de plus en plus disponible que l’on produit en plus grande quantité, de manière consciente ou inconsciente (“traces numériques”) dont les coûts de production, de collecte et de stockage diminuent chaque année Une matière qui ne s’épuise pas quand on la consomme qui prend de la valeur quand elle circule, pas quand on la stocke (thésaurisation) Une matière dont la valeur est souvent dans la réutilisation, pas uniquement dans l’usage initial
  • 9. 1. Un nouveau monde de données
  • 10. Le paysage des données ?
  • 11. 1984
  • 13. 2008 - Google Flu Trends
  • 14. 1984 - 2015 Sentinelles, Google Flu Trends: même ambition mais pourtant source de données, intentionalité, méthodes différentes coeur de métier vs. sous-produit de l’activité principale porté par l’acteur public vs. par une multinationale ... 1984-2015 On passe d’une donnée rare à une donnée abondante
  • 15. Ce qui change (1) : la production Modes de production et d'exploitation ont fortement évolué Puissance de traitement, de stockage, de mise en réseau Finesse et multiplication des capteurs Informatique personnelle (dont base de données) Capteurs « grand public » (météo, santé, GPS, etc.) ... et vont continuer d'évoluer Capteurs personnels toujours plus fins et touchant toujours plus de domaine (montre verte, capteurs ingérables) Internet des objets “Digital labour” Mesure de soi (quantified self) … vers un nouveau web : le web des données
  • 16. Ce qui change (1) : la production Bracelet de mesure corporelle jawbone.com
  • 17. Ce qui change (1) : la production La montre verte
  • 18. Des capteurs moins chers tomorrow-lab.com : DIY Traffic viewer
  • 19. Ce qui change (2) : les producteurs Le crowdsourcing : la coproduction des données par les “foules” Des pratiques anciennes toujours plus poussées en botanique, astronomie, etc. Un champ du crowdsourcing qui paraît sans limite OpenStreetMap dans la cartographie Données environnementales (montre verte) Cartographie des caméras de surveillance Capteurs « do it yourself » en tous genres pour moins de 100€ : comptage d'automobiles, mesures de consommations énergétiques, etc. Multisourcing (privé-public / privé-privé / public-privé-public)
  • 20. Ce qui change (2) : les producteurs
  • 21. L'extraction des données des infobox de wikipédia + pages de catégories listant les œuvres conservées dans tel musée = reconstitution possible de véritables petits catalogues des oeuvres
  • 22. openstreetmap.org : de qualité fréquemment supérieure à la concurrence
  • 23. Ce qui change (2) OpenFoodFacts
  • 24. nest : thermostat apprenant : collecte vos données d'usage pour anticiper vos besoins
  • 25. Ce qui change (2) asthmapolis : capteur connecté d'inhalation de ventoline et réseau communautaire au service des asthmatiques (alerte, cartographies...)
  • 26. Ce qui change (1 et 2) : production/producteurs Des producteurs toujours plus nombreux Individus de tous types : adultes, enfants, professionnels, amateurs, etc. Organisations de tous types : entreprises, acteurs publics, associations, communautés (parfois informelles) Des producteurs militants aux motivations les plus diverses Des “malgré eux”, obligés de produire des données pour accéder à un service Des M. Jourdain, qui produisent des données sans même le savoir Qui ne produit pas de données ? Qu’est-ce qui ne produit pas de données ?
  • 27. Ce qui change (3) : la quantité, les big data Une quantité de données accumulée chaque jour plus vertigineuse Cette quantité autorise de nouvelles perspectives construire des modèles ne sert plus à rien ... ... les réponses sont dans ces très grands volumes de données La “fin de la théorie” ? (Chris Anderson)
  • 28. Ce qui change (4) : la pluralité des sources Plein de manières différentes de mesurer le même phénomène (les “proxies”) Exemple: “Combien de touristes sur les Champs Elysées ?” Enquête quantitative sur le terrain Analyse des transactions de cartes bancaires (commerces) Analyse des logs de connexion de téléphonie (Orange, SFR) Repérage des photos prises sur les lieux et publiés sur Flickr … mais aussi à partir des tweets (cf. Tourists vs. Locals page suivante) Conséquence : les données-monopoles sont de plus en plus rares et bien souvent, si vous n’ouvrez pas vos données, d’autres le feront à votre place
  • 30. Ce qui change (5) : 1 donnée => de multiples usages Une donnée n’a plus un seul usage pré-déterminé (valeur de réutilisation) On parle d’autonomisation de la donnée Une donnée génère également d’autres données qui auront d’autres usages (ombre portée) Certaines données racontent beaucoup d’autres choses que leurs usages premiers : Analyse des logs de connexion de téléphonie (Orange, SFR) Contenus publiés sur les grandes plate-formes web 2.0 (Flickr, Twitter, Facebook, Foursquare, etc.) les requêtes passées aux moteurs de recherche le wifi de votre téléphone etc.
  • 31. Ce qui change (5) : 1 donnée => de multiples usages Projet BANO : base adresse nationale en open data, illustration de la pluralité des sources (cadastre + open data local + contributeurs OSM)
  • 32. Ce qui change (6) : l’ouverture des données (open data) Une idée de départ : les données produites par les acteurs publics devraient être réutilisables Une idée déjà à l’oeuvre dans les communautés “Open*” : Wikipédia, Wikidata, OpenStreetMap, OpenFoodFacts, etc. Une idée qui s’étend aux entreprises Un champ qui booste l’innovation car les données sont rendues très accessibles
  • 33. Ce qui change (2+4+6) : l’ouverture des données (open data) pluralité des producteurs (dont extension des co-producteurs) + pluralité des sources (proxies) + sources en open data = Si vous n’ouvrez pas vos données, d’autres le feront à votre place
  • 34. Ce qui change (7) : les données liées des données exprimées dans une même "langue" (RDF) des identifiants uniques réutilisables pour chaque donnée (URI). Ex. http://data.bnf.fr/11907966/victor_hugo/ des requêtes multi-sources indépendantes des outils (SPARQL) des bases de données reliées entre elles bien adapté aux grands volumes de données froides : données encyclopédiques, bibliothéconomie, muséographie, référentiels administratifs, etc.
  • 35. Ce qui change (7) : les données liées
  • 36. Ce qui change (8) : les données, éthique et privacy On dépasse le cadre des données personnelles stricto sensu : des données qui deviennent réidentifiantes La société face aux défis du big data : vers de nouvelles formes de régulation Par ailleurs, toutes les données sont-elles bonnes à partager
  • 37. Ce qui change : nouveau paysage, nouveau vocabulaire Les data : les données. La data : le matériau Le crowdsourcing, une entrée par le mode de production : données collectées collaborativement, par les « foules » Big Data, une entrée par la quantité et la technique : « grosses données », volumes de données TRÈS importants Small Data : des données pertinentes adaptées à la compréhension humaine, une entrée par les usages et usagers Open Data vs Closed Data (peu utilisé), une entrée par le droit : des données librement réutilisables (+ faciles d’accès) Self Data : des données relatives à soi, une entrée par la destination Le quantified self : “quantification de soi”, une pratique de collecte de données par soi-même, sur soi-même
  • 38. Que fait-on avec les données ? Plein de trucs !
  • 39. On répond à des questions Quel est le prénom masculin le plus donné à Nice au cours des 5 dernières années ? Combien de femmes ont une licence sportive de handball dans ma commune ? Quelle commune de France accueille le plus grand nombre de personnes redevables de l’ISF (impôt de solidarité sur la fortune) ? Qui sont les 200 premiers titres de presse aidés par l’Etat en 2013 ? Combien d’accidents corporels en 2012 sur la route que j’emprunte tous les matins ? ...
  • 40. On prend des décisions Dois-je ouvrir mon magasin dans cette rue du centre-ville ? Est-ce que cette formation me permettra de trouver un emploi rapidement ? Est-ce que c’est rentable d’investir dans des panneaux solaires dans ma commune ? Est-ce qu’il vaut mieux prendre les avions d’Air France ou ceux d’Easy Jet entre Nice et Paris ?
  • 41. On représente des phénomènes complexes Visualisation de l’offre de transports de Rennes dans une vidéo
  • 42. On représente des phénomènes complexes / on débat La répartition des aides à la presse en France (Samuel Azoulay à partir de données data.gouv.fr)
  • 43. On représente des phénomènes complexes / on influence Les morts par arme à feux ont baissé après le vote de la loi “Stand Your Ground” ?
  • 44. On représente des phénomènes complexes / on révèle Les noms de rues comme révélateurs des inégalités hommes-femmes ?
  • 45. On vous fait des recommandations
  • 46. On essaie de prédire l’avenir FiveThirtyEight
  • 47. pause 5’ à suivre : les données ce n’est pas trivial
  • 48. Les données, c’est pas trivial Les difficultés que l’on rencontre, les défis que cela nous pose
  • 49. L’objet “donnée” On ne croise pas des données tous les matins en sortant dans la rue On ne peut pas “toucher” des données (intangible) Un objet ingrat, aride
  • 50. Des données de qualité variable (1)
  • 51. Des données de qualité variable (2) Les Mairies de France ? (par Christian Quest)
  • 52. Des données peu standardisées Touche la plupart des données hors quelques domaines comme : les transports (GTFS) les données géographiques (GPX, KML, etc.) les oeuvres (Dublin core, MARC, etc.) ... Un des gros problèmes de “l’offre” actuelle Des conséquences lourdes pas de capitalisation des savoirs techniques des données difficiles à croiser (ex. prénoms) un marché et des usages qui peinent à décoller
  • 53. Des données pas faciles à trouver Les liens profonds sont souvent mal référencés sur les moteurs de recherche, il faut donc d’abord identifier la source qui peut héberger les données… Exemple: quelle est la qualité des eaux de baignade des plages de Vallauris - Golfe Juan ? recherche sur Google site de la municipalité avec données datant de 2011 … un site dédié au niveau national, mais difficile à trouver
  • 54. Des données avec lesquelles on raconte n’importe quoi ? Source des données: OMS via Gapminder Corrélation ne fait pas causalité !
  • 55. Des données pas faciles à manipuler Gros fichiers : exemple fichier des licenciés sportifs par commune de France : fichier .csv de 120 Mo TRÈS GROS fichiers : exemple, le DAMIR (Dépenses d'assurance maladie hors prestations hospitalières) un fichier de 30 Go pour une année 1 milliard 500 millions de lignes pour 6 ans formats techniques (OSM)
  • 56. L’open data a-t-il changé tout ça ?
  • 57. Les transformations de l'open data
  • 59. Ce que l’open data a effectivement produit (5 ans plus tard) Les acteurs publics, un des premiers réutilisateurs : un des succès indéniables et un vrai facteur de modernisation de l'action publique Pour les acteurs publics, également, un rôle “d’enabler” (capacitation) assumé et lisible : revalorisation de l’action publique, rapprochement avec les nouveaux acteurs économiques, etc. Quelques vrais services utiles aux populations Les données comme objet de débat La possibilité de jouer, d’explorer, de manipuler de vrais données pour acculturer et faire grandir tous les acteurs
  • 60. Un paysage des usagers très mitigé En deuxième lieu, un profil type : un individu, jeune, mâle, geek Souvent militant Assez souvent étudiant, en libéral ou en inter-contrat Recherchant une visibilité ou du fun : méritocratie, montrer son savoir- faire pour se « vendre », s'amuser... D'autres publics présents mais très minoritaires Des start-ups, quelques PME « techno », des chercheurs, à peu près aucune PME traditionnelle Peu de business « pure » open data Peu ou pas de femmes, d'enfants, de personnes âgées Peu d'association, de médias
  • 61. … un paysage des usagers qui s’explique aisément Aridité des matériaux : de sèches colonnes de chiffres et de code Une pertinence et une qualité des données aléatoires qui oblige à un gros travail de retraitement et/ou de croisement Une importante barrière technique à l'usage Un vrai manque de lisibilité du côté de l'offre : Des données pas assez présentes là où sont les gens Un manque d'éditorialisation qui ne facilite pas la compréhension Des sachants plus portés sur le code que sur de la médiation Une acculturation aux données encore faible
  • 62. Capacitation du plus grand nombre Écosystème riche et ouvert Une appropriation large par l’ensemble du tissu économique Une réelle appropriation de l'économie sociale et solidaire Donner du pouvoir à ceux qui en ont déjà Un sujet de spécialistes en vase clôt La naissance de monopoles industriels De meilleurs services pour des citoyens aisés et insérés
  • 63. La médiation aux données, besoin criant mais peu adressé Très peu d’acteurs EPN à travers les cartoparties les “cantines” numériques, espaces de co-working, etc. quelques très rares spécialistes (ANACT, Altercarto…) Quelles médiations la mode des événements “en cloche” : hackathons, concours, camps, cartoparties, etc. une vraie stimulation de l’écosystème local ... ... mais beaucoup de déchet, le soufflé retombe vite un vrai besoin de médiations continues
  • 64. La médiation aux données : quelques principes Rendre lisible, tangible, sensible, à l’échelle des individus Manipuler, apprendre par le “faire” : tant qu’une personne n’a pas manipulée, elle ne se rend pas compte de ces problèmes Produire des données : un bon producteur/ouvreur de données est un bon réutilisateur Une démarche ouverte et collective, parce qu’avec des choses si neuves l’apprentissage collectif est tellement plus efficace Le nouveau monde de données requiert de nouvelles médiations qui sont en cours d’invention, de test.
  • 65. ???
  • 66. En 1973, 16000 habitants de Mazamet et la Prévention routière livrent une campagne qui marque toute la France.
  • 67. Développer des outils Initier, expérimenter et déployer des méthodes de médiation autour de la donnée Le 02 octobre 2015 HappyTIC 2015 – Grenoble
  • 68. #Dataviz_rra : exemple d’outils Le 02 octobre 2015 HappyTIC 2015 – Grenoble
  • 69. Développer les ressources Le 02 octobre 2015 HappyTIC 2015 – Grenoble Favoriser l’émergence d’un réseau d’acteurs impliqués dans l’ouverture, la diffusion, la collecte, le traitement et la médiation de la donnée
  • 70. Développer les usages Le 02 octobre 2015 HappyTIC 2015 – Grenoble Convaincre les acteurs publics de l'intérêt de l’ouverture et de la réutilisation des données.
  • 72. L’infolab, un “lab” ouvert pour les données Dès l’origine pensé pour défendre 3 valeurs : ouvert accessible continu 3 grandes missions de médiation : initiation/formation “incubation” débat Une très grande variété de formes : thématique, en réseau, de branche, spécialisé sur des publics, etc.
  • 73. Parmi les résultats de la campagne Infolab
  • 74. Parmi les résultats de la campagne Infolab Un travail sur les compétences relatives aux données Une charte des infolabs en version beta Un portail de référence pour la communauté : http://infolabs.io En cours de finalisation ou publication : La conception/test/documentation d’un ensemble de méthodologies de base, clé en main, pour non-spécialistes Une base de données collaborative de plus de 170 ressources utiles à la médiation aux données Un module de formation à la médiation aux données Plus de 20 projets/réflexions d'infolabs en cours : Lyon, Grenoble, Brest, Poitou-Charentes, Marseille, Axa, GRdF, etc. Tous nos travaux sont réutilisables sous licence Creative Commons CC-BY
  • 75. Parmi les résultats de la campagne Infolab