Réflexions sur les missions et les compétences liées à une démarche data territoriale
Métiers et missions de l’Open
Data Territorial
Innovations territoriales et
données numériques
27/10/2016
LA DATA, ÉLÉMENT CENTRAL DE LA VILLE INTELLIGENTE ET DURABLE
Data
Solutions
Grands objectifs d’amélioration de la
qualité de vie de la smart city
• Durabilité : optimiser la conso des
ressources
• Facilité l’usage de la ville
• Développement éco / attractivité
• Encourager l’engagement citoyen
• Optimiser les dépenses publiques
• Renforcer la cohésion sociale et prendre
en compte les usagers dans leur diversité
OBJECTIFS DE LA DEMARCHE DATA
• Définir et animer la gouvernance de la
donnée
• Optimiser l’architecture du SI et développer
les solutions data
• Optimiser les politiques publiques avec les
méthodes et les techniques de la data
science
L’Open Data, première pierre ou idéal de la démarche data
• Gouvernance : transversalité, mutualisation,
construction collective avec les producteurs,
open innovation avec les réutilisateurs autour de
la licence
• Architecture : automatisation des processus de
publication, standards, normalisation, qualité,
coûts, interopérabilité, interconnexion,
collaboration.
• Analyse data : ouvrir les terrains d’études,
transparence de la gestion publique
CARTOGRAPHIE DE LA DATA TERRITORIALE
Source Paper IDDRI Smart City et data
Mode de production des data urbaines
LES DATA CROWDSOURCÉES
Sound City
An app to complete data of urban
noise from inhabitants
DansMaRue
(FixMyStreet)
Collecte data from unhabitants
(issues and proposals)
Chaîne de production et d’usage de la donnée
PETITE INTRODUCTION À LA DATA
Source étude FNCCR
CHAINE DE PRODUCTION ET D’USAGE DE LA DONNÉE IOT
Capteur /
Actionneur Réseau de distribution
Point
d’information
Point de
Transmission Réseau de collecte
Stockage
Data
Data
Data
Service
Service
Service
Les thématiques
Mobilité
Energie - réseaux
Végétalisation - environnement
Déchets et recyclage
Espace public aménagement
Espace public propreté
Bâtiments
Services sociaux
Services aux habitants
Sécurité et crise
Quels croisements sont sources de valeur?
Quelle gouvernance avec tous les acteurs
du territoire?
Quels projets pouvons-nous avoir en commun?
Réseau de collecte
Hertzien 3G
Hertzien GPRS
Hertzien LowPan
Wi-Fi
RTC
Cuivre
Fibre
CPL
Quelles mutualisations des moyens
techniques?
OBJETS CONNECTES (CAPTEURS ET DISPOSITIFS D’ACTION)
• Les projets et expérimentations en cours
Collecte de données
brutes et retour pour
pilotage
SI Ville
MODE DE COLLECTE
- Réseau DVD
- THD
- Lora (opérateurs)
- Lora (Ville?)
- SigFox
- GSM
ARCHITECTURE DATA
• Nécessité de concevoir une architecture de la data
au sein du Système d’information Ville (DSTI)
PF Data / IoT
CONNECTEURS
API/WebServices
App SI
Chaudières
CONNECTEURS
App SI
SURF
CONNECTEURS
Autre app SI Apps externes
Data Warehouse
« Archives »
Data science
Big Data
Open Data
API/WebServices
DATA DE LA CRM
Challenges of the unique citizen
account and transformation of
the Citizen Relationship
Management (CRM)
- Transform individual service
in part of an unique
authentification system
- Transform the direction of the
relation from pull to push
information and service
(ex : MesAides.gouv.fr)
- Analyse the uses of services
to adapt them
-La science des données combine l’utilisation des traitements statistiques de
l’information, des mathématiques appliquées et des méthodes informatiques
destinées à identifier, récupérer, organiser et utiliser des données
hétérogènes.
Elle s’appuie également sur la connaissance des problématiques
organisationnelles, fonctionnelles et humaines qui constituent
-le contexte décrit par les données.
-
Le premier objectif de la science des données est de produire des méthodes
d’analyse de données et de sources plus ou moins complexes ou déconnectées
de données, afin d'en extraire des informations utiles.
KESAKO DATA SCIENCE
-Pour l’administration, la science des données peut couvrir de nombreux champs
d’application et répondre à des usages divers, par exemple :
-- Mieux cibler le périmètre d’intervention d’une politique publique (périmètre
insalubrité, location temporaire illégale, risque incendie…)
-- Explorer un gisement d’économie dans l’exercice d’une mission de service
-publique ;
-- Evaluer l’adéquation des moyens destinés à une mission de service ;
-- Rechercher une plus grande équité et d’une plus grande transparence pour une
politique publique (adéquation public cible / public réel, parcours souhaité / parcours
réel, répartition du financement en fonction de la segmentation de l’offre et de la
demande) ;
-- Réaliser l’analyse prédictive du recours à une politique publique à horizon 5, 10 et 15
ans
-- le décloisonnement des données internes de plusieurs administrations pour détecter
les variables clés expliquant les résultats d’une politique publique (service rendu, coûts
complets) ;
KESAKO DATA SCIENCE
La DATA, le trafic et le stationnement
Measuring traffic with 2500 sensors in the road and 1500
traffic light management since 1986 with +30% of fluidity but
not real evaluation in GHS
Ongoing analysis
for the parking
management.
Predictive big
data system
seems to be
ready.
Etat des travaux : analyse de données SLT
– Cycle d’étude
Etude STL sur la base des donnée EVEZA en 2 étapes :
• Étape 1 : analyse statistique
• Étape 2 : analyse prédictive (se base sur étape 1)
1 - Cadrage
2 – Recherche et
exploration de données
3 – Analyse
de données
4 – Elaboration
d’un rendu
- 1 Phase cadrage : identification besoin, données nécessaires et définition
des master table
- 2 Recherche et exploration de donnée :
Importation et nettoyage des données : suppression
automatisée des anomalies pour être utilisable par des
algorithmes / outils représentations géographiques
– 3 Analyse de données :
• Identification des anomalies les plus récurrentes et des différents axes
d’études potentiels pour répondre aux besoins
• Croisement des données pour représentations compréhensibles des
défaillances rencontrées.
– 4 – Elaboration de rendu :
A propos de l’étape 1 : analyse statistique
A propos de l’étape 1 : analyse statistique / Rendu
A propos de l’étape 2 : analyse prédictive
– 1 - Phase cadrage : identification besoin et compléments de données
nécessaires ( données contextualisantes : alerte centre de trafic, Météo,
accidentologie)
– 2 – Recherche et exploration de donnée :
• Importation et nettoyage des données complémentaires
– 3 – Analyse de données :
• Développement d’algorithmes prédictifs entrainés sur jeux de données collectés
• Possibilité d’application itérative des algorithmes sur les jeux de données qui
évoluent dans le temps.
• Possibilité d’amélioration de la fiabilité de la prédiction par apprentissage
(entrainement) sur la base de données actualisées (machine learning)
A propos de l’étape 2 : analyse prédictive
– 4 – Elaboration de rendu :
• Analyse prédictive de fiabilité basé sur algorithme de Kaplan – Meirer
– Distribution de probabilité de durée de vie des ouvrages dans le temps (à 65% de risque de panne)
• Analyse prédictive d’intervention sur les SLT basé sur algorithme de Holt-
Winters
– Algorithme de série temporelle pour déterminer la tendance de saisonnalité des nombres
d’interventions sur les SLT
Duréedevieenjours
Référence des ouvrages
Fiabilité
A propos de l’étape 2 : analyse prédictive
– 4 – Elaboration de rendu :
• (En cours) Analyse prédictive multi-paramètres = corrélation avec données de
contextualisation (ex météo, accidentologie)