201803 29 meetup_open_transport_prez_oslandia_raphael_delhome_datascience_traces_velo

•

0 j'aime•111 vues

Analyse des traces des vélos en libre-service : passer des portails open data à une API de dataviz Raphael Delhome, Data scientist chez Oslandia L'essor des portails d'Open Data ouvre la voie à une meilleure compréhension du fonctionnement des villes. Encore faut-il pouvoir récupérer la grande quantité de données sous-jacente, la structurer, l'analyser, en extraire de l'information nouvelle, et la représenter visuellement. Cette présentation montrera comment Oslandia a répondu à ce challenge en prenant l'exemple de données issues des systèmes de vélos en libre-service de Bordeaux et de Lyon. Les grandes étapes du traitement de la donnée seront explicitées, et une attention particulière sera portée à des problématiques de classification des stations de vélos partagés, pour la compréhension du tissu urbain, et de prédiction de la disponibilité des vélos, en tant que création de valeur pour les usagers. Une démo de l'API de data visualisation développée en Open Source clôturera la présentation.

Présentations et discours publics

Analyse des vélos en libre-service :
des portails d'Open Data à une API
de dataviz
Meet-up Open Transport - Paris
Raphaël Delhome(*), Damien Garaud
1

Incontournables dans les
grandes villes
Location de courte durée
(de quelques minutes, à
quelques heures)
Disponibilité des vélos et
des emplacements aux
stations
Services de vélos partagés
Velo'v (Lyon)
3

Questions principales
Peut-on classer les stations de vélos en fonction de
la disponibilité des vélos ?
Que faire si on veut un vélo...et qu'il n'y en a pas ?
Que faire s'il n'y a pas de station disponible
lorsqu'on veut poser son vélo ?
...
Comment construire un data pipeline complet pour
extraire, transformer, mettre à disposition les
données et les résultats d'analyse associés ?
4

Plan de l'intervention
(Partie 1) Manipuler de la donnée géographique
ouverte
(Partie 2) Classi cation non-supervisée des stations de
vélos
(Partie 3) Prédiction à court terme de la disponibilité
des vélos en libre-service
(Partie 4) Demonstration : API de visualisation
5

Données géographiques ouvertes
Data GrandLyon
Opendata Bordeaux
7

Présentation des données
id last_timestamp bs abs ab bonus status
10063
2017-07-08
23:49:09
34 10 23 Non OPEN
10021
2017-07-08
00:30:12
19 0 0 Non CLOSED
8038
2017-07-08
23:49:26
20 6 14 Non OPEN
7045
2017-07-08
23:52:43
20 13 7 Non OPEN
8

Data pipeline
Construire un data pipeline en Python avec
Récupérer, transformer et conserver la donnée
Récupérer des données (json, xml, shp) toutes
les 10 minutes via des CRON jobs
Stockage en base (postgreSQL, postgis)
feature engineering et machine learning
Luigi
9

Classiﬁcation des stations de
vélos partagés
10

Objectif
Classer des stations de vélos partagés à partir de leur
utilisation
Idée = Grouper les stations qui se ressemblent
... C'est à dire? => Pro ls temporels
11

Inspiré par
Un pro l = un individu
Grouper les individus
similaires
En déduire des stations
"types"
Résultats pour 4 clusters
Clustering via la méthode des K-means
un travail
similaire de James
Lawlor
12

Prédiction de disponibilité
des vélos
14

Objectif
Savoir si des vélos (resp. stations) seront disponibles
dans les prochaines minutes
Idée = Utiliser l'information disponible pour prédire
la disponibilité
... C'est-à-dire? => Apprentissage supervisé pour
estimer une probabilité de disponibilité
15

Méthode d'arbre boostée :
prédire Y (probabilité de
disponibilité à H+1)
à partir de X (jour, heure,
vélos disponibles à H, ...)
Méthode XGBoost
16

Sans paramétrage, RMSE =
0.095
Résultats
17

Démo
Visualisation des vélos partagés :
Requêtage de l'API :
http://data.oslandia.io/bikes
http://data.oslandia.io/bikes/doc/
18

Conclusion et perspectives
Réponse à des questions de recherche simples à
partir de données géographiques ouvertes
Des portails d'Open Data à la mise en base de
données avec
Production d'une API pour visualiser la data => vers
une mise en production?
Online learning: continuer de récolter de la donnée,
mettre à jour les modèles d'apprentissage au l de
l'eau
Luigi
26

Merci de votre attention!
Des questions ?
Pour aller plus loin: et projet Github
damien.garaud@oslandia.com
raphael.delhome@oslandia.com
blog Oslandia
github.com/garaud/jitenshea
27

Contenu connexe

Plus de Open Transport meetup by Kisio

Prez stop bystep

Open Transport meetup by Kisio

Prez stoomlink belgian_open_transport_meetup_10.03.2021

Open Transport meetup by Kisio

L’Observatoire des mobilités émergentes - Hors-série spécial crise COVID-19 Cette 4ième vague de l’Observatoire, mené par Chronos et l’ObSoCo tous les deux ans depuis 2014, a naturellement été adaptée pour interroger les effets de la crise sanitaire sur les pratiques de mobilité des Français.es. L’intervention sera l’occasion de revenir sur les grands enseignements d’une étude qui nous permet de :- Mesurer les évolutions induites par la crise sanitaire, en comparaison des vagues précédentes de l'Observatoire- Anticiper l'impact à plus long terme de l'épidémie sur les comportements et aspirations en matière de mobilité

Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...

Open Transport meetup by Kisio

Mobilité électrique : mieux comprendre son usage grâce à ses propres données de déplacement pour choisir le meilleur véhicule et améliorer sa conduite. A partir d’une étude de cas concernant trois motos électriques les plus emblématique, pourtant censées avoir les mêmes performances techniques sur le papier, Julien montrera que chacune d’elle répond mieux à certains usages que d’autres. L’analyse des données de déplacement d’un véhicule, permet au motard de choisir le véhicule qui conviendra le mieux à ses habitudes de déplacement et d’améliorer aussi sa propre consommation. La possibilité de récupérer ses propres données d’usage et la capacité de les analyser, en mode « quantified self » / automesure, comme on le ferait avec une application de course à pied type Strava, est à la portée de plus en plus de monde et redonne plus de pouvoir à l’utilisateur.

Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...

Open Transport meetup by Kisio

Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021

Open Transport meetup by Kisio

Plus de 2 ans après la RGPD, la Data Strategy publiée en février par la Commission Européenne a renforcé le droit à la portabilité des données personnelles. Onecub, startup pionnière de la Privacytech, travaille avec l'Europe sur le sujet de partage des données, un enjeu majeur pour la Mobilité et les villes. L'équipe Onecub nous présentera en quoi la portabilité des données est-utile dans le cadre des MaaS ? Quelle est l'architecture MyData ? Cas d'usages et bénéfices utilisateurs. Et son initiative anewgovernance.org pour créer un cadre de gouvernance, des standards communs et une infrastructure ouverte pour la circulation des données personnelles. Plus d'info white papers Onecub : https://www.anewgovernance.org/resources/ et Data Strategy Europe : https://ec.europa.eu/info/strategy/priorities-2019-2024/europe-fit-digital-age/european-data-strategy_en

Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020

Open Transport meetup by Kisio

Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020

Open Transport meetup by Kisio

Lab des mobilités : faciliter l'innovation sur les territoires Comment faciliter l'innovation sur les territoires ? Le Lab des mobilités a pour objectif d'expérimenter de nouveaux services, de tester de nouvelles fonctionnalités, d'animer en créant des points de contacts (événements) entre les acteurs publics et privés, les startups, le monde de la Recherche, les Ecoles, les citoyens. Pour accompagner ces démarches d'innovation sur les territoires le Lab des mobilités met aussi à disposition des outils numériques (API, SDK, Widget...) et des données de mobilité.

Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020

Open Transport meetup by Kisio

Apport de l’Intelligence Artificielle dans les transports intelligents : de l’analyse prédictive du réseau de transport à la planification d’itinéraires De nos jours, dans les villes intelligentes, le développement des technologies de streaming de données et la croissance rapide des capacités de stockage permettent de faciliter la collecte de ces données et améliorer leur disponibilité et leur traitement. Ceci est autant plus vrai pour les transports en commun où les données sont collectées sur la base des journaux de bord des bornes de validation, des capteurs d'embarquement et de débarquement, les horaires de passage en temps réel, etc. Plusieurs cas d’usage sont intéressants. D’une part pour l’opérateur exploitant, elles peuvent servir à restituer l’état courant du système de transport par le calcul d’indicateurs clés de performance ou à anticiper son état futur en fournissant des prévisions et des estimations sur ces mêmes indicateurs. D’autre part, elles peuvent être utilisées pour améliorer l’expérience de déplacement du voyageur en améliorant la planification de son itinéraire. Dans le cadre du projet IVA (information Voyageur Augmentée), l’IRT SystemX avec ses partenaires (Ile-de-France Mobilités, SNCF, Kisio Digital, SPIROPS), s’appuie sur les algorithmes les plus avancés de machine learning, pour tirer profit de ces données afin de mettre en œuvre des outils d’aide à la décision et d’analyse du réseau de transport en commun, mais également pour enrichir la planification d’itinéraires du voyageur avec de l’information prédictive tout le long de son déplacement. Plus d'info : https://www.irt-systemx.fr/projets/iva/

Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020

Open Transport meetup by Kisio

Geomob : outil d'aide au changement de comportements pour une mobilité durable, qui réduit l'impact de nos déplacements domicile-travail sur l'environnement Geomob est un outil en ligne d'aide au changement de comportement qui repose sur un service cartographique puissant de prédiagnostic et diagnostic mobilité pour les collectivités, les AOM, les Bureaux d'Études et les entreprises. Il permet : - d'observer la répartition géographique des salariés en fonction des critères de son choix (catégorie socioprofessionnelle, horaires de travail, enfants à charge …) ; - d'étudier les distances et temps de parcours pour chaque mode de transport (voiture, transport en commun, vélo, VAE, marche…) pour les trajets « domicile-travail » afin de mieux conseiller chacun ; - de tester la performance des modes de transport alternatifs à la voiture individuelle et évaluer le potentiel de report modal pour chaque collaborateur : vélo, tiers-lieux, télétravail, Transports en Commun, covoiturage ; - de dégager les premières pistes d'action à mettre en œuvre et actionner les leviers pour piloter un Plan de Mobilité Employeur, Plan de Mobilité Inter-Entreprises. Plus d'info : www.geomob.fr

Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020

Open Transport meetup by Kisio

Comment les cameras vidéo (Telraam, OS Cam) permettent de générer plus facilement des données d'usages du vélo en open data ? Avec la forte augmentation de la pratique du vélo depuis un an (grèves de décembre, Covid, Transition écologique, développement des aménagements comme le Velopolitain, les coronapistes…), certains axes commencent à être saturés provoquant parfois de la congestion, des dangers, accidents ou altercations. Pour accompagner, améliorer la pratique du vélo, il est nécessaire de bien comprendre les usages et les besoins, donc de mesurer ces usages. L'objectif de la Fabrique des mobilités est de fournir des solutions open source à tous les acteurs intéressés pour faire des mesures des usages du vélo : collectivités, associations, startup, écoles, laboratoires de recherche, entreprise privées… Le sujet général est présenté sur le wiki de la Fabrique : https://wiki.lafabriquedesmobilites.fr/wiki/Comptage_v%C3%A9lo Différentes solutions ont été testées : avec les caméras de vidéosurveillance existantes , avec les caméras vidéo open source Telraam et Open Source Cam.

Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020

Open Transport meetup by Kisio

Présentation de la plateforme de services Jericoapp Abdoulaye Traore (CEO Urban Labs Technologies) Présentation du site www.jericoapp.fr qui a pour vocation d'apporter plus de services aux habitants grâce aux données transport en open data, via le traitement et l'enrichissement de ces données. Jericoapp propose différents services : une application mobile pour aider les habitants de certaines villes, dont Valenciennes, à se déplacer, des services numériques d'information-voyageurs pour les exploitants de réseaux de transport et une plateforme pour gérer et optimiser les services des commerçants sur Internet

Prez ultl meetup_open_transport_paris_20032019

Open Transport meetup by Kisio

Usages et coutumes du trottoir : quelles données pour partager l'espace public. Alexandre Mussche, Designer associé de l'agence Vraiment Vraiment Alexandre Mussche travaille sur les formes et stratégies urbaines pour les pouvoirs publics. Dans un contexte ou l'espace public urbain quitte un découpage binaire Voirie Vs. Trottoir, il faut repenser notre connaissance des usages existants et vernaculaires de l'espace public et notamment nos besoins en terme de données et de visualisations. Au travers de deux exemples de travaux en cours (régulation du stationnement Freefloat pour la Ville de Paris et navettes autonomes pour la SNCF), Alexandre Mussche partagera ses questions sur un opendata qui permet un réel partage de l'espace public. Plus d'info : Voiture intelligente, ville bête : chronique des futurs possibles, ByeBye Gobee, et merci et vraimentvraiment.com

Prez vraiment vraiment_meetup_open_transport_paris_20032019

Open Transport meetup by Kisio

Tock : The open conversation kit, le chatbot open source réalisé par les équipes de la SNCF François Nollen, Julien Buret (Oui SNCF) La SNCF a construit autour de projets comme le OUIBot https://www.oui.sncf/bot un écosystème open source sur les sujets du conversationnel. L’ensemble des outils utilisés pour construire les bots et assistants de la SNCF sont open sourcés dans le projet Tock – « The Open Conversation Kit » https://voyages-sncf-technologies.github.io/tock . Un bot d’exemple très simple, basé sur les API OpenData de la SNCF est même disponible : https://github.com/voyages-sncf-technologies/tock-bot-open-data .

Prez chatbot sncf_tock_meetup_open_transport_paris_20032019

Open Transport meetup by Kisio

Prez smile smart coach meetup_open_transport_paris_20062019

Open Transport meetup by Kisio

Prez idfm jungle_bus_meetup_opentransport_paris_20062019

Open Transport meetup by Kisio

Prez idfm challenge information voyageur_meetup_open_transport_paris_20062019

Open Transport meetup by Kisio

Prez saemes opendata_parking_meetup_open_transport_paris_20062019

Open Transport meetup by Kisio

Modélisation du comportement des usagers dans les réseaux de transports en commun à partir des données de billettique en Ile-de-France Vincent Guigue, Maître de conférences au Laboratoire d’Informatique de Paris 6, Sorbonne Université Nous nous intéressons depuis quelques années à l’analyse des données billéttiques d’Ile-de-France Mobilités. Nous avons travaillé successivement sur la prédiction des flux de passagers puis sur l’identification des anomalies sur le réseau. Pour ces deux tâches, la modélisation des usagers est la clé pour améliorer les modèles prédictifs et, à terme, sortir du paradigme de la boite noire; c’est à dire être capable d’expliquer l’usage individuel des transports et les implications sur le réseau.

Prez labo paris_6_meetup_open_transport_paris_17042019

Open Transport meetup by Kisio

Altaïr Mobilités : dashboard pour mieux comprendre les mobilités en Ile-de-France Guilhem Sanmarty et Samy Kraiem (Institut Vedecom) Fournir une information détaillée sur la mobilité humaine dans un territoire permet de comprendre l’usage des réseaux mais aussi le besoin en mobilités des utilisateurs, et par conséquent mettre en adéquation les offres de transport avec les besoins réels de ceux qui se déplacent. Plus d'info : http://www.vedecom.fr/altair/ Modélisation du comportement des usagers dans les réseaux de transports en commun à partir des données de billettique en Ile-de-France Vincent Guigue, Maître de conférences au Laboratoire d’Informatique de Paris 6, Sorbonne Université Nous nous intéressons depuis quelques années à l’analyse des données billéttiques d’Ile-de-France Mobilités. Nous avons travaillé successivement sur la prédiction des flux de passagers puis sur l’identification des anomalies sur le réseau. Pour ces deux tâches, la modélisation des usagers est la clé pour améliorer les modèles prédictifs et, à terme, sortir du paradigme de la boite noire; c’est à dire être capable d’expliquer l’usage individuel des transports et les implications sur le réseau.

Prez vedecom altair_meetup_open_transport_paris_17042019

Open Transport meetup by Kisio

Plus de Open Transport meetup by Kisio (20)

Prez stop bystep

Prez stoomlink belgian_open_transport_meetup_10.03.2021

Prez observatoire mobilites_emergentes_laurent_jegou_meetup_open_transport_27...

Prez mobilite electrique_julien_vaissette_avec complement_meetup_open_transpo...

Prez handimap bertrand_gervais_meetup_open_transport_27.01.2021

Prez onecub portrabilite_donnees_meetup_open_transport_10.12.2020

Prez tourisme et_mobilite_julien_delabaca_meetup_open_transport_05.11.2020

Prez lab mobilites_marie-eve_meetup_open_transport_05.11.2020

Prez irt system-x_ti_iva_meetup_opentransport_05.11.2020

Prez geomob plan_de_mobilite_meetup_open_transport_05.11.2020

Prez fabrique mobilites_gabriel_plassat_meetup_open_transport_05.11.2020

Prez ultl meetup_open_transport_paris_20032019

Prez vraiment vraiment_meetup_open_transport_paris_20032019

Prez chatbot sncf_tock_meetup_open_transport_paris_20032019

Prez smile smart coach meetup_open_transport_paris_20062019

Prez idfm jungle_bus_meetup_opentransport_paris_20062019

Prez idfm challenge information voyageur_meetup_open_transport_paris_20062019

Prez saemes opendata_parking_meetup_open_transport_paris_20062019

Prez labo paris_6_meetup_open_transport_paris_17042019

Prez vedecom altair_meetup_open_transport_paris_17042019

201803 29 meetup_open_transport_prez_oslandia_raphael_delhome_datascience_traces_velo

1. Analyse des vélos en libre-service : des portails d'Open Data à une API de dataviz Meet-up Open Transport - Paris Raphaël Delhome(*), Damien Garaud 1

2. Introduction 2

3. Incontournables dans les grandes villes Location de courte durée (de quelques minutes, à quelques heures) Disponibilité des vélos et des emplacements aux stations Services de vélos partagés Velo'v (Lyon) 3

4. Questions principales Peut-on classer les stations de vélos en fonction de la disponibilité des vélos ? Que faire si on veut un vélo...et qu'il n'y en a pas ? Que faire s'il n'y a pas de station disponible lorsqu'on veut poser son vélo ? ... Comment construire un data pipeline complet pour extraire, transformer, mettre à disposition les données et les résultats d'analyse associés ? 4

5. Plan de l'intervention (Partie 1) Manipuler de la donnée géographique ouverte (Partie 2) Classi cation non-supervisée des stations de vélos (Partie 3) Prédiction à court terme de la disponibilité des vélos en libre-service (Partie 4) Demonstration : API de visualisation 5

6. Aperçu de la donnée 6

7. Données géographiques ouvertes Data GrandLyon Opendata Bordeaux 7

8. Présentation des données id last_timestamp bs abs ab bonus status 10063 2017-07-08 23:49:09 34 10 23 Non OPEN 10021 2017-07-08 00:30:12 19 0 0 Non CLOSED 8038 2017-07-08 23:49:26 20 6 14 Non OPEN 7045 2017-07-08 23:52:43 20 13 7 Non OPEN 8

9. Data pipeline Construire un data pipeline en Python avec Récupérer, transformer et conserver la donnée Récupérer des données (json, xml, shp) toutes les 10 minutes via des CRON jobs Stockage en base (postgreSQL, postgis) feature engineering et machine learning Luigi 9

10. Classiﬁcation des stations de vélos partagés 10

11. Objectif Classer des stations de vélos partagés à partir de leur utilisation Idée = Grouper les stations qui se ressemblent ... C'est à dire? => Pro ls temporels 11

12. Inspiré par Un pro l = un individu Grouper les individus similaires En déduire des stations "types" Résultats pour 4 clusters Clustering via la méthode des K-means un travail similaire de James Lawlor 12

13. Cartographie des stations 13

14. Prédiction de disponibilité des vélos 14

15. Objectif Savoir si des vélos (resp. stations) seront disponibles dans les prochaines minutes Idée = Utiliser l'information disponible pour prédire la disponibilité ... C'est-à-dire? => Apprentissage supervisé pour estimer une probabilité de disponibilité 15

16. Méthode d'arbre boostée : prédire Y (probabilité de disponibilité à H+1) à partir de X (jour, heure, vélos disponibles à H, ...) Méthode XGBoost 16

17. Sans paramétrage, RMSE = 0.095 Résultats 17

18. Démo Visualisation des vélos partagés : Requêtage de l'API : http://data.oslandia.io/bikes http://data.oslandia.io/bikes/doc/ 18

19. Démo: page principale 19

20. Démo: requêtage 20

21. Démo: page Lyon (1/2) 21

22. Démo: page Lyon (2/2) 22

23. Démo: page Terreaux (1/2) 23

24. Démo: page Terreaux (2/2) 24

25. Conclusion 25

26. Conclusion et perspectives Réponse à des questions de recherche simples à partir de données géographiques ouvertes Des portails d'Open Data à la mise en base de données avec Production d'une API pour visualiser la data => vers une mise en production? Online learning: continuer de récolter de la donnée, mettre à jour les modèles d'apprentissage au l de l'eau Luigi 26

27. Merci de votre attention! Des questions ? Pour aller plus loin: et projet Github damien.garaud@oslandia.com raphael.delhome@oslandia.com blog Oslandia github.com/garaud/jitenshea 27

201803 29 meetup_open_transport_prez_oslandia_raphael_delhome_datascience_traces_velo

Recommandé

Recommandé

Contenu connexe

Plus de Open Transport meetup by Kisio

Plus de Open Transport meetup by Kisio (20)

201803 29 meetup_open_transport_prez_oslandia_raphael_delhome_datascience_traces_velo