Etienne Come : Apprentissage non supervisé, application à des données smart-cards (vélos en libre service et transport en commun)
1. Apprentissage non supervisé, application à des données de
mobilité
Etienne Côme UGE/COSYS/GRETTIA
Séminaire IA & Mobilité, 18 Mars 2021
Firefox https://www.comeetie.fr/partage/iamob/
1 sur 71 04/05/2021 à 17:10
2. Etienne Côme
UGE, recherche appliquée
données urbaines, données transport
apprentissage semi,non-supervisé, modèles génératifs
Firefox https://www.comeetie.fr/partage/iamob/
2 sur 71 04/05/2021 à 17:10
8. Intérêt des données billettiques
faciliter la gestion des payements mais aussi ...
Données billettiques vs. données classiques (ex. enquêtes)
Meilleure couverture des usagers
Meilleure précision temporelle et spatiale
Possibilité d'étude longitudinale sur une longue période
Intérêt majeur pour les opérateurs de transport...
Évaluer les performances du réseau
Mieux comprendre et prédire la demande
... et pour les autorités organisatrices des transports
Firefox https://www.comeetie.fr/partage/iamob/
8 sur 71 04/05/2021 à 17:10
9. Visualiser et analyser des données Vélib'
2 sources de données :
Les Stocks
en open-data quasiment partout
Les Flux
Origines / Destinations parfois en open-data et parfois pas
Firefox https://www.comeetie.fr/partage/iamob/
9 sur 71 04/05/2021 à 17:10
10. Des stocks en mouvements
Firefox https://www.comeetie.fr/partage/iamob/
10 sur 71 04/05/2021 à 17:10
11. Des stocks en mouvements
Un déséquilibrage important
Un challenge pour la régulation
Un mouvement // une pulsation répétitive
Firefox https://www.comeetie.fr/partage/iamob/
11 sur 71 04/05/2021 à 17:10
12. Stocks data : vlsstat
Firefox https://www.comeetie.fr/partage/iamob/
12 sur 71 04/05/2021 à 17:10
13. Stocks data : vlsstat
Données historique pour analyse
Aggrégation / Comparaison
http://vlsstats.ifsttar.fr/rawdata/
Firefox https://www.comeetie.fr/partage/iamob/
13 sur 71 04/05/2021 à 17:10
14. Clustering sur les données de stock
The Discriminative Functional Mixture Model for the Analysis of Bike Sharing Systems [preprint]
Firefox https://www.comeetie.fr/partage/iamob/
14 sur 71 04/05/2021 à 17:10
15. Clustering sur les données de stock
The Discriminative Functional Mixture Model for the Analysis of Bike Sharing Systems [preprint]
Firefox https://www.comeetie.fr/partage/iamob/
15 sur 71 04/05/2021 à 17:10
16. Clustering sur les données de stock
The Discriminative Functional Mixture Model for the Analysis of Bike Sharing Systems [preprint]
Firefox https://www.comeetie.fr/partage/iamob/
16 sur 71 04/05/2021 à 17:10
17. Clustering sur les données de stock
The Discriminative Functional Mixture Model for the Analysis of Bike Sharing Systems [preprint]
Firefox https://www.comeetie.fr/partage/iamob/
17 sur 71 04/05/2021 à 17:10
18. Des flux pour décortiquer la dynamique urbaine
http://www.comeetie.fr/galerie/velib/
Firefox https://www.comeetie.fr/partage/iamob/
18 sur 71 04/05/2021 à 17:10
19. Modèle
(observée): Nbr de vélos arrivant/partant
(latente): cluster de la station s
(observée): cluster des jours (week end / semaine)
Approche générative :
+ contraintes ,
avec nbr de jours du cluster .
Xsdt
Zs
Wd
∼ M(1, π)
Zs
|{ = 1, = 1} ∼ P( )
Xsdt Zsk Wdl αsλklt
= DT, ∀k ∈ {1, . . . , K}
∑l,t Dlλklt
Dl l
Firefox https://www.comeetie.fr/partage/iamob/
19 sur 71 04/05/2021 à 17:10
23. Latent Dirichlet Allocation
Pour l'analyse de matrices Origine-Destination dynamiques
OD générées par un processus localement stationaires
Segmentation en petits sacs de déplacements consécutifs stationarité
Documents (sac de mots) = sacs de déplacements consécutifs (5000)
Avec :
Mots = couples Origin/Destination
Topics = Activités Latentes
≈
Firefox https://www.comeetie.fr/partage/iamob/
23 sur 71 04/05/2021 à 17:10
24. Latent Dirichlet Allocation
Pour l'analyse de matrices Origine-Destination dynamiques
Pour chaque activité latente :
Pour chaque sac de déplacement
Tirer les portions de chaque activité :
Pour chaque déplacement
Tirer son activité
Tirer l'origine-destination
a ∼ D(β)
Λa
∼ D(α)
πt
A ∼ M(1, )
πt
D ∼ M(1, )
ΛA
Firefox https://www.comeetie.fr/partage/iamob/
24 sur 71 04/05/2021 à 17:10
25. Résultats de la décomposition
Sélection de modèle perplexité
(saut abrupt pour K=5)
πt
Firefox https://www.comeetie.fr/partage/iamob/
25 sur 71 04/05/2021 à 17:10
26. Balances des stations : Domicile→Travail
Firefox https://www.comeetie.fr/partage/iamob/
26 sur 71 04/05/2021 à 17:10
27. Balances des stations : Travail→Domicile
Firefox https://www.comeetie.fr/partage/iamob/
27 sur 71 04/05/2021 à 17:10
28. Balances des stations : Début de soirée
Firefox https://www.comeetie.fr/partage/iamob/
28 sur 71 04/05/2021 à 17:10
30. Des données simples
identifiant anonymisé de l'usager (3 mois)
type de titre de transport
station de la validation (+ligne et direction pour les bus)
jour et heure de la validation
Open-Data ? (ex STIF données aggrégées)
Firefox https://www.comeetie.fr/partage/iamob/
30 sur 71 04/05/2021 à 17:10
31. Des données simples
identifiant anonymisé de l'usager (3 mois)
type de titre de transport
station de la validation (+ligne et direction pour les bus)
jour et heure de la validation
Une donnée à part l'identifiant usager
Firefox https://www.comeetie.fr/partage/iamob/
31 sur 71 04/05/2021 à 17:10
32. Un jeu de données riche
identifiant anonymisé de l'usager (3 mois)
type de titre de transport
station de la validation (+ligne et direction pour les bus)
jour et heure de la validation
2 ans de profondeur temporelle
Firefox https://www.comeetie.fr/partage/iamob/
32 sur 71 04/05/2021 à 17:10
33. Que faire sans identifiant ?
Analyse des volumes entrants
Clustering des jours
→ détection d'outliers, prévision moyen terme,...
Clustering des stations
→ analyse de l'offre, prévision moyen terme,...
Que permet de faire l'identifiant usager ?
Reconstruction des destinations
→ analyse des correspondances, matrice OD dynamique,...
Prévision court terme des OD
Clustering des usagers
Firefox https://www.comeetie.fr/partage/iamob/
33 sur 71 04/05/2021 à 17:10
34. Analyse des volumes entrant
Firefox https://www.comeetie.fr/partage/iamob/
34 sur 71 04/05/2021 à 17:10
35. Des profils qui varient dans l'espace et dans le temps
Firefox https://www.comeetie.fr/partage/iamob/
35 sur 71 04/05/2021 à 17:10
36. Des profils qui varient dans l'espace et dans le temps
Firefox https://www.comeetie.fr/partage/iamob/
36 sur 71 04/05/2021 à 17:10
37. Des profils qui varient dans l'espace et dans le temps
Firefox https://www.comeetie.fr/partage/iamob/
37 sur 71 04/05/2021 à 17:10
38. Une variété inter journalière visible (CAH)
Firefox https://www.comeetie.fr/partage/iamob/
38 sur 71 04/05/2021 à 17:10
39. Une variété inter journalière visible (CAH)
Firefox https://www.comeetie.fr/partage/iamob/
39 sur 71 04/05/2021 à 17:10
40. Une variété inter journalière visible (CAH)
Firefox https://www.comeetie.fr/partage/iamob/
40 sur 71 04/05/2021 à 17:10
41. Une variété inter journalière visible (CAH)
Firefox https://www.comeetie.fr/partage/iamob/
41 sur 71 04/05/2021 à 17:10
42. Une variété inter journalière visible (CAH)
Firefox https://www.comeetie.fr/partage/iamob/
42 sur 71 04/05/2021 à 17:10
43. Qui s'explique majoritairement par des effets calendaires
Firefox https://www.comeetie.fr/partage/iamob/
43 sur 71 04/05/2021 à 17:10
44. Qui peuvent être exploités pour détecter des outliers
Firefox https://www.comeetie.fr/partage/iamob/
44 sur 71 04/05/2021 à 17:10
45. Qui peuvent être exploités pour détecter des outliers
#Rennes #metro #Star des chaises jetées sur la ligne aérienne de métro à Villejean. Dégâts
importants. Trafic interrompu pendant 2h?
— Samuel Nohra (@SamuelNohra) 29 mars 2016
Firefox https://www.comeetie.fr/partage/iamob/
45 sur 71 04/05/2021 à 17:10
46. Ou faire des prévisions à moyen terme
Firefox https://www.comeetie.fr/partage/iamob/
46 sur 71 04/05/2021 à 17:10
47. Ou faire des prévisions à moyen terme
Firefox https://www.comeetie.fr/partage/iamob/
47 sur 71 04/05/2021 à 17:10
48. Une variabilité également spatiale
Firefox https://www.comeetie.fr/partage/iamob/
48 sur 71 04/05/2021 à 17:10
49. Une variabilité également spatiale
Firefox https://www.comeetie.fr/partage/iamob/
49 sur 71 04/05/2021 à 17:10
50. Une variabilité également spatiale
Firefox https://www.comeetie.fr/partage/iamob/
50 sur 71 04/05/2021 à 17:10
51. Une variabilité également spatiale
Firefox https://www.comeetie.fr/partage/iamob/
51 sur 71 04/05/2021 à 17:10
53. Permet de reconstituer une partie siginificative des trajets
Firefox https://www.comeetie.fr/partage/iamob/
53 sur 71 04/05/2021 à 17:10
54. Permet de reconstituer une partie siginificative des trajets
Firefox https://www.comeetie.fr/partage/iamob/
54 sur 71 04/05/2021 à 17:10
55. Permet de reconstituer une partie siginificative des trajets
Firefox https://www.comeetie.fr/partage/iamob/
55 sur 71 04/05/2021 à 17:10
56. Permet de reconstituer une partie siginificative des trajets
Firefox https://www.comeetie.fr/partage/iamob/
56 sur 71 04/05/2021 à 17:10
57. Permet de reconstituer une partie siginificative des trajets
Firefox https://www.comeetie.fr/partage/iamob/
57 sur 71 04/05/2021 à 17:10
58. Enrichissement des données
Utilisation de l'origine suivante pour inférer la destination
Utilisation de seuils spatiaux et temporels
Détection des correspondances
Nécessite de garder les identifiants 48h
72% de destinations reconstruites
→ Permet des aggrégations par OD
→ Analyse des Pôles d'échange (C. Richer)
→ Matrice OD dynamique ou serpent de charge
Firefox https://www.comeetie.fr/partage/iamob/
58 sur 71 04/05/2021 à 17:10
60. Clustering usagers
pour une analyse centrée sur l'utilisateur
Firefox https://www.comeetie.fr/partage/iamob/
60 sur 71 04/05/2021 à 17:10
61. Objectif
Etudier les habitudes temporelle des usagers
Regarder comment se décompose la charge
Mieux connaitre les usagers
Méthode
Profil d'utilisation
Clustering
Firefox https://www.comeetie.fr/partage/iamob/
61 sur 71 04/05/2021 à 17:10
62. Objectif
Etudier les habitudes temporelle des usagers
Regarder comment se décompose la charge
Mieux connaitre les usagers
Méthode
Profil d'utilisation
Clustering
Firefox https://www.comeetie.fr/partage/iamob/
62 sur 71 04/05/2021 à 17:10
63. Un usage pendulaire
Profil moyen d'un cluster 4.55% du jeu de données
Firefox https://www.comeetie.fr/partage/iamob/
63 sur 71 04/05/2021 à 17:10
64. Un usage pendulaire
Profil moyen d'un cluster 12.54% du jeu de données
Firefox https://www.comeetie.fr/partage/iamob/
64 sur 71 04/05/2021 à 17:10
65. Un usage pendulaire
Profil moyen d'un cluster 3.6% du jeu de données
Firefox https://www.comeetie.fr/partage/iamob/
65 sur 71 04/05/2021 à 17:10
66. Mais pas que
Profil moyen d'un cluster 15.13% du jeu de données
Firefox https://www.comeetie.fr/partage/iamob/
66 sur 71 04/05/2021 à 17:10
67. Mais pas que
Profil moyen d'un cluster 6.44% du jeu de données
Firefox https://www.comeetie.fr/partage/iamob/
67 sur 71 04/05/2021 à 17:10
68. Mais pas que
Profil moyen d'un cluster 8.64% du jeu de données
Firefox https://www.comeetie.fr/partage/iamob/
68 sur 71 04/05/2021 à 17:10
69. Conclusion
Traces numérique ne répondent pas à toute les questions
Les traces numériques de mobilités sont riches
Modèles à variables latentes discrètes cadre riche et flexible
Analyse exploratoire / mise en avant des variations
Nécessite des outils de fouilles (volume des données)
Outils prédictifs dans un contexte stationaire
! Pas adapté à l'extrapolation
Couplage / simulation / modélisation
Firefox https://www.comeetie.fr/partage/iamob/
69 sur 71 04/05/2021 à 17:10
70. Travaux en cours
Données de téléphonie
Modèle gravitaire sur graphes // dc-SBM
Graph embedding
Prédiction de la charge dans les métros (RATP)
Analyse des flux dans un pôle multimodal (RATP)
Firefox https://www.comeetie.fr/partage/iamob/
70 sur 71 04/05/2021 à 17:10
71. Merci de votre attention !
@comeetie, http://www.comeetie.fr, scholar
Firefox https://www.comeetie.fr/partage/iamob/
71 sur 71 04/05/2021 à 17:10