Présentation de Guillaume Touya aux Journées de la Recherche IGN 2016, sur ses recherches autour d'OpenStreetMap, et notamment la cartographie avancée à partir de données OSM.
3. Pourquoi étudier OpenStreetMap ?
• Projet d’information géographique volontaire le plus important
(2,5 M de contributeurs, 324 M d’objets linéaires ou
surfaciques)
• Source de données libre pour diverses applications
(principalement la cartographie ici)
4. Plan de la présentation
• La qualité des données OpenStreetMap (OSM)
• Par comparaison
• De manière intrinsèque
• Cartographier des données OSM avec la « qualité IGN »
• Hétérogénéité de niveau de détail
• Cartes à grande échelle
• Cartes à petite échelle
5. Mesures de similarité de lignes/polygones
Précision géométrique
Qualité des données par comparaison
[Girres & Touya 2010]
6. Distance de
Levenstein
D(Nantes, Nante) = 1
Par appariement
Exhaustivité Qualité des tags OSM
Qualité des données par comparaison
[Girres & Touya 2010]
Nom des lacs
7. Plan de la présentation
• La qualité des données OpenStreetMap (OSM)
• Par comparaison
• De manière intrinsèque
• Cartographier des données OSM avec la « qualité IGN »
• Hétérogénéité de niveau de détail
• Cartes à grande échelle
• Cartes à petite échelle
8. OSM
Quel est le meilleur emplacement pour
un point d’intérêt ?
9. Quel est le meilleur emplacement pour
un point d’intérêt ?
Google Maps
11. • ~6000 dans Paris
• 3 à 5,5% hors des bâtiments : mauvaise qualité suspectée
• Grande hétérogénéité des emplacements
• Equipements + grands -> + d’erreurs et d’hétérogénéité
% points hors
bâtiments
Moyenne
DC
Écart type
DC
Moyenne
DM
Écart type
DM
« gift_shop » 0 12,9 11,5 2,3 3
Bars, cafés,
restaurants
3 10,8 10,5 2,3 2,1
Cinémas 5,5 16,9 18,4 4,9 4,9
Résultat pour les points de
type « amenities »
12. Plan de la présentation
• La qualité des données OpenStreetMap (OSM)
• Par comparaison
• De manière intrinsèque
• Cartographier des données OSM avec la « qualité IGN »
• Hétérogénéité de niveau de détail
• Cartes à grande échelle
• Cartes à petite échelle
13. Causes:
Hétérogénéité des sources (GPS, images Bing …)
Hétérogénéité des compétences des contributeurs
Pas de niveau de détail dans les specifications
Hétérogénéité du niveau de détail
16. •Nature de l’objet
•Densité de points
•Longueur médiane
•Source de saisie
•Plus petit côté
•Taille
•Empâtement
Inférence du niveau de détail
Décision
multicritères
[Touya & Reimer 2015]
18. Les bâtiments ne sont
pas juste à l’extérieur
des zone bâties
Les lotissements ne sont
pas dans les forêts
Les arrêts de bus sont le
long des routes
Les chemins ne doivent
pas couper les lacs
Détection d’incohérences de niveau de détail
[Touya & Brando 2013]
19. Détection d’incohérences de niveau de détail
Zone bâtie
peu détaillée
Bâtiments
détaillés
Incohérence Bâti/Zone bâtie
Incohérence Route/Arrêt de bus
Incohérence Forêt/Lôtissement Incohérence Lac/Chemin
[Touya & Brando 2013]
20. Plan de la présentation
• La qualité des données OpenStreetMap (OSM)
• Par comparaison
• De manière intrinsèque
• Cartographier des données OSM avec la « qualité IGN »
• Hétérogénéité de niveau de détail
• Cartes à grande échelle
• Cartes à petite échelle
21. Cartes à grande échelle
Comment représenter les objets
peu détaillés ?
[Touya & Baley 2016]
24. Plan de la présentation
• La qualité des données OpenStreetMap (OSM)
• Par comparaison
• De manière intrinsèque
• Cartographier des données OSM avec la « qualité IGN »
• Hétérogénéité de niveau de détail
• Cartes à grande échelle
• Cartes à petite échelle
25. Cartes à petite échelle
Comment généraliser ces objets
très détaillés ?
[Touya & Girres 2014]
27. Conclusion
• OpenStreetMap est un objet de recherche passionnant
• Étudier la qualité sans point de comparaison est un problème
complexe
• Cartographier OSM ne peut pas se faire de la même manière
qu’avec des bases de données « classiques ».
28. Perspectives
• Estimation multicritère de la qualité (vandalisme - crédibilité des
contributeurs)
• Approfondir les techniques d’harmonisation de LoD
• Généralisation tenant compte de l’hétérogénéité de LoD (et de
la qualité variable)
• Impact du tuilage sur les traitements (généralisation et
harmonisation)
29. Retour sur les recherches autour
d’OpenStreetMap
Guillaume Touya
Journées de la recherche IGN – 24 mars 2016
Merci pour votre attention
Des questions ?
30. Bibliographie
• Touya, G. and Savino, S. (2015). Enrichissement automatique et généralisation de réseaux ferrés.
Cartes & Géomatique - Revue du Comité Français de Cartographie, 226:71-80.
• Touya, G. and Reimer, A. (2015). Inferring the scale of OpenStreetMap features. In Jokar
Arsanjani, J., Zipf, A., Mooney, P., and Helbich, M., editors, OpenStreetMap in GIScience, Lecture
Notes in Geoinformation and Cartography, pages 81-99. Springer International Publishing.
• Touya, G. and Girres, J.-F. (2014). Generalising unusual map themes from OpenStreetMap. In
Proceedings of 17th ICA Workshop on Generalisation and Multiple Representation, Vienna,
Austria. ICA.
• Touya, G. and Baley, M. (2014). Harmonizing level of detail in OpenStreetMap based maps. In
Duckham, M., Stewart, K., and Pebesma, E., editors, Proceedings of GIScience 2014 - Poster
session, Vienna, Austria.
• Touya, G. and Brando-Escobar, C. (2013). Detecting Level-of-Detail inconsistencies in volunteered
geographic information data sets. Cartographica: The International Journal for Geographic
Information and Geovisualization, 48(2):134-143.
• Girres, J.-F. and Touya, G. (2010). Quality assessment of the french OpenStreetMap dataset.
Transactions in GIS, 14(4):435-459.
31. Results for ATMs
• 347 ATMs in Paris
• 6,6% outside buildings: bad quality
• 65% on the wall of the buildings: good quality
• 5,9% >15m off centroid and 2m off walls: bad quality
Mean Median Standard deviation
Distance to centroid 17,6 13 12,9
Distance to wall 1,1 0 4,6
32. Results for bus stops
• ~2000 bus stops in Paris
• 13,5% too close (<2m for roads and <1,5m for buildings)
• Only 0,4 too far
• Quite homogeneous quality
Mean
Standard
deviation
Maximum % too close % too far
Distance to roads 6,2 2,9 18,5 6,8 0,4
Distance to
buildings
7,4 5,8 - 6,7 -
33. Résultats d’inférence du niveau de détail
Street City County Region Country
1 : 15k 1 : 50k 1 : 150k 1 : 750k