SlideShare une entreprise Scribd logo
SotM-France 2016
Addok, BAN et BANO dans un bateau
Clermont-Ferrand le 21-05-2015
Frédéric Rodrigo <fred.rodrigo@gmail.com>
(c)left 2016 - CC-BY-SA v3.0
Dans les épisodes précédents
BAN vs BANO
BAN
● BAN "gratuite de repartage"
● BAN ODbL
● Arrêts des prise en compte des remontées github
– https://github.com/etalab/ban-data/issues
● Guichet adresses « fermé »
– https://orgpub-adresse.data.gouv.fr/register/
→ Besoin de corriger soit même des aberrations
avant usage (pour l'instant)
name=
Domaine de la Vigne/Voie 1/Voie 101/Voie 102/Voie 103/Voie 104/Voie
105/Voie 106/Voie 107/Voie 11/Voie 111/Voie 112/Voie 114/Voie
115/Voie 116/Voie 186/Voie 2/Voie 201/Voie 202/Voie 203/Voie
21/Voie 211/Voie 212/Voie 213/Voie 214/Voie 215/Voie 216/Voie
217/Voie 218/Voie 219/Voie 22/Voie 220/Voie 221/Voie 223/Voie
224/Voie 226/Voie 227/Voie 23/Voie 24/Voie 25/Voie 252/Voie
253/Voie 254/Voie 255/Voie 3/Voie 31/Voie 311/Voie 312/Voie
313/Voie 32/Voie 33/Voie 331/Voie 332/Voie 333/Voie 334/Voie
335/Voie 336/Voie 337/Voie 338/Voie 339/Voie 34/Voie 401/Voie
402/Voie 403/Voie 41/Voie 410/Voie 411/Voie 412/Voie 42/Voie
43/Voie 44, DOMAINE DE LA VIGNE|DOM DE LA VIGNE VOI 1|DOM
DE LA VIGNE VOI 101|DOM DE LA VIGNE VO
Addok – sur le pont
● Géocodage
● Géocodage inverse
● Autocompletion
● En lot
● Approche différentes
– n-gramme
Addok – le moteur
● Tout en mémoire : Redis
→ rapide
● Prétraitement
– 10e, 10eme, xe, xeme → dixieme
● Index : name, number, street, postcode, city
● Filtres : type (house/city), postcode
Addok – sur la passerelle, à tribord
● 15 Go en mémoire pour la BAN
● Mise en jour impossible
– Mise à jour trop lente
– Besoin de deux instances d'Addok
● Initialement un outil pour de l'autocompletion
Addok – sur la passerelle, à bâbord
● Recherche uniquement en plein texte
– ne profite pas de la structure de l'adresse
● Score des résultats
– ranking des résultats
– non comparables entre géocodages
– besoin d'un score qui donne un écart entre la
requête et le résultat
● Ne gère pas les mots attachés
– Champ-Laurent, Champlaurent
panneaux-election.fr
● Récolter la liste des panneaux d'affichage légal
pour les élections
● Uniformiser les données
● Publier en OpenData sur data.gouv.fr
● Proposer des tournées d'affichages par
cantons
→ Réalisé par Quorum Impact et Mapotempo
panneaux-election.fr
● Adresses de qualité très variable
– SERVIAN, Ecole Jules Ferry
– TRESLON,entre le 8 et 10 grande rue
– SAINT-PIERRE-d'OLÉRON, salle municipale
Arceau Le Marais Camus
– BAZAS, CENTRE CULTUREL MARCEL MARTIN
– CHAUNY, Rue Emile Zola n°4
– Hauville, Parking en face de la salle communale,
Route de Routot
– BASTELICACCIA, Mairie
panneaux-election.fr
● Mais
– On connaît la commune
● code postal, nom
● INSEE
● Géocodage en 2 temps
● Chercher la commune
→ retrouver le code INSEE
● Chercher dans la commune
panneaux-election.fr
● Mais (bis)
– Nom de communes abrégées
● Brive ? Non Brive-la-Gaillarde
● Adelans ? Adelans-et-le-Val-de-Bithaine
– Géocodage de POI
● Utiliser des POI d'OSM
Plugin Addok – En 2 passes
https://github.com/Mapotempo/addok-search2steps
● Profiter le structure de l'adresse
● Rechercher la commune → INSEE
● Recherche l'adresse avec le code INSEE
comme filtre
● Ajout d'une sorte de filtre flou sur le nom de la
commune
Plugin Addok – postalcode ~ name
https://github.com/Mapotempo/addok-postcode_usage_name_BAN_FR
● Supporte indifféremment le code postal et/ou le
nom de la commune
● Sans
– 33000 Bordeaux → street, 0.6223833333333332
– Bordeaux→ city, 0.8968999999999999
– 33000 → street, 0.6223833333333332
● Avec
– 33000 Bordeaux → city, 0.9784363636363637
– Bordeaux → city, 0.9784363636363637
– 33000 → city, 0.9784363636363637
Plugin Addok – nom composée
https://github.com/Mapotempo/addok-postcode_usage_name_BAN_FR
● Supporte indifféremment les premières parties
des nom composées
● Rue du Soleil, Adelans
– Sans : Rue d'Adelans 70300 Citers
● 0.4773813852813853
– Avec : Rue du Val 70200 Adelans-et-le-Val-de-
Bithaine
● 0.5539051383399209
Pré-Addok – POI
https://github.com/osm-fr/osmpoi4addok
● Au delà des adresses
– Mairie, poste, école, bâtiment nommés
● Addok support des types d'objet
– Type : city, housenumber… et poi
● Description multiples
– amenity=townhall
● Hôtel de ville / Mairie
● Extraction de POI depuis OSM
À la proue
● BAN / BANO pas directement utilisable
– BANO incomplet
– Plusieurs types de communes
– Manque Paris, Lyon, Marseille
– Ajustement des d'erreurs non prises en compte dans
la BAN
● Projet de correction et rediffusion de la BAN ?
● Base BAN+BANO ?
● Accélérer l'intégration des adresses à OSM ?

Contenu connexe

Plus de Frédéric Rodrigo

Cartography: Vector Tiles From an Open Initiative To an Industry Standard
Cartography: Vector Tiles  From an Open Initiative To an Industry StandardCartography: Vector Tiles  From an Open Initiative To an Industry Standard
Cartography: Vector Tiles From an Open Initiative To an Industry StandardFrédéric Rodrigo
 
Osmose-QA, OpenData, Mapillary and MapCSS
Osmose-QA, OpenData, Mapillary and MapCSSOsmose-QA, OpenData, Mapillary and MapCSS
Osmose-QA, OpenData, Mapillary and MapCSSFrédéric Rodrigo
 
Automatic Enhancement of Pedestrian Route using extracted Landmarks from OSM
Automatic Enhancement of Pedestrian Route using extracted Landmarks from OSMAutomatic Enhancement of Pedestrian Route using extracted Landmarks from OSM
Automatic Enhancement of Pedestrian Route using extracted Landmarks from OSMFrédéric Rodrigo
 
Annoter automatiquement un itinéraire piéton avec des repères issus d'OSM
Annoter automatiquement un itinéraire piéton avec des repères issus d'OSMAnnoter automatiquement un itinéraire piéton avec des repères issus d'OSM
Annoter automatiquement un itinéraire piéton avec des repères issus d'OSMFrédéric Rodrigo
 
Osmose : la conquête du monde
Osmose : la conquête du mondeOsmose : la conquête du monde
Osmose : la conquête du mondeFrédéric Rodrigo
 
5/5 Osm 20141118-l2.3-réutilisation
5/5 Osm 20141118-l2.3-réutilisation5/5 Osm 20141118-l2.3-réutilisation
5/5 Osm 20141118-l2.3-réutilisationFrédéric Rodrigo
 
3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap
3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap
3/5 Osm 20141118-l2.1-être à l'aise avec open streetmapFrédéric Rodrigo
 
2/5 Osm 20141106-l1.2-initiation à la contribution
2/5 Osm 20141106-l1.2-initiation à la contribution2/5 Osm 20141106-l1.2-initiation à la contribution
2/5 Osm 20141106-l1.2-initiation à la contributionFrédéric Rodrigo
 
1/5 Osm 20141106-l1.1-présentation
1/5 Osm 20141106-l1.1-présentation1/5 Osm 20141106-l1.1-présentation
1/5 Osm 20141106-l1.1-présentationFrédéric Rodrigo
 
Osmose, quality assurance tool
Osmose, quality assurance toolOsmose, quality assurance tool
Osmose, quality assurance toolFrédéric Rodrigo
 

Plus de Frédéric Rodrigo (20)

Cartography: Vector Tiles From an Open Initiative To an Industry Standard
Cartography: Vector Tiles  From an Open Initiative To an Industry StandardCartography: Vector Tiles  From an Open Initiative To an Industry Standard
Cartography: Vector Tiles From an Open Initiative To an Industry Standard
 
Osmose-QA, OpenData, Mapillary and MapCSS
Osmose-QA, OpenData, Mapillary and MapCSSOsmose-QA, OpenData, Mapillary and MapCSS
Osmose-QA, OpenData, Mapillary and MapCSS
 
Automatic Enhancement of Pedestrian Route using extracted Landmarks from OSM
Automatic Enhancement of Pedestrian Route using extracted Landmarks from OSMAutomatic Enhancement of Pedestrian Route using extracted Landmarks from OSM
Automatic Enhancement of Pedestrian Route using extracted Landmarks from OSM
 
Annoter automatiquement un itinéraire piéton avec des repères issus d'OSM
Annoter automatiquement un itinéraire piéton avec des repères issus d'OSMAnnoter automatiquement un itinéraire piéton avec des repères issus d'OSM
Annoter automatiquement un itinéraire piéton avec des repères issus d'OSM
 
OSRM, Utilisation avancée
OSRM, Utilisation avancéeOSRM, Utilisation avancée
OSRM, Utilisation avancée
 
Open Traffic
Open TrafficOpen Traffic
Open Traffic
 
Osmose-QA
Osmose-QAOsmose-QA
Osmose-QA
 
OSRM L'état du routage
OSRM L'état du routageOSRM L'état du routage
OSRM L'état du routage
 
Osmose-QA
Osmose-QAOsmose-QA
Osmose-QA
 
Osmose-QA OpenData
Osmose-QA OpenDataOsmose-QA OpenData
Osmose-QA OpenData
 
20150607 sotm-us-osmose-qa
20150607 sotm-us-osmose-qa20150607 sotm-us-osmose-qa
20150607 sotm-us-osmose-qa
 
Mapotempo
MapotempoMapotempo
Mapotempo
 
Osmose : la conquête du monde
Osmose : la conquête du mondeOsmose : la conquête du monde
Osmose : la conquête du monde
 
5/5 Osm 20141118-l2.3-réutilisation
5/5 Osm 20141118-l2.3-réutilisation5/5 Osm 20141118-l2.3-réutilisation
5/5 Osm 20141118-l2.3-réutilisation
 
3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap
3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap
3/5 Osm 20141118-l2.1-être à l'aise avec open streetmap
 
2/5 Osm 20141106-l1.2-initiation à la contribution
2/5 Osm 20141106-l1.2-initiation à la contribution2/5 Osm 20141106-l1.2-initiation à la contribution
2/5 Osm 20141106-l1.2-initiation à la contribution
 
1/5 Osm 20141106-l1.1-présentation
1/5 Osm 20141106-l1.1-présentation1/5 Osm 20141106-l1.1-présentation
1/5 Osm 20141106-l1.1-présentation
 
L'état de l'Osmose
L'état de l'OsmoseL'état de l'Osmose
L'état de l'Osmose
 
Osmose, quality assurance tool
Osmose, quality assurance toolOsmose, quality assurance tool
Osmose, quality assurance tool
 
OpenData & OpenStreetMap
OpenData & OpenStreetMapOpenData & OpenStreetMap
OpenData & OpenStreetMap
 

Addok, BAN et BANO dans un bateau

  • 1. SotM-France 2016 Addok, BAN et BANO dans un bateau Clermont-Ferrand le 21-05-2015 Frédéric Rodrigo <fred.rodrigo@gmail.com> (c)left 2016 - CC-BY-SA v3.0
  • 2. Dans les épisodes précédents
  • 4. BAN ● BAN "gratuite de repartage" ● BAN ODbL ● Arrêts des prise en compte des remontées github – https://github.com/etalab/ban-data/issues ● Guichet adresses « fermé » – https://orgpub-adresse.data.gouv.fr/register/ → Besoin de corriger soit même des aberrations avant usage (pour l'instant)
  • 5. name= Domaine de la Vigne/Voie 1/Voie 101/Voie 102/Voie 103/Voie 104/Voie 105/Voie 106/Voie 107/Voie 11/Voie 111/Voie 112/Voie 114/Voie 115/Voie 116/Voie 186/Voie 2/Voie 201/Voie 202/Voie 203/Voie 21/Voie 211/Voie 212/Voie 213/Voie 214/Voie 215/Voie 216/Voie 217/Voie 218/Voie 219/Voie 22/Voie 220/Voie 221/Voie 223/Voie 224/Voie 226/Voie 227/Voie 23/Voie 24/Voie 25/Voie 252/Voie 253/Voie 254/Voie 255/Voie 3/Voie 31/Voie 311/Voie 312/Voie 313/Voie 32/Voie 33/Voie 331/Voie 332/Voie 333/Voie 334/Voie 335/Voie 336/Voie 337/Voie 338/Voie 339/Voie 34/Voie 401/Voie 402/Voie 403/Voie 41/Voie 410/Voie 411/Voie 412/Voie 42/Voie 43/Voie 44, DOMAINE DE LA VIGNE|DOM DE LA VIGNE VOI 1|DOM DE LA VIGNE VOI 101|DOM DE LA VIGNE VO
  • 6. Addok – sur le pont ● Géocodage ● Géocodage inverse ● Autocompletion ● En lot ● Approche différentes – n-gramme
  • 7. Addok – le moteur ● Tout en mémoire : Redis → rapide ● Prétraitement – 10e, 10eme, xe, xeme → dixieme ● Index : name, number, street, postcode, city ● Filtres : type (house/city), postcode
  • 8. Addok – sur la passerelle, à tribord ● 15 Go en mémoire pour la BAN ● Mise en jour impossible – Mise à jour trop lente – Besoin de deux instances d'Addok ● Initialement un outil pour de l'autocompletion
  • 9. Addok – sur la passerelle, à bâbord ● Recherche uniquement en plein texte – ne profite pas de la structure de l'adresse ● Score des résultats – ranking des résultats – non comparables entre géocodages – besoin d'un score qui donne un écart entre la requête et le résultat ● Ne gère pas les mots attachés – Champ-Laurent, Champlaurent
  • 10. panneaux-election.fr ● Récolter la liste des panneaux d'affichage légal pour les élections ● Uniformiser les données ● Publier en OpenData sur data.gouv.fr ● Proposer des tournées d'affichages par cantons → Réalisé par Quorum Impact et Mapotempo
  • 11. panneaux-election.fr ● Adresses de qualité très variable – SERVIAN, Ecole Jules Ferry – TRESLON,entre le 8 et 10 grande rue – SAINT-PIERRE-d'OLÉRON, salle municipale Arceau Le Marais Camus – BAZAS, CENTRE CULTUREL MARCEL MARTIN – CHAUNY, Rue Emile Zola n°4 – Hauville, Parking en face de la salle communale, Route de Routot – BASTELICACCIA, Mairie
  • 12. panneaux-election.fr ● Mais – On connaît la commune ● code postal, nom ● INSEE ● Géocodage en 2 temps ● Chercher la commune → retrouver le code INSEE ● Chercher dans la commune
  • 13. panneaux-election.fr ● Mais (bis) – Nom de communes abrégées ● Brive ? Non Brive-la-Gaillarde ● Adelans ? Adelans-et-le-Val-de-Bithaine – Géocodage de POI ● Utiliser des POI d'OSM
  • 14. Plugin Addok – En 2 passes https://github.com/Mapotempo/addok-search2steps ● Profiter le structure de l'adresse ● Rechercher la commune → INSEE ● Recherche l'adresse avec le code INSEE comme filtre ● Ajout d'une sorte de filtre flou sur le nom de la commune
  • 15. Plugin Addok – postalcode ~ name https://github.com/Mapotempo/addok-postcode_usage_name_BAN_FR ● Supporte indifféremment le code postal et/ou le nom de la commune ● Sans – 33000 Bordeaux → street, 0.6223833333333332 – Bordeaux→ city, 0.8968999999999999 – 33000 → street, 0.6223833333333332 ● Avec – 33000 Bordeaux → city, 0.9784363636363637 – Bordeaux → city, 0.9784363636363637 – 33000 → city, 0.9784363636363637
  • 16. Plugin Addok – nom composée https://github.com/Mapotempo/addok-postcode_usage_name_BAN_FR ● Supporte indifféremment les premières parties des nom composées ● Rue du Soleil, Adelans – Sans : Rue d'Adelans 70300 Citers ● 0.4773813852813853 – Avec : Rue du Val 70200 Adelans-et-le-Val-de- Bithaine ● 0.5539051383399209
  • 17. Pré-Addok – POI https://github.com/osm-fr/osmpoi4addok ● Au delà des adresses – Mairie, poste, école, bâtiment nommés ● Addok support des types d'objet – Type : city, housenumber… et poi ● Description multiples – amenity=townhall ● Hôtel de ville / Mairie ● Extraction de POI depuis OSM
  • 18. À la proue ● BAN / BANO pas directement utilisable – BANO incomplet – Plusieurs types de communes – Manque Paris, Lyon, Marseille – Ajustement des d'erreurs non prises en compte dans la BAN ● Projet de correction et rediffusion de la BAN ? ● Base BAN+BANO ? ● Accélérer l'intégration des adresses à OSM ?