1. Vers une meilleure interopérabilité
des données géographiques
français es s ur le Web de données
Ghis lain Atemezing
Raphaël Troncy
2. Plan
Où s ont les données géographiques ?
Le m ob ile e t l’u tilis ation d e la g éo-localis ation
D onn ée s g éograp h iqu e s s u r le we b s ém antiqu e
Modélis ation des objets géographiques
M od élis ation d e s e ntités g éograp h iqu e s
M od élis ation d e la g éom étrie
Illu s tration ave c d e s s c énarios
A ligner les représ entations
Formuler quelques recommandations
C onclus ion et travaux futurs
29/ 201 2
06/ IC 201 2, P aris -2
3. Où s ont les données géographiques ?
F ou rs qu are : P O I..
Opengeocoder:
B ounding B ox..
G e oP ortail
G e oN am e s :
C IA F actb ook C od e s d e s p ays
29/ 201 2
06/ IC 201 2, P aris -3
4. Où s ont les données géographiques liées ?
DB pedia, G eoNames
LinkedG eodata (OpenS treetMap), Freebas e (Google)
Ordnance S urvey (UK), GeoLinkedData (E S )
Fournis s eur #Donnée dis ponible
GA DM-RDF
D Bp e d ia 727 232 trip le ts
NUTS -RDF G e oN am e s 5 240 032 (« e ntités »)
Linke d G e oD ata 60 356 364 trip le ts
data.ign.fr (FR)
O rd nance S u rve y 6 295 trip le ts
F re e b as e 8,5 M B (ts v fich ie rs )
G e oLinke d D ata.e s 1 01 01 8 trip le ts
P roj t G AD M
e 682 605 trip le ts
P roj t N U TS
e 31 6 238 trip le ts
29/ 201 2
06/ IC 201 2, P aris -4
5. Données géographiques liées et LOD
31 j u x d e d onn ée s
e
1 9.43% trip le ts
http://lod-c loud.net/s tate
Linking Open Data cloud diagram, by Richard C yganiak and A nja J entzs ch. http://lod-cloud.net/
29/ 201
5 06/ 2 IC 201 2, P aris
7. Quels s ont les modèles IC utilis és ?
Des lis tes d’autorité de termes (Fours quare)
Pe u s tru ctu rée
R e p rés e nte le s catégorie s d e s Points d ’Intérêt
Typ iq u e m e nt, u n typ e rép ons e d ’u ne AP I
N éce s s ite d ’e xp licite r la s ém antiqu e
Des catégories S KOS (GeoNames )
Le s clas s e s s ont d e s skos:conceptScheme
Le s cod e s s ont d e s skos:Concept
Pe u d e clas s e s , d e nom b re u x cod e s
29/ 201 2
06/ IC 201 2, P aris -7
8. Quels s ont les modèles IC utilis és ?
Des ontologies s pécifiques au domaine
Le s ontologie s p ar s ou s -d om aine (trans p ort, u nité
ad m inis trative , hyd rograp h ie , e tc.)
O ntologie s inte rconne ctée s (owl:im p orts )
U K (O S ) – E S (G e oLinke d D ata)
Des ontologies riches cons truites par des
outils automatiques / TA L
Le s clas s e s d e h au t-nive au p ou r s tru ctu re r
LinkedG eoData (1 6 clas s e s d e h au t-nive au ; 1 294
clas s e s au total)
G eOnto (2 clas s e s d e h au t-nive au ; 783 clas s e s au total)
29/ 201 2
06/ IC 201 2, P aris -8
9. Modélis ation de la geométrie
Point (lat/long)
Vocab u laire WG S 84 d écrit au W3C
Rectangle (“ bounding box” )
Vocab u laire g éop olitiq u e (FAO )
Points dans une lis te (« Nodes », « waynodes »)
S éq u e nce d e p oints (Linke d G e oD ata)
Points dans un groupe de res s ources RDF
U n ob j t e s t “form e d B y” Lis tO fPoints (G e oLinke d D ata.e s )
e
Littéraux (représ entation GML inclus e en RDF)
O rd nance S u rve y(U K)
Représ entation c omplètement s tructurée
Le vocab u laire N e oG e o (G e oVocam p )
29/ 201 2
06/ IC 201 2, P aris -9
11. La Tour Eiffel sur DBpedia (un “Building”…)
dbpedia:Eiffel_Tower a dbpedia-owl:Building ;
a <http://schema.org/Place> ; (16 “types” différent)
rdfs:label "Tour Eiffel"@fr ;
geo:lat "48.858299"^^xsd:float ; (WGS84 )
geo:long "2.294500"^^xsd:float ;
geo:geometry "POINT(2.2945 48.8583)" ;
dbpprop:buildingType "Observation tower"@en ;
dbpprop:elevatorCount "9"^^xsd:int ;
dbpprop:location dbpedia:Paris ;
dbpprop:isofRegion "FR-75" ;
dbpprop:architect dbpedia:Stephen_Sauvestre .
29/ 201 2
06/ IC 201 2, P aris -11
12. La Tour Eiffel sur Freebase (un “skyscraper”)
fb:en.eiffel_tower a fb:architecture.building ;
a fb:architecture.skyscraper ; (12 rdf:type in total)
fb:architecture.skyscraper.height_with_antenna_spire_mete
rs "324.0"^^xsd:float ;
fb:location.geocode [
fb:location.geocode.longitude "2.2946"^^xsd:float ;
fb:location.geocode.latitude
"48.85839"^^xsd:float . ] ;
29/ 201 2
06/ IC 201 2, P aris -12
13. La Tour Eiffel sur GeoNames (un “S.MMT”)
gnr:6254976 a gn:Feature ;
gn:name "Eiffel Tower" ;
gn:alternateName " 에펠 탑 "@ko ; (en 45 langues
différentes)
gn:featureClass gn:S [
a skos:ConceptScheme ;
rdfs:comment "spot, building, farm, ..."@en .
] ;
gn:featureCode gn:S.MMT [
a skos:Concept ;
rdfs:comment "a commemorative structure or statue"@en .
] ;
gn:countryCode "FR" ;
geo:lat "48.8583" ;
geo:long "2.29452" .
29/ 201 2
06/ IC 201 2, P aris -13
14. La Tour Eiffel sur LGD (un “chemin” de 45 points)
lgd:way5013364 a lgdo:Building , lgdo:ManMadeTower ,
lgdo:Attraction ;
rdfs:label "Wieża Eiffel'a"@pl ; (en 13 langues.)
lgdo:layer "2";
lgdp:building:height "301";
lgdp:importance "international";
lgdo:hasNodes <
http://linkedgeodata.org/triplify/way5013364/nodes>.
rdf:_1 lgd:node33388356;
…………;
rdf:_10 lgd:node33388333 ;
(tous les 45 points du polygone)
29/ 201 2
06/ IC 201 2, P aris -14
15. 7ème Arrondissement in DBpedia (a gml_Feature)
dbpedia:7th_arrondissement_of_Paris a gml:_Feature ;
(gml n’est pas en OWL )
a <http://dbpedia.org/class/yago/1900SummerOlympicVenuEs>
(Yago Class)
rdfs:label " 巴黎第七區 "@zh; (14 different languages)
dbpprop:commune "Paris" ;
dbpprop:département dbpedia:Paris ;
dbpprop:région dbpedia:Île-de-France_(region) ;
grs:point "48.85916666666667 2.312777777777778" ;
geo:geometry "POINT(2.31278 48.8592)" ; (fake property?!)
geo:lat "48.859165"^^xsd:float;
geo:long "2.312778"^^xsd:float.
29/ 201 2
06/ IC 201 2, P aris -15
16. 7ème Arrondissement in GeoNames (a A.ADM4)
gnr:6618613 a gn:Feature ; gn:name "Paris 07";
gn:alternateName "7ème arrondissement";
gn:featureClass gn:A [
a skos:ConceptScheme ;
rdfs:comment "country, state, region ..."@en .
] ;
gn:featureColde gn:A.ADM4 [
a skos:Concept ;
rdfs:comment
"a subdivision of a third-order administrative division"@en .
];
gn:countryCode "FR";
gn:population "57410";
geo:lat "48.8565";
geo:long "2.321".
29/ 201 2
06/ IC 201 2, P aris -16
17. 7ème Arrondissement in LGD (a “Suburb”)
lgd:node248177663 a lgdo:Suburb ;
rdfs:label "7th Arrondissement"@en , "7e Arrondissement" ;
lgdo:contributor lgd:user13442 ;
<http://linkedgeodata.org/ontology/ref%3AINSEE> 75107 ;
lgdp:alt_name "VIIe Arrondissement" ;
georss:point "48.8570281 2.3201953" ;
geo:lat 48.8570281 ;
geo:long 2.3201953 .
29/ 201 2
06/ IC 201 2, P aris -17
18. Vocabulaire G eOnto
Ontologie des objets géographiques (PI)
R és u ltat d ’u n p roj t AN R
e
O b te nu e p ar d e s ou tils d e TAL
R e cou vre la p artie BD Top o (IG N )
C las s es en français
rdfs:labels e n F R & E N
Pas d e rdfs:comments
Pe u d e re lations
783 clas s e s
29/ 201 2
06/ IC 201 2, P aris -18
19. Méthodologie d’alignement
A lignement de G eOnto avec 4 vocabulaires et 2
taxonomies
LG D , D Bp e d ia, S ch e m a.org, G e oN am e s
F ou rs q u are , G oogle P lace s
Recherc he des owl:equivalentClass
O u til : S ilk
M étriq u e s : Le ve ns h te inD is tance , Jaro
Lab e ls : @ e n d e s clas s e s
F onction d ’agrégation : m oye nne
Validation manuelle
Pou r le s « rd fs :s u b C las s O f »
Aligne m e nt s p écifiq u e ave c G e oN am e s
29/ 201 2
06/ IC 201 2, P aris -19
20. Procédé d’alignement avec GeoNames
geOnto:AGeoConcept a
owl:Class;
rdfs:label “a laben”@en;
rdfs:subClassOf gn:Feature;
owl:equivalentClass
[a owl:Restriction;
owl:onProperty
gn:featureCode;
owl:hasValue gn:CODE. ]
29/ 201 2
06/ IC 201 2, P aris - 20
21. Rés ultats /E valuation
Vocab/taxonomies #C las s es #C las s es
alignées
LG D owl:Class: 1 294 1 78
D B p e d ia owl:Class:366 42
S ch e m a.org owl:Class: 296 52
G e oN am e s skos:Concept:699 287
F ou rs qu are 359 46
G oogle P lace 1 26 41
Precis ions généralement > 80%
S auf P(S chema.org) = 50%.
R ais on p os s ib le : le s e ntités G e O nto p lu s s p écifiq u e s à la France
N ive au trop d étaillé d e s e ntités s u r S ch e m a.org
29/ 201 2
06/ IC 201 2, P aris - 21
22. Recommendations
S éparation des objets de leur géométrie
Bie n d is tingu e r d ans le s e s p ace s d e nom m age
E xe m p le : sp atial ature vs ge om :G e om e try
:Fe
Us age du voc abulaire WGS 84 pour représ enter les
points
R éu tilis e r le s p rop riétés native s (long; lat; alt)
G éométrie complexe (polygone, courbe, etc.)
U tilis e r le s re p rés e ntations p lu s s tru ctu rée s
E vite r au m axim u m le s n œu d s anonym e s d ans le s d onn ée s
P rop os e r d e s trans form ations au x form ats S IG (KM L, G M L, e tc.)
E xtens ion de G eOnto
U n b on cand id at: N e oG e o
P u b lie r s e lon le s Bonne s P ratiq u e s (d ata.ign.fr)
29/ 201 2
06/ IC 201 2, P aris - 22
23. Pers pectives
Publier GeOnto++
S e lon le s Bonne s P ratiq u e s d u we b d e d onn ée s liée s
« Lifter les données de l’IGN
»
E n u tilis ant le vocab u laire
Pours uivre les A lignements
S ch e m a.org, F ou rs qu are , G oogle P lace (évolu tif)
G e oS PAR Q L
P roc éd e r à d e s aligne m e nts au nive au d e s d onn és
29/ 201 2
06/ IC 201 2, P aris - 23