La fiche collègeLes données locales dans l’écosystème du webData Tuesday25 juin 2013
Ouverture de données publiques sur le Web : juillet 2011Contexte• un catalogue basé sur un modèle normalisé : CKAN et DCAT...
ProblèmeComment interroger ces données de manière croisée ?Avec l’aide de la société Mondeca, nous avons décidé d’expérime...
• Étape 1 Identifier le sens de chaque entité d’information : nom, identifiant,pourcentage, valeur numérique, localisation...
Objet 1 : établissement scolaire• Type collège public• Classe : équipement• Propriétés : adresse, personnes responsables, ...
• Une ontologie basée sur la base permanente deséquipements de l’INSEE• Un démonstrateur permettant aux utilisateurs finau...
• Un entrepôt RDF permettant d’exécuter des requêtes sur les données liéesLes résultatsModélisation par ontologie
Les résultatsModélisation par ontologie• Un bilan des apports et des connaissances nécessaires liés àl’utilisation des tec...
Merci de votre attentionLes données fiche collège :http://github.com/datalocale/rdf-data@datalocaleMondeca
Prochain SlideShare
Chargement dans…5
×

5 pascal romain - conseil régional de la gironde

967 vues

Publié le

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
967
Sur SlideShare
0
Issues des intégrations
0
Intégrations
299
Actions
Partages
0
Téléchargements
3
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

5 pascal romain - conseil régional de la gironde

  1. 1. La fiche collègeLes données locales dans l’écosystème du webData Tuesday25 juin 2013
  2. 2. Ouverture de données publiques sur le Web : juillet 2011Contexte• un catalogue basé sur un modèle normalisé : CKAN et DCAT• des jeux de données sur des thématiques variées :• transport, équipement• horaires, effectifs, sport pratiqué• des éléments de contexte fournis par des identifiants (code UAI du ministèrede l’éducation nationale) ou des localisations administrative (code INSEE)
  3. 3. ProblèmeComment interroger ces données de manière croisée ?Avec l’aide de la société Mondeca, nous avons décidé d’expérimenter la modélisation d’uneontologie permettant de naviguer dans plusieurs jeux de données émanant de sourcesdifférentes :- La liste des équipements sportifs du département de la Gironde- La liste des collèges de la Gironde- La liste des communes et cantons de la Gironde- La liste des trajets, points d’arrêts et horaires du réseau d’autocar transGirondeDe manière à pouvoir répondre plus facilement aux questions transversales sur l’objet collègeExemples :Quels sont les équipements sportifs du collège Aliénor d’aquitaine?Quels sont les collèges équipements sportifs, lignes et points d’arrêts d’autocar de Libourne ?Quels sont les collèges du canton de Libourne ?
  4. 4. • Étape 1 Identifier le sens de chaque entité d’information : nom, identifiant,pourcentage, valeur numérique, localisation, etc…• Étape 2 Identifier les concepts qui me servent à préciser la nature de mesobjets : établissement scolaire, entité administrative, trajet• Étape 3 : Identifier les concepts existants sur le web qui peuvent êtreréutilisés pour définir mes objets• Étape 4 : mise en place de la chaîne de transformation : xsl• Étape 5 : mise en place de l’ontologie définissant les types de relation quiexistent entre mes objets• Étape 6 : chargement des données dans un entrepôt stockant lesinformations sous forme de graphe• Étape 7 : interrogation de l’entrepôtMéthodologie du projetModélisation par ontologie
  5. 5. Objet 1 : établissement scolaire• Type collège public• Classe : équipement• Propriétés : adresse, personnes responsables, effectifs, etc…Objet 2 : équipement sportif• Type équipement public• Classe : équipement• Propriétés : composant de, sports pratiqués, localisationObjet 3 : autocar• Type : transport public• Classe : transport• Propriétés : lignes, trajets, points d’arrêts, horairesObjet 4 : découpage administratif• Type : entité publique• Classe : administration territoriale• Propriétés : identifiant, nom, territoireQuelles sont les caractéristiques des mes objets?Modélisation par ontologie
  6. 6. • Une ontologie basée sur la base permanente deséquipements de l’INSEE• Un démonstrateur permettant aux utilisateurs finaux denaviguer dans les donnes liéesLes résultatsModélisation par ontologie
  7. 7. • Un entrepôt RDF permettant d’exécuter des requêtes sur les données liéesLes résultatsModélisation par ontologie
  8. 8. Les résultatsModélisation par ontologie• Un bilan des apports et des connaissances nécessaires liés àl’utilisation des technologies du web de données• L’approche par ontologie permet de mettre en relation différentsacteurs d’un même domaine de manière assez souple• Les utilisateurs producteurs de données sont nécessaires pourconcevoir l’ontologie en fonction d’usages réels• Il y a encore pas mal de travail à réaliser pour qualifier les donnéessources pour permettre au croisement d’avoir toute la pertinenceattendue
  9. 9. Merci de votre attentionLes données fiche collège :http://github.com/datalocale/rdf-data@datalocaleMondeca

×