Amélioration du processus de création des métadonnées
1. Amélioration du processus de création
des métadonnées
Géo-événement 2008
François-Xavier Prunayre
10 avril 2008
http://www.camptocamp.com
2.
Créer des métadonnées
Objectifs de la création de métadonnées :
Améliorer la connaissance de l'information (en interne et en
externe)
Outils de gestion des données pour l'administrateur de données
Obligations réglementaires (INSPIRE)
De nombreux outils :
SIG, Catalogues, outils et scripts de traitements, bases de
données, webmapping, service OGC, ...
2
francois-xavier.prunayre@camptocamp.com
3.
Créer des métadonnées
Tous ces outils manipulent les données ...
... et l'opération de saisie des métadonnées reste manuelle et
fastidieuse
Pourrions nous améliorer cette opération ?
Est-il possible de simplifier voir d'automatiser le processus de
création de métadonnées ?
Aujourd'hui, l'outil de catalogage est l'élément central pour la
création et l'édition des métadonnées et reste fréquemment
déconnecté de la donnée en elle-même.
Les outils SIG (SIG, ETL, serveurs cartographiques, ...) peuvent-
ils aider à rendre plus cohérent et plus à jour le contenu des
catalogues ?
3
francois-xavier.prunayre@camptocamp.com
4.
Cataloguer fonction de ses objectifs ...
What?
- Title
- Abstract
Découverte Who?
- Point of contact
Where?
- Bounding box (bbox)
When? (exploration?)
Projection
Exploration Parent identifier
People involved
Restriction
Exploitation Lineage
Data quality
...
4
francois-xavier.prunayre@camptocamp.com
5.
Les outils manipulant les données SIG...
●Backup
●Synchronisation/Publication
Système de ●...
fichier
● Log des modifi
● ...
Catalogue de Base de données
métadonnées
Service web OGC Données SIG ...
Outil de
manipulation
SIG Desktop ETL/Scripts
●Visualisation
●Edition ●Notation
●Création de nouveaux jeux de données ●Edition
●Création de cartes SIG en ligne ●...
●Traitements
●Transformation
●...
5
francois-xavier.prunayre@camptocamp.com
9.
Les descripteurs pour les outils...
Titre Projection,
Résumé Emprise,
Mots clés (sauf theme=place) Distribution,
Contact Date de création, mise à jour
Contraintes d'accès Contact (si authentification)
(Qualités) Nombre d'objets
... ...
9
francois-xavier.prunayre@camptocamp.com
10.
Quelques cas d'utilisation ...
UC1: Production de données géographiques
Générer la métadonnée à la création du jeu de données, cas d'un
ETL
UC2: UNHCR / 8 ans d'archive de cartes à cataloguer
Utiliser/Reformater l'existant
UC3: BRGM / Configuration d'un service web OGC =
métadonnées
Moissoner des informations diffusées par les services web OGC
(GetCapabilities) pour la production de métadonnées
10
francois-xavier.prunayre@camptocamp.com
11.
UC1: Production de données
Approche classique:
Données en entrée (0..n)... ... (0..n) en sortie
Définition du
processus de
traitement
Outil de
Données SIG manipulation Données SIG
ETL/Scripts
Hors, l'outil de traitement connaît de nombreuses
informations sur les données qu'il va générer
Date de création, Nom du/des fichiers sources et destination,
Emplacement sur le réseau (db, fichiers), Type de données,
Projection, Emprises, Nombre d'objets, (Nom de l'opérateur,
11 email), ...
francois-xavier.prunayre@camptocamp.com
12.
UC1: Production de données & métadonnées
Données en entrée (0..n)... ... (0..n) en sortie
Définition du
processus de
traitement
Outil de
Données SIG manipulation Données SIG
ETL/Scripts
+Métadonnées
Catalogue de Publication
métadonnées
Diffusion (RSS,
service OGC,
site web, ..) sur Service web OGC
internet/intranet
12
francois-xavier.prunayre@camptocamp.com
13.
UC1: Production de données & métadonnées
Exemple d'interface dans un ETL*
Propriété d'un composant pour la création de Shapefile
Métadonnées
Process pour la création d'un fichier SIG et la publication dans un
catalogue de métadonnées
13
francois-xavier.prunayre@camptocamp.com
* Spatial Data Integrator powered by Talend
15.
UC2: 8 ans d'archive de cartes à cataloguer
Le service SIG (FICSS) produit différents
types de cartes pour les services du HCR
Type : carte statistique mondiale, par pays,
carte de camp de réfugiés, ...).
Création des cartes avec MapInfo.
Format de diffusion et stockage PDF
Aujourd'hui 8 ans d'archive de cartes PDF
plus de 4000 cartes
... dans un répertoire du réseau du service SIG
... dans des boites mails
... et quelques une sur le site institutionnel de
l'UNHCR
Objectifs: Référencer les cartes dans le
catalogue de métadonnées de l'UNHCR
15
francois-xavier.prunayre@camptocamp.com
18.
UC2: 8 ans d'archive de cartes à cataloguer
Un processus de création de
métadonnées à partir des documents PDF
3.Création des aperçus 4.Publication dans un catalogue
PDF->PNG
1.Recherche des PDF 2.Création des métadonnées ISO19139
Lecture des propriétés des PDF (utilisation d'un template, calcul de mot clés, ...)
18
francois-xavier.prunayre@camptocamp.com
19.
UC3: Moissonage de service web OGC
Un service web OGC répond à la requête
GetCapabilities (=Que sais tu faire?)
Tous les services: WMS, WFS, WPS, WCS, ...
Fichier XML ayant des structures proches
Contenu d'un GetCapabilities = des métadonnées
sur le service et les données diffusées
Nom,
Contact,
Liste de couches,
Liste de projection,
Emprises,
Opération,
...
19
francois-xavier.prunayre@camptocamp.com
22.
UC3: Moissonage de service web OGC
Le catalogue produit de manière régulière et automatique
les métadonnées des informations publiées par les
services
Un administrateur Service web OGC
de données configure
un service web OGC
Configuration
=Métadonnées
Données SIG
Le catalogue de métadonnées
moissone les métadonnées
depuis le catalogue
ie. Conversion du XML du
Catalogue de GetCapabilities en ISO19139
métadonnées
22
francois-xavier.prunayre@camptocamp.com
25.
Conclusion
Le processus de création de métadonnées peut être
simplifié/complété/amélioré.
Un standard international adopté : ISO19139/119
Une infrastructure de données spatiales (SDI) doit reposer sur
des outils interopérables pour améliorer la gestion/diffusion des
données géospatiales.
... pour cela produire des métadonnées avec :
Plus d'informations sur les données et les services
Plus à jour
Plus de liens/relations (eg. Données / Services, Parentés, ...)
... en s'appuyant sur des outils complémentaires
25
francois-xavier.prunayre@camptocamp.com