SlideShare une entreprise Scribd logo
1  sur  139
Télécharger pour lire hors ligne
Gautier Poupeau
gautier.poupeau@gmail.com
@lespetitescases
http://www.lespetitescases.net
Réalisation d’un mashup
de données
Premier cours
Qu’est-ce-qu’un mashup ?
Tristan Eaton, 4-6 rue du Chevaleret, Paris 13
CC-BY https://www.flickr.com/photos/lespetitescases/29003193065/
Un mashup est une œuvre/création originale
mise au point à partir de l’assemblage/mise en
relation d’œuvres/créations existantes.
Le mot mashup est le plus souvent utilisé pour la
musique mais on le retrouve dans les autres arts
ainsi que dans le monde numérique lorsqu’on parle
de mashup de données.
Objectifs de l’exercice noté
Chaque groupe devra réaliser un mashup de
données. Les propositions :
?
MONUMENTS HISTORIQUES
Réutiliser des données en RDF : les mashups
Présentation du projet
• Créer une application à forte valeur ajoutée à partir de sources
hétérogènes
• Consolider des données éparses, individuellement faibles pour
créer une application riche.
REF DPT COM INSEE TICO
PA00078014 10Aix-en-Othe 10003Chapelle Saint-Avit
PA00078015 10Aix-en-Othe 10003Eglise de la Nativité
PA00078016 10Allibaudières 10004Eglise
PA00078017 10Arcis-sur-Aube 10006Château (ancien)
PA00078018 10Arcis-sur-Aube 10006Eglise
PA00078019 10Arrembécourt 10010Eglise Saint-Etienne
PA00078020 10Arsonval 10012Eglise
PA00078021 10Auxon 10018Eglise
REF : PA00088801
DPT : 75007
ETUD : RecensementimmeublesMH
INSEE : 75107
TICO : Tour Eiffel
ADRS : Champ-de-Mars
STAT : propriété de la commune
PPRO : La tour Eiffel : inscription par arrêté du 24 juin
AUTR : Eiffel Gustave (maître de l'œuvre)
SCLE : 4e quart 19e siècleun fichier .CSV contenant 43 720 enregistrements
de monuments
Objectifs
Source principale
Principes généraux
Maillage et enrichissement avec 6 sources
complémentaires : stations de métro, de trains, bases
de photos et description de Wikipedia…
Source
principale
Sources complémentaires
Web Service de
géo localisation
AIF
normalisation et
enrichissement
AFS
moteur de
recherche
AFS
Application
Monuments
Historiques
Modèle de données
Création des IHMs
Le moteur de recherche pour créer simplement des
applications riches et faciles d’accès
http://labs.antidot.net/widgets/monuments
MUSÉES DE FRANCE
Réutiliser des données en RDF : les mashups
Présentation du projet
Construire un site
agrégeant des
informations sur
les musées de
France
Provenance
des jeux de données utilisés
Modèle de données
Musée
(data.gouv.fr
)
Musée
(data.gouv.fr
)
Musée
(MCC)
Musée
(MCC)
Musée
(Wikidata)
Musée
(Wikidata)
Catégo Musée
(Commons)
Catégo Musée
(Commons)
Musée
(BnF)
Musée
(BnF)
Livre
(BnF)
Livre
(BnF)
Oeuvre
(Wikidata)
Oeuvre
(Wikidata)
Artiste
(Wikidata)
Artiste
(Wikidata)
POI
(OSM)
POI
(OSM)
Identifiant
Museofile
Identifiant
Museofile
Nom du
musée
Nom du
musée
Coordonnées
géographiques
Coordonnées
géographiques
Principes généraux d’élaboration
Captation Sémantisation
Alignement Exploitation
du graphe
L’ajout d’un nouveau format d’exposition se limite à l’ajout d’un module
dans la chaîne d’exploitation du graphe et à l’écriture du mapping.
Création des IHMs
Une page de recherche Une page agrégeant
toutes les données
PRÉSENTATION DU MASHUP
Jeux de données du mashup
Films sur
Wikidata
via
sparqlendpoint
Films sur
OMDB
via API
Liste des films
agréés CNC
1996-2015
via data.gouv.fr
Liste des 1er
films agréés CNC
2003-2015
via data.gouv.fr
Distribution
sur Wikidata
via
sparqlendpoint
Visa d’exploitation
Identifiant Wikidata
Identifiant Imdb
Titre du film + Année
Développement du Mashup avec Dataiku DSS
DSS (Data Science Studio) est un logiciel édité par la société française Dataiku (
http://www.dataiku.com/) qui offre un outil complet pour manipuler des données et
les traiter avec des algorithmes de machine learning
Version gratuite et instructions d’installation
 http://www.dataiku.com/dss/trynow/
Visualisation du Mashup avec Palladio
Palladio est une application Web du HDALab (http://hdlab.stanford.edu/) de
Stanford qui permet de visualiser en quelques clics de souris sous différentes formes
(Galerie, Graphe, Carte…) des données historiques en chargeant un ou plusieurs
fichiers CSV.
 http://hdlab.stanford.edu/palladio/
RÉCUPÉRATION DES DONNÉES SUR
DATA.GOUV.FR
Page d’accueil de data.gouv.fr
Utilisation du moteur de recherche
Liste de résultats de recherche
Premier jeu de données pour le mashup
http://www.data.gouv.fr/fr/datasets/liste-des-films-
cinematographiques-agrees/
Second jeu de données pour le mashup
http://www.data.gouv.fr/fr/datasets/liste-des-films-en-premiere-
exclusivite/
CHARGEMENT DES DONNÉES
DANS DATAIKU
Page d’accueil de Dataiku
Liste des projets existants
Créer un nouveau projet
Création du projet dans Dataiku
Page d’accueil du projet
Choisir l’origine du jeu de données
Charger un fichier depuis votre disque dur
Interface de chargement du fichier
Charger le fichier principal du mashup : liste des films agréés CNC 1996-2015
ListeFilmsPremièreExclusivité.xlsx
Interface de prévisualisation du fichier
Dans ce cas, les données à charger ne
sont pas sur la première feuille affichée
par défaut.
Les colonnes détectées automatiquement
Format du fichier
Eléments de configuration spécifiques à
chaque format
Interface de prévisualisation du fichier
Ignorer les N premières lignes et indiquer la
ligne précédant celle correspondant aux en-
têtes de colonnes
Interface d’exploration du jeu de données
Manipulation d’une colonne
Analyse d’une colonne
Regroupement de valeurs proches
Filtrage des données
Liste des jeux de données
Reproduire la procédure en chargeant le fichier : liste des 1er
films agréés 2003-2015
production cinématographique - liste des premiers films.xlsx
Affichage du flux de traitement
Les différents types de « recette » de
manipulation de données
Type de recette
Synchroniser l’ensemble de données avec un
entrepôt de données externe
Type de recette
Préparer les données : nettoyer, rendre
cohérent, supprimer des colonnes, rassembler
des colonnes…
Type de recette
Mettre au point un échantillon de données
Type de recette
Effectuer une opération d’agrégation : somme,
moyenne, min, max, premier, dernier…
Type de recette
Joindre deux ensembles de données :
équivalent à un join dans une base de données
relationnelle
Type de recette
Séparer un jeu de données
Type de recette
Empiler des jeux de données
Type de recette
Coder une recette avec un langage de
programmation : Python, R, Shell, SQL, Scala…
PRÉPARER LES DONNÉES
Interface de préparation de données
Ajouter une étape
pour traiter les données
Le travail s’effectue sur un échantillon
Quand tous les traitements sont configurés, n’oubliez pas de cliquer
sur « Run » pour l’appliquer à tout le jeu de données
Liste des traitements possibles
Filtrer les données
Filtrer, repérer ou supprimer des lignes en fonction d’une valeur, d’un intervalle de dates ou de
nombres, de la validité de la donnée, de la présence d’une valeur, supprimer des colonnes
Nettoyage de données
Normaliser des données de mesure, repérer ou filtrer des données, remplir des cellules vides
avec une valeur ou une valeur d’une ligne suivante ou précédente, convertir des nombres…
Manipulation de chaînes de caractères
Découper, transformer (casse, trim, diacritiques, encodage URL, XML…), manipuler une chaîne,
exécuter une expression régulière
Manipulation de nombres
Extraire des nombres, convertir les nombres suivant un format national, convertir une date
UNIX, effectuer des opérations entre les valeurs de colonnes, arrondir, convertir une devise
Séparer/extraire
Séparer une colonne, extraire avec une expression régulière, séparer une adresse email, extraire
une donnée dans une cellule contenant un flux Json
Manipulation de logs de serveur Web
Classer les user-agent, découper une chaîne HTTP, générer un identifiant de visiteur, trouver le
pays d’un internaute à partir de son adresse IP
Manipulation des dates
Analyser une chaîne de date, extraire des éléments de date, formater une date, calculer la
différence entre deux dates, calcul si le jour est chômé
Manipulation de données géographiques
Joindre deux jeux de données par les coordonnées géographiques, géolocaliser (via API
externe), changer le système de coordonnées, calculer distance entre deux points, géographie
administrative à partir d’une coordonnée géographique…
Enrichir les données
Enrichir des données à partir des départements, des codes postaux, jointure entre deux jeux de
données, extraire à partir d’une colonne géographique…
Restructurer les données
Séparer et générer des lignes, générer des lignes à partir d’un tableau dans une valeur de
cellule…
Manipulation de longues chaînes
Simplifier une chaîne (normalisation, stop words, stemmatisation), « tokeniser » une chaîne,
extraire des ngrams, extraire des nombres, compter des occurrences
Jointure de deux jeux de données
Jointure entre deux jeux de données avec des valeurs de cellules, jointure entre deux jeux de
données avec des valeurs approchantes, jointure géographique
Manipulation d’objets complexes
Extraire d’un tableau, trier les données d’un tableau, extraire d’un flux Json, concaténer des
tableau Json
Exécuter du code
Construire une formule avec du « pseudo-code », exécuter une fonction python
Divers
Concaténer des colonnes, utiliser une ligne comme en-tête de colonne, copier une colonne,
renommer une colonne
PROBLÈME DE TYPAGE
Liste_films_2015_1996_CNC
DSS détecte automatiquement les
problèmes de typage
Problème de typage de données
Filtrer les données
pour sélectionner les données en « erreur »
et les visualiser
Dans notre cas, on voit qu’une colonne de type « integer » (entier) contient des valeurs avec des
lettres, il est nécessaire de modifier le typage de données.
Modifier le type d’une colonne
Le changement de type a corrigé le problème
HARMONISER LES VALEURS D’UNE
COLONNE
Liste_films_2015_1996_CNC
Analyse des données de la colonne
Répartition des valeurs et valeurs uniques
Regroupement des valeurs proches
Affichage des groupes de valeurs proches
Proposition de valeurs
Sélection des groupes à fusionner
Sélection des groupes à fusionner
Génération et application d’une étape
FORMATER DES DATES
Liste_films_2015_1996_CNC
Sélectionner le traitement pour
analyser les dates
Indiquer le nom de la colonne à traiter
Construire le patron de dates
Lettre Date ou composant Type de données Exemples
G Era designator Text AD
y Year Year 1996; 96
Y Week year Year 2009; 09
M Month in year Month July; Jul; 07
w Week in year Number 27
W Week in month Number 2
D Day in year Number 189
d Day in month Number 10
F Day of week in month Number 2
E Day name in week Text Tuesday; Tue
u
Day number of week (1 = Monday, ..., 7
= Sunday)
Number 1
a Am/pm marker Text PM
H Hour in day (0-23) Number 0
k Hour in day (1-24) Number 24
K Hour in am/pm (0-11) Number 0
h Hour in am/pm (1-12) Number 12
m Minute in hour Number 30
s Second in minute Number 55
S Millisecond Number 978
z Time zone General time zone Pacific Standard Time; PST; GMT-08:00
Z Time zone RFC 822 time zone -0800
X Time zone ISO 8601 time zone -08; -0800; -08:00
Indiquer le patron de la date et
générer le résultat dans une nouvelle
colonne
Analyser le résultat du traitement
Certaines lignes sont vides donc le
traitement n’a pas fonctionné pour
ces lignes
Filtrer pour voir les lignes vides
Le patron est différent pour ces lignes
Ajouter le nouveau patron
Analyser le résultat
Il n’y a plus de ligne vide
Générer le résultat dans la même colonne
Formater la date
Configurer le nouveau patron
MODIFIER LES VALEURS D’UNE
COLONNE
Liste_films_2015_1996_CNC
Analyser les entrées de la colonne
Double-cliquez sur la valeur à modifier
Une nouvelle étape apparaît et
s’enrichit au fur et à mesure
Les valeurs sont modifiées dans le
tableau
SUPPRIMER LES ESPACES BLANCS
SUPERFLUS
Liste_films_2015_1996_CNC
Certaines colonnes peuvent contenir
des espaces blancs en trop
Recherchez le traitement « trim »
Sélectionnez la colonne à modifier
Sélectionnez
Remove leading/trailing whitespaces
Les espaces blancs superflus
sont supprimés
EXERCICES
Liste_films_2015_1996_CNC
Effectuez les traitements suivants
• Harmoniser les valeurs de la colonne NATIONALITE
• Enlever les espaces entre les slahs de la colonne
NATIONALITE
• Harmoniser les valeurs de la colonne DISTRIBUTEUR
• Remplacer dans la colonne ART ET ESSAI OUI par true et
NON par false
Penser à sauvegarder !!!
Exécuter sur l’ensemble du jeu de données
SUPPRIMER DES LIGNES VIDES
liste_premiers_films_2015_2003
Repérer les lignes vides
Filtrer pour afficher les lignes vides
Choisir le traitement adapté
Indiquer la ou les colonne(s) à
prendre en compte
AJOUTER UNE COLONNE
liste_premiers_films_2015_2003
Choisir le traitement « formula »
Indiquez le nom de la nouvelle colonne
Editez le contenu de la nouvelle colonne
L’onglet « Reference » indique la
liste des fonctions possibles
Dans notre cas, la valeur est
toujours la même « true »
La colonne est créée
SUPPRIMER UNE COLONNE
liste_premiers_films_2015_2003
Sélectionner le traitement adapté
Indiquer le nom de la colonne à
supprimer
ou des colonnes à supprimer
EXERCICES
liste_premiers_films_2015_2003
Modifier le type de VISA
et corriger l’erreur de DEVIS
Le jeu de données est prêt
Le type doit correspondre à celui de l’autre
jeu de données pour effectuer la jointure
RELIER DEUX JEUX DE DONNÉES
Sélectionner la recette de jointure
Déterminer les jeux de données impliqués
Interface de la recette de jointure
Choix du type de jointure
Choix des colonnes à joindre
Sélection des colonnes
Attention ! Les champs à joindre doivent avoir être du même type de données !!
Sélection des colonnes à conserver
Exécuter la jointure
Visualisation du « flow »

Contenu connexe

Tendances

Design and manage persistent URIs
Design and manage persistent URIsDesign and manage persistent URIs
Design and manage persistent URIsOpen Data Support
 
Introduction To RDF and RDFS
Introduction To RDF and RDFSIntroduction To RDF and RDFS
Introduction To RDF and RDFSNilesh Wagmare
 
Cours5 evaluer information
Cours5 evaluer informationCours5 evaluer information
Cours5 evaluer informationEvelyne Brémond
 
Introduction to RDF & SPARQL
Introduction to RDF & SPARQLIntroduction to RDF & SPARQL
Introduction to RDF & SPARQLOpen Data Support
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALGautier Poupeau
 
Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)Bhaskar Mitra
 
Système de recommandations de films
Système de recommandations de filmsSystème de recommandations de films
Système de recommandations de filmsIbn Tofail University
 
Introduction to Information Retrieval
Introduction to Information RetrievalIntroduction to Information Retrieval
Introduction to Information RetrievalRoi Blanco
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDJulien Sicot
 
Chapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesChapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesMohamed Mkaouar
 
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODOLinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODOChris Mungall
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Big Data & Text Mining
Big Data & Text MiningBig Data & Text Mining
Big Data & Text MiningMichel Bruley
 
DSpace 7 - The Power of Configurable Entities
DSpace 7 - The Power of Configurable EntitiesDSpace 7 - The Power of Configurable Entities
DSpace 7 - The Power of Configurable EntitiesAtmire
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4jBoris Guarisma
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQLAntoine Augusti
 

Tendances (20)

RDF data model
RDF data modelRDF data model
RDF data model
 
Design and manage persistent URIs
Design and manage persistent URIsDesign and manage persistent URIs
Design and manage persistent URIs
 
Introduction To RDF and RDFS
Introduction To RDF and RDFSIntroduction To RDF and RDFS
Introduction To RDF and RDFS
 
Cours5 evaluer information
Cours5 evaluer informationCours5 evaluer information
Cours5 evaluer information
 
Introduction to RDF & SPARQL
Introduction to RDF & SPARQLIntroduction to RDF & SPARQL
Introduction to RDF & SPARQL
 
Merise
MeriseMerise
Merise
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HAL
 
Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)Neural Text Embeddings for Information Retrieval (WSDM 2017)
Neural Text Embeddings for Information Retrieval (WSDM 2017)
 
Information Retrieval
Information RetrievalInformation Retrieval
Information Retrieval
 
Système de recommandations de films
Système de recommandations de filmsSystème de recommandations de films
Système de recommandations de films
 
Etl -
Etl -Etl -
Etl -
 
Introduction to Information Retrieval
Introduction to Information RetrievalIntroduction to Information Retrieval
Introduction to Information Retrieval
 
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCDOmeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
Omeka ou comment réaliser une bibliothèque numérique à l'échelle d'un SCD
 
Chapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de donnéesChapitre 1 les entrepôts de données
Chapitre 1 les entrepôts de données
 
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODOLinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
LinkML Intro July 2022.pptx PLEASE VIEW THIS ON ZENODO
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Big Data & Text Mining
Big Data & Text MiningBig Data & Text Mining
Big Data & Text Mining
 
DSpace 7 - The Power of Configurable Entities
DSpace 7 - The Power of Configurable EntitiesDSpace 7 - The Power of Configurable Entities
DSpace 7 - The Power of Configurable Entities
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4j
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
 

En vedette

Data in the center of the Information System
Data in the center of the Information SystemData in the center of the Information System
Data in the center of the Information SystemGautier Poupeau
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeuxGautier Poupeau
 
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?Antidot
 
Antidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot
 
IOGDC - McKeel presentation on mashups and OpenEI
IOGDC - McKeel presentation on mashups and OpenEIIOGDC - McKeel presentation on mashups and OpenEI
IOGDC - McKeel presentation on mashups and OpenEIpianory
 
Mashups and Web Services
Mashups and Web ServicesMashups and Web Services
Mashups and Web Servicesgiurca
 
Éléments de catalogage des livres anciens
Éléments de catalogage des livres anciensÉléments de catalogage des livres anciens
Éléments de catalogage des livres anciensEquipex Biblissima
 
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
 
Mashups Presentation
Mashups PresentationMashups Presentation
Mashups PresentationJo Kay
 
Graph Database Prototyping made easy with Graphgen
Graph Database Prototyping made easy with GraphgenGraph Database Prototyping made easy with Graphgen
Graph Database Prototyping made easy with GraphgenChristophe Willemsen
 
#PortraitDeCDO - Guénaëlle Gault - Kantar
#PortraitDeCDO - Guénaëlle Gault - Kantar#PortraitDeCDO - Guénaëlle Gault - Kantar
#PortraitDeCDO - Guénaëlle Gault - KantarOCTO Technology
 
Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Patrick Le Boeuf
 
#PortraitDeCDO - Thierry Picard - Pierre Fabre
#PortraitDeCDO - Thierry Picard - Pierre Fabre#PortraitDeCDO - Thierry Picard - Pierre Fabre
#PortraitDeCDO - Thierry Picard - Pierre FabreOCTO Technology
 
#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon
#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon
#PortraitDeCDO - Laurent Assouad - Aéroport de LyonOCTO Technology
 
Exploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXExploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXEmmanuelle Morlock
 

En vedette (20)

Data in the center of the Information System
Data in the center of the Information SystemData in the center of the Information System
Data in the center of the Information System
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeux
 
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
 
Antidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenus
 
IOGDC - McKeel presentation on mashups and OpenEI
IOGDC - McKeel presentation on mashups and OpenEIIOGDC - McKeel presentation on mashups and OpenEI
IOGDC - McKeel presentation on mashups and OpenEI
 
Standards et outils XML
Standards et outils XMLStandards et outils XML
Standards et outils XML
 
Mashups and Web Services
Mashups and Web ServicesMashups and Web Services
Mashups and Web Services
 
Éléments de catalogage des livres anciens
Éléments de catalogage des livres anciensÉléments de catalogage des livres anciens
Éléments de catalogage des livres anciens
 
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
 
Mashups Presentation
Mashups PresentationMashups Presentation
Mashups Presentation
 
Mashup ppt
Mashup pptMashup ppt
Mashup ppt
 
Graph Database Prototyping made easy with Graphgen
Graph Database Prototyping made easy with GraphgenGraph Database Prototyping made easy with Graphgen
Graph Database Prototyping made easy with Graphgen
 
Atelier EDS - outil découverte
Atelier EDS - outil découverteAtelier EDS - outil découverte
Atelier EDS - outil découverte
 
Atelier Evernote
Atelier EvernoteAtelier Evernote
Atelier Evernote
 
#PortraitDeCDO - Guénaëlle Gault - Kantar
#PortraitDeCDO - Guénaëlle Gault - Kantar#PortraitDeCDO - Guénaëlle Gault - Kantar
#PortraitDeCDO - Guénaëlle Gault - Kantar
 
Atelier Feedly
Atelier FeedlyAtelier Feedly
Atelier Feedly
 
Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209Présentation du CIDOC CRM 20101209
Présentation du CIDOC CRM 20101209
 
#PortraitDeCDO - Thierry Picard - Pierre Fabre
#PortraitDeCDO - Thierry Picard - Pierre Fabre#PortraitDeCDO - Thierry Picard - Pierre Fabre
#PortraitDeCDO - Thierry Picard - Pierre Fabre
 
#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon
#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon
#PortraitDeCDO - Laurent Assouad - Aéroport de Lyon
 
Exploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXExploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseX
 

Similaire à Réalisation d'un mashup de données avec DSS de Dataiku - Première partie

Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesY. Nicolas
 
L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...Equipex Biblissima
 
Data Mining (Partie 2).pdf
Data Mining (Partie 2).pdfData Mining (Partie 2).pdf
Data Mining (Partie 2).pdfOuailChoukhairi
 
SIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdfSIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdfNadim ELSAKAAN
 
OpenStreetMap pour les géomaticiens
OpenStreetMap pour les géomaticiensOpenStreetMap pour les géomaticiens
OpenStreetMap pour les géomaticiensAntoine Riche
 
Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texteEstelle Delpech
 
Cours complet Base de donne Bac
Cours complet Base de donne Bac Cours complet Base de donne Bac
Cours complet Base de donne Bac Amri Ossama
 
OpenData, LinkedData & SmartCities
OpenData, LinkedData & SmartCitiesOpenData, LinkedData & SmartCities
OpenData, LinkedData & SmartCitiesderomemont
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
 
Journées ABES 2014 - Posters numériques
Journées ABES 2014 - Posters numériquesJournées ABES 2014 - Posters numériques
Journées ABES 2014 - Posters numériquesABES
 
De java à swift en 2 temps trois mouvements
De java à swift en 2 temps trois mouvementsDe java à swift en 2 temps trois mouvements
De java à swift en 2 temps trois mouvementsDidier Plaindoux
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked dataVincentBroute
 
Open streetmap pour CocoaHeads Paris
Open streetmap pour CocoaHeads ParisOpen streetmap pour CocoaHeads Paris
Open streetmap pour CocoaHeads ParisCocoaHeads France
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022François-Xavier Boffy
 
Géographie de l'information
Géographie de l'informationGéographie de l'information
Géographie de l'informationjacomyma
 

Similaire à Réalisation d'un mashup de données avec DSS de Dataiku - Première partie (20)

mix-it 2011
mix-it 2011mix-it 2011
mix-it 2011
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 
L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...
 
Data Mining (Partie 2).pdf
Data Mining (Partie 2).pdfData Mining (Partie 2).pdf
Data Mining (Partie 2).pdf
 
SIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdfSIBD101-Introduction aux bases de données.pdf
SIBD101-Introduction aux bases de données.pdf
 
OpenStreetMap pour les géomaticiens
OpenStreetMap pour les géomaticiensOpenStreetMap pour les géomaticiens
OpenStreetMap pour les géomaticiens
 
Génération automatique de texte
Génération automatique de texteGénération automatique de texte
Génération automatique de texte
 
formation URFIST Rennes 2009
formation URFIST Rennes 2009formation URFIST Rennes 2009
formation URFIST Rennes 2009
 
Cours complet Base de donne Bac
Cours complet Base de donne Bac Cours complet Base de donne Bac
Cours complet Base de donne Bac
 
OpenData, LinkedData & SmartCities
OpenData, LinkedData & SmartCitiesOpenData, LinkedData & SmartCities
OpenData, LinkedData & SmartCities
 
Chapitre 2
Chapitre 2Chapitre 2
Chapitre 2
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Journées ABES 2014 - Posters numériques
Journées ABES 2014 - Posters numériquesJournées ABES 2014 - Posters numériques
Journées ABES 2014 - Posters numériques
 
Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
 
Connaître et convertir les formats de données
Connaître et convertir les formats de donnéesConnaître et convertir les formats de données
Connaître et convertir les formats de données
 
De java à swift en 2 temps trois mouvements
De java à swift en 2 temps trois mouvementsDe java à swift en 2 temps trois mouvements
De java à swift en 2 temps trois mouvements
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
Open streetmap pour CocoaHeads Paris
Open streetmap pour CocoaHeads ParisOpen streetmap pour CocoaHeads Paris
Open streetmap pour CocoaHeads Paris
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Géographie de l'information
Géographie de l'informationGéographie de l'information
Géographie de l'information
 

Plus de Gautier Poupeau

Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...Gautier Poupeau
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesGautier Poupeau
 
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Gautier Poupeau
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Gautier Poupeau
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...Gautier Poupeau
 
Index nominum to ontology
Index nominum to ontologyIndex nominum to ontology
Index nominum to ontologyGautier Poupeau
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèquesGautier Poupeau
 

Plus de Gautier Poupeau (11)

Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
 
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 
Index nominum to ontology
Index nominum to ontologyIndex nominum to ontology
Index nominum to ontology
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
 

Réalisation d'un mashup de données avec DSS de Dataiku - Première partie