SlideShare une entreprise Scribd logo
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Les TIC et l’art
OpenRefine
traitement de données en masse
Antoine Courtin / Pierre Mounier /Antonio Mendes da Silva – jeudi 9 juin 2016
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
LOD cloud diagram d’août 2014
L’outil OpenRefine est historiquement lié à l’existence de Freebase, l’un des tous premiers projets
collaboratifs d’entrepôts de données sémantiques sur le web
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Qu’est-ce qu’OpenRefine ?
Historique :
2007 mars : Metaweb lance Freebase
2010 : Freebase est proposée avec l’outil de nettoyage et de
traitement des données Gridworks (v1.0)
2010 juillet : Google rachète Metaweb
2010 nov : Gridworks devient Google Refine
2012 oct : Arrêt de Google Refine dont le code est libéré et qui devient
OpenRefine
[2012 : Le contenu de Freebase est transféré sur Wikidata
2014 déc : Google annonce la fermeture de Freebase
2015 : Fermeture progressive de Freebase et des services associés
2016 mai : Fermeture définitive de Freebase
…………………..]
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Un tutoriel pas à pas sur OpenRefine :
http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
1. Installation d’OpenRefine : http://openrefine.org/download.html
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
2. Récupérer un set de données à nettoyer pour l’atelier :
http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Exercices…
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Où les trouver ? Comment les installer ?
• Sur le site officiel, à la page des
téléchargments
-> http://openrefine.org/download.html
• sur Github, dans des répertoires
spécifiques (recherche sur « plugin et/ou
extension)
-> http://bit.ly/1X9TEx4
-> http://bit.ly/1UEghq1
• Fermer l’application
• Se rendre dans le répertoire où se trouve
l’application
• Dans le dossier /webapp/, créer le dossier
« extensions » si celui-ci n’existe pas
• Télécharger l’extension souhaitée au
format .zip, le dézipper et placer ce
répertoire dans le répertoire
/webapp/extensions
• Relancer l’application
« Augmenter » le comportement d’OpenRefine
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
« Augmenter » le comportement d’OpenRefine
Les plugins/extensions les + utiles
• Exporter les données en RDF (à partir d’un squelette
issue d’une ontologie par ex.)
• https://github.com/fadmaa/grefine-rdf-
extension/releases
• (ATTENTION: renommer le dossier dezippé en
« rdf-extension » avant de le copier dans le
répertoire /webapp/extensions/)
• Extraction d’entités nommées
• https://github.com/RubenVerborgh/Refine-NER-
Extension
• VIB-BITS: 3 plugins (gestions des actions/historique;
comparaison entre 2 textes; gestions des facettes)
• https://www.bits.vib.be/index.php/software-
overview/openrefine
• Réaliser des statistiques
• https://github.com/sparkica/refine-stats
Des services à paramétrer
• La reconciliation avec VIAF
• http://refine.codefork.com/
• Aller dans « Add Standard Service » puis ajouter
le code suivant:
http://refine.codefork.com/reconcile/viaf
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Une utilisation « augmentée » d’OpenRefine
Quelques exemples/exercices
• Utiliser l’API de Google pour géolocaliser des lieux
• Ajouter à la colonne Lieu_naissance 1, le terme de Etats-Unis
• Jouer avec les filtres pour avoir dans la zone centrale, les architectes nés à Bennington, Aurora et
Allegheny.
• Lancer la géolocalisation via « by fetching URL »
• "http://maps.google.com/maps/api/geocode/json?sensor=false&address=" + escape(value,
"url »)
• Extraite les coordonnées géographiques dans une autre colonne
• Procéder à une « reconciliation » avec VIAF sur les élèves nés à New York
• Créer une colonne avec pour créer le nom complet
• Filtrer sur les élèves nés à New York
• Procéder à la réconciliation en utilisant le VIAF
• Utiliser l’interface pour valider et choisir la réconciliation
• Créer une colonne en extrayant l’id des résultats de la reconciliation avec VIAF
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
OpenRefine & les plugins
• Utiliser l’API de Google pour géolocaliser des lieux
• Ajouter à la colonne Lieu_naissance 1, le terme de Etats-Unis
• cells['Lieu_naissance 1'].value + ", Etats-Unis"
• Jouer avec les filtres pour avoir dans la zone centrale, les architectes nés à Bennington, Aurora et Allegheny.
• Lancer la géolocalisation via « by fetching URL »
• "http://maps.google.com/maps/api/geocode/json?sensor=false&address=" + escape(value, "url »)
• Extraite les coordonnées géographiques dans une autre colonne
• with(value.parseJson().results[0].geometry.location, pair, pair.lat +", " + pair.lng)
• Procéder à une « reconciliation » avec VIAF sur les élèves nés à New York
• Créer une colonne avec pour créer le nom complet
• cells['Nom_usuel'].value + ", " + cells['Prenom_usuel'].value
• Filtrer sur les élèves nés à New York
• Procéder à la réconciliation en utilisant le VIAF
• Utiliser l’interface pour valider et choisir la réconciliation
• Créer une colonne en extrayant l’id des résultats de la reconciliation avec VIAF
• cell.recon.match.id
Quelques exemples/exercices -> réponses
Les TIC et l'art
OpenRefine
9 juin 2016
Institut national d'histoire de l'art
Accès:
6, rue des Petits-Champs
75002Paris
Adresse postale:
2, rue Vivienne
75002Paris
Métro : Bourse, Pyramides
Palais royal/Musée du Louvre
Tél. : +33 (0) 1 47 03 8984
Fax : +33 (0) 1 47 03 8636
lesticetlart@inha.fr
http://invisu.inha.fr
Certains des + d’OpenRefine
• Pouvoir facilement relier 2 projets et ajouter des données de l’un à l’autre des projets
• cell.cross("My Address Book", "friend")[0].cells["address"].value[0]
• Pouvoir sauvegarder et rejouer un ensemble des tâches ultérieurement grâce à un fichier json
• Aller dans l’onglet “Unod/Redo” puis dans Extract/Aplply
• Extraire des données d’une page web
• Grâce à lafonction “Add column by fetching URL” + la fonctionparseHTML
Paramétrages pratiques
• Paramétrer le nombre de facettes autorisées
• http://127.0.0.1:3333/preferences
• Ajouter ui.browsing.listFacet.limit (ex 10000)
• Augmenter la mémoire allouer à OpenRefine (pour traiter des fichiers + gros)
• modifier le paramètre-XXmx2048M dansle fichier “google.refine.l4j.ini”

Contenu connexe

Tendances

Les TIC et l'art: Wikipedia et GeoNames
Les TIC et l'art: Wikipedia et GeoNamesLes TIC et l'art: Wikipedia et GeoNames
Les TIC et l'art: Wikipedia et GeoNames
Lesticetlart Invisu
 
Les TIC et l'art : Zotero
Les TIC et l'art : ZoteroLes TIC et l'art : Zotero
Les TIC et l'art : Zotero
Lesticetlart Invisu
 
Flux RSS, principes et outils
Flux RSS, principes et outilsFlux RSS, principes et outils
Flux RSS, principes et outils
Lesticetlart Invisu
 
Omeka : exposition virtuelle
Omeka : exposition virtuelleOmeka : exposition virtuelle
Omeka : exposition virtuelle
Lesticetlart Invisu
 
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Lesticetlart Invisu
 
Les TIC et l'art : l'Open Access
Les TIC et l'art : l'Open AccessLes TIC et l'art : l'Open Access
Les TIC et l'art : l'Open Access
Lesticetlart Invisu
 
Les TIC et l’art : outils de partage (images, fichiers, video, son)
Les TIC et l’art : outils de partage (images, fichiers, video, son)Les TIC et l’art : outils de partage (images, fichiers, video, son)
Les TIC et l’art : outils de partage (images, fichiers, video, son)
Lesticetlart Invisu
 
DBpedia Cafe-In
DBpedia Cafe-InDBpedia Cafe-In
DBpedia Cafe-In
JulienCojan
 
DBpédia en français
DBpédia en françaisDBpédia en français
DBpédia en français
JulienCojan
 
Le dépôt légal du web
Le dépôt légal du webLe dépôt légal du web
Le dépôt légal du web
UNITEC
 
Autour de Wikipédia et des projets frères
Autour de Wikipédia et des projets frèresAutour de Wikipédia et des projets frères
Autour de Wikipédia et des projets frères
Lesticetlart Invisu
 
Les TIC et l'Art : Flux RSS, principes et outils
Les TIC et l'Art : Flux RSS, principes et outilsLes TIC et l'Art : Flux RSS, principes et outils
Les TIC et l'Art : Flux RSS, principes et outils
Lesticetlart Invisu
 
Europeana et IIIF
Europeana et IIIFEuropeana et IIIF
Europeana et IIIF
Antoine Isaac
 
La numérisation des archives de la mission de folklore musical en Basse-Breta...
La numérisation des archives de la mission de folklore musical en Basse-Breta...La numérisation des archives de la mission de folklore musical en Basse-Breta...
La numérisation des archives de la mission de folklore musical en Basse-Breta...
Jpsd consultant
 

Tendances (14)

Les TIC et l'art: Wikipedia et GeoNames
Les TIC et l'art: Wikipedia et GeoNamesLes TIC et l'art: Wikipedia et GeoNames
Les TIC et l'art: Wikipedia et GeoNames
 
Les TIC et l'art : Zotero
Les TIC et l'art : ZoteroLes TIC et l'art : Zotero
Les TIC et l'art : Zotero
 
Flux RSS, principes et outils
Flux RSS, principes et outilsFlux RSS, principes et outils
Flux RSS, principes et outils
 
Omeka : exposition virtuelle
Omeka : exposition virtuelleOmeka : exposition virtuelle
Omeka : exposition virtuelle
 
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
Les TIC et l'art : Qu'est-ce qu'ISIDORE ?
 
Les TIC et l'art : l'Open Access
Les TIC et l'art : l'Open AccessLes TIC et l'art : l'Open Access
Les TIC et l'art : l'Open Access
 
Les TIC et l’art : outils de partage (images, fichiers, video, son)
Les TIC et l’art : outils de partage (images, fichiers, video, son)Les TIC et l’art : outils de partage (images, fichiers, video, son)
Les TIC et l’art : outils de partage (images, fichiers, video, son)
 
DBpedia Cafe-In
DBpedia Cafe-InDBpedia Cafe-In
DBpedia Cafe-In
 
DBpédia en français
DBpédia en françaisDBpédia en français
DBpédia en français
 
Le dépôt légal du web
Le dépôt légal du webLe dépôt légal du web
Le dépôt légal du web
 
Autour de Wikipédia et des projets frères
Autour de Wikipédia et des projets frèresAutour de Wikipédia et des projets frères
Autour de Wikipédia et des projets frères
 
Les TIC et l'Art : Flux RSS, principes et outils
Les TIC et l'Art : Flux RSS, principes et outilsLes TIC et l'Art : Flux RSS, principes et outils
Les TIC et l'Art : Flux RSS, principes et outils
 
Europeana et IIIF
Europeana et IIIFEuropeana et IIIF
Europeana et IIIF
 
La numérisation des archives de la mission de folklore musical en Basse-Breta...
La numérisation des archives de la mission de folklore musical en Basse-Breta...La numérisation des archives de la mission de folklore musical en Basse-Breta...
La numérisation des archives de la mission de folklore musical en Basse-Breta...
 

En vedette

Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...
Lesticetlart Invisu
 
Mi cuerpo el camino
Mi cuerpo el caminoMi cuerpo el camino
Mi cuerpo el camino
JORGE GAMA
 
Emtp User Group092008 Edf Ttr Discordance Phase Web
Emtp User Group092008 Edf Ttr Discordance Phase WebEmtp User Group092008 Edf Ttr Discordance Phase Web
Emtp User Group092008 Edf Ttr Discordance Phase Web
corinne rocherieux
 
Pres difodia
Pres difodiaPres difodia
Pres difodia
klas68
 
Emtp User Group092008 Sicae Raccordement Resau Web
Emtp User Group092008 Sicae Raccordement Resau WebEmtp User Group092008 Sicae Raccordement Resau Web
Emtp User Group092008 Sicae Raccordement Resau Web
corinne rocherieux
 
Photos Insolites
Photos InsolitesPhotos Insolites
Photos Insolites
ciffer louis
 
Andres amador
Andres amador Andres amador
Andres amador
ciffer louis
 
Qui ne voudrait pas gagner 1 million avec Drupal ?
Qui ne voudrait pas gagner 1 million avec Drupal ?Qui ne voudrait pas gagner 1 million avec Drupal ?
Qui ne voudrait pas gagner 1 million avec Drupal ?
golchi
 
Ellos Ya No Estan Con Nosotros Pero No Les Olvidaremos Nunca
Ellos Ya No Estan Con Nosotros Pero No Les Olvidaremos NuncaEllos Ya No Estan Con Nosotros Pero No Les Olvidaremos Nunca
Ellos Ya No Estan Con Nosotros Pero No Les Olvidaremos Nunca
guest0e972a75
 
Diapo Mawafe
Diapo MawafeDiapo Mawafe
Diapo Mawafe
natalia
 
Cat18
Cat18Cat18
Xtc conference-sial-2010
Xtc conference-sial-2010Xtc conference-sial-2010
Xtc conference-sial-2010
Innovation in Food BV
 
Promenade dans les calanques
Promenade dans les calanquesPromenade dans les calanques
Promenade dans les calanques
ciffer louis
 
visioaccueils - EPN 2.0 CRéATIF
visioaccueils - EPN 2.0 CRéATIFvisioaccueils - EPN 2.0 CRéATIF
visioaccueils - EPN 2.0 CRéATIF
Philippe Cazeneuve
 
Jose vasquez actividad_3
Jose vasquez actividad_3Jose vasquez actividad_3
Jose vasquez actividad_3
Ramiro Vasquez
 
Docentes inei
Docentes ineiDocentes inei
Docentes inei
INGETRONICA
 

En vedette (20)

Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...Construire des outils pour la gestion des données de la recherche dans une co...
Construire des outils pour la gestion des données de la recherche dans une co...
 
Mi cuerpo el camino
Mi cuerpo el caminoMi cuerpo el camino
Mi cuerpo el camino
 
Zotero mendeley 20121018
Zotero mendeley 20121018Zotero mendeley 20121018
Zotero mendeley 20121018
 
Emtp User Group092008 Edf Ttr Discordance Phase Web
Emtp User Group092008 Edf Ttr Discordance Phase WebEmtp User Group092008 Edf Ttr Discordance Phase Web
Emtp User Group092008 Edf Ttr Discordance Phase Web
 
2
22
2
 
Pres difodia
Pres difodiaPres difodia
Pres difodia
 
Emtp User Group092008 Sicae Raccordement Resau Web
Emtp User Group092008 Sicae Raccordement Resau WebEmtp User Group092008 Sicae Raccordement Resau Web
Emtp User Group092008 Sicae Raccordement Resau Web
 
Photos Insolites
Photos InsolitesPhotos Insolites
Photos Insolites
 
Andres amador
Andres amador Andres amador
Andres amador
 
Qui ne voudrait pas gagner 1 million avec Drupal ?
Qui ne voudrait pas gagner 1 million avec Drupal ?Qui ne voudrait pas gagner 1 million avec Drupal ?
Qui ne voudrait pas gagner 1 million avec Drupal ?
 
Ellos Ya No Estan Con Nosotros Pero No Les Olvidaremos Nunca
Ellos Ya No Estan Con Nosotros Pero No Les Olvidaremos NuncaEllos Ya No Estan Con Nosotros Pero No Les Olvidaremos Nunca
Ellos Ya No Estan Con Nosotros Pero No Les Olvidaremos Nunca
 
el pla
el plael pla
el pla
 
Diapo Mawafe
Diapo MawafeDiapo Mawafe
Diapo Mawafe
 
Lafemme Th
Lafemme ThLafemme Th
Lafemme Th
 
Cat18
Cat18Cat18
Cat18
 
Xtc conference-sial-2010
Xtc conference-sial-2010Xtc conference-sial-2010
Xtc conference-sial-2010
 
Promenade dans les calanques
Promenade dans les calanquesPromenade dans les calanques
Promenade dans les calanques
 
visioaccueils - EPN 2.0 CRéATIF
visioaccueils - EPN 2.0 CRéATIFvisioaccueils - EPN 2.0 CRéATIF
visioaccueils - EPN 2.0 CRéATIF
 
Jose vasquez actividad_3
Jose vasquez actividad_3Jose vasquez actividad_3
Jose vasquez actividad_3
 
Docentes inei
Docentes ineiDocentes inei
Docentes inei
 

Similaire à OpenRefine: traitement de données en masse

Des métadonnées pour les images numériques du patrimoine culturel: présentati...
Des métadonnées pour les images numériques du patrimoine culturel: présentati...Des métadonnées pour les images numériques du patrimoine culturel: présentati...
Des métadonnées pour les images numériques du patrimoine culturel: présentati...
Lesticetlart Invisu
 
Formation zotero30012014
Formation zotero30012014Formation zotero30012014
Formation zotero30012014
Lesticetlart Invisu
 
Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...
Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...
Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...
HackYourPhD
 
Bilan des 4 premières années du Museolab
Bilan des 4 premières années du MuseolabBilan des 4 premières années du Museolab
Bilan des 4 premières années du Museolab
Yves-Armel Martin
 
Fête de la science 2017 programme pour le scolaire
Fête de la science 2017 programme pour le scolaireFête de la science 2017 programme pour le scolaire
Fête de la science 2017 programme pour le scolaire
Culture Scientifique - Académie de Lyon
 
Museomix presentation générale - Edition 2013
Museomix presentation générale - Edition 2013Museomix presentation générale - Edition 2013
Museomix presentation générale - Edition 2013
Leila BOUANANI
 
Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...
Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...
Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...
{CORRESPONDANCES DIGITALES]
 
1303 culture partage
1303 culture partage1303 culture partage
1303 culture partage
Angenius Institute
 
Présentation Diagonale aux Journées Recherche en Design 16 10 14
Présentation Diagonale aux Journées Recherche en Design 16 10 14Présentation Diagonale aux Journées Recherche en Design 16 10 14
Présentation Diagonale aux Journées Recherche en Design 16 10 14
DiagonaleParisSaclay
 
Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011
Fleury Christine
 
Museomix - 2015 Canadian Museum Association Conference
Museomix - 2015 Canadian Museum Association ConferenceMuseomix - 2015 Canadian Museum Association Conference
Museomix - 2015 Canadian Museum Association Conference
Ana-Laura Baz
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives
AssociationAF
 
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014) Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
HackYourPhD
 
Estampages_EfA_dec2016
Estampages_EfA_dec2016Estampages_EfA_dec2016
Estampages_EfA_dec2016
Programme E-STAMPAGES
 
Accéder à l'art et à la culture grâce au Web
Accéder à l'art et à la culture grâce au WebAccéder à l'art et à la culture grâce au Web
Accéder à l'art et à la culture grâce au Web
EASI-IE | Votre agence en Intelligence Stratégique
 
Evenement museal - Buzzeum - Marseille 2.0
Evenement museal - Buzzeum - Marseille 2.0Evenement museal - Buzzeum - Marseille 2.0
Evenement museal - Buzzeum - Marseille 2.0
marseille20
 
Principales ressources au Centre GéoStat (2016)
Principales ressources au Centre GéoStat (2016)Principales ressources au Centre GéoStat (2016)
Principales ressources au Centre GéoStat (2016)
Centre GéoStat, Bibliothèque, Université Laval
 
L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010
L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010
L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010
DRUBAY Diane
 
Les TIC et l'art: images numériques et métadonnées
Les TIC et l'art: images numériques et métadonnéesLes TIC et l'art: images numériques et métadonnées
Les TIC et l'art: images numériques et métadonnées
Lesticetlart Invisu
 

Similaire à OpenRefine: traitement de données en masse (20)

Des métadonnées pour les images numériques du patrimoine culturel: présentati...
Des métadonnées pour les images numériques du patrimoine culturel: présentati...Des métadonnées pour les images numériques du patrimoine culturel: présentati...
Des métadonnées pour les images numériques du patrimoine culturel: présentati...
 
Formation zotero30012014
Formation zotero30012014Formation zotero30012014
Formation zotero30012014
 
Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...
Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...
Atelier #2 à la Cité des Sciences- Art et Science : Des rencontres catalysées...
 
Bilan des 4 premières années du Museolab
Bilan des 4 premières années du MuseolabBilan des 4 premières années du Museolab
Bilan des 4 premières années du Museolab
 
Fête de la science 2017 programme pour le scolaire
Fête de la science 2017 programme pour le scolaireFête de la science 2017 programme pour le scolaire
Fête de la science 2017 programme pour le scolaire
 
Museomix presentation générale - Edition 2013
Museomix presentation générale - Edition 2013Museomix presentation générale - Edition 2013
Museomix presentation générale - Edition 2013
 
Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...
Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...
Quelques chiffres et tendances du numérique dans le secteur muséal - juillet ...
 
1303 culture partage
1303 culture partage1303 culture partage
1303 culture partage
 
Présentation Diagonale aux Journées Recherche en Design 16 10 14
Présentation Diagonale aux Journées Recherche en Design 16 10 14Présentation Diagonale aux Journées Recherche en Design 16 10 14
Présentation Diagonale aux Journées Recherche en Design 16 10 14
 
Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011
 
Museomix - 2015 Canadian Museum Association Conference
Museomix - 2015 Canadian Museum Association ConferenceMuseomix - 2015 Canadian Museum Association Conference
Museomix - 2015 Canadian Museum Association Conference
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives
 
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014) Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
 
Estampages_EfA_dec2016
Estampages_EfA_dec2016Estampages_EfA_dec2016
Estampages_EfA_dec2016
 
Accéder à l'art et à la culture grâce au Web
Accéder à l'art et à la culture grâce au WebAccéder à l'art et à la culture grâce au Web
Accéder à l'art et à la culture grâce au Web
 
Evenement museal - Buzzeum - Marseille 2.0
Evenement museal - Buzzeum - Marseille 2.0Evenement museal - Buzzeum - Marseille 2.0
Evenement museal - Buzzeum - Marseille 2.0
 
Principales ressources au Centre GéoStat (2016)
Principales ressources au Centre GéoStat (2016)Principales ressources au Centre GéoStat (2016)
Principales ressources au Centre GéoStat (2016)
 
Museomix présentation générale
Museomix   présentation généraleMuseomix   présentation générale
Museomix présentation générale
 
L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010
L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010
L'événementiel muséal 2.0 : l'exemple de la Nuit européenne des musées 2010
 
Les TIC et l'art: images numériques et métadonnées
Les TIC et l'art: images numériques et métadonnéesLes TIC et l'art: images numériques et métadonnées
Les TIC et l'art: images numériques et métadonnées
 

Plus de Lesticetlart Invisu

Invisu plaquette 2017
Invisu plaquette 2017Invisu plaquette 2017
Invisu plaquette 2017
Lesticetlart Invisu
 
Publier à quel prix?
Publier à quel prix? Publier à quel prix?
Publier à quel prix?
Lesticetlart Invisu
 
Plaquette InVisu 2016
Plaquette InVisu 2016Plaquette InVisu 2016
Plaquette InVisu 2016
Lesticetlart Invisu
 
Kit de survie: Création et gestion d'une bibliothèque d'images numériques
Kit de survie: Création et gestion d'une bibliothèque d'images numériquesKit de survie: Création et gestion d'une bibliothèque d'images numériques
Kit de survie: Création et gestion d'une bibliothèque d'images numériques
Lesticetlart Invisu
 
Kit de survie : Gestion et traitement des images numériques
Kit de survie : Gestion et traitement des images numériquesKit de survie : Gestion et traitement des images numériques
Kit de survie : Gestion et traitement des images numériques
Lesticetlart Invisu
 
Atelier Zotero intermédiaire
Atelier Zotero intermédiaireAtelier Zotero intermédiaire
Atelier Zotero intermédiaire
Lesticetlart Invisu
 
Gérer ses références bibliographiques avec Zotero
Gérer ses références bibliographiques avec ZoteroGérer ses références bibliographiques avec Zotero
Gérer ses références bibliographiques avec Zotero
Lesticetlart Invisu
 
Dossier thématique droit cnrs
Dossier thématique droit cnrsDossier thématique droit cnrs
Dossier thématique droit cnrs
Lesticetlart Invisu
 
Plaquette InVisu 2015
Plaquette InVisu 2015Plaquette InVisu 2015
Plaquette InVisu 2015
Lesticetlart Invisu
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
Lesticetlart Invisu
 
Structurer, relier et diffuser des données avec les technologies du web séman...
Structurer, relier et diffuser des données avec les technologies du web séman...Structurer, relier et diffuser des données avec les technologies du web séman...
Structurer, relier et diffuser des données avec les technologies du web séman...
Lesticetlart Invisu
 
IdRef – Référentiels pour l’Enseignement Supérieur et la Recherche
IdRef – Référentiels pour l’Enseignement Supérieur et la RechercheIdRef – Référentiels pour l’Enseignement Supérieur et la Recherche
IdRef – Référentiels pour l’Enseignement Supérieur et la Recherche
Lesticetlart Invisu
 
Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...
Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...
Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...
Lesticetlart Invisu
 
Réaliser un plan de gestion de données
Réaliser un plan de gestion de donnéesRéaliser un plan de gestion de données
Réaliser un plan de gestion de données
Lesticetlart Invisu
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Lesticetlart Invisu
 
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Lesticetlart Invisu
 
Illustration des questions de dialogue et coordination entre les acteurs à tr...
Illustration des questions de dialogue et coordination entre les acteurs à tr...Illustration des questions de dialogue et coordination entre les acteurs à tr...
Illustration des questions de dialogue et coordination entre les acteurs à tr...
Lesticetlart Invisu
 
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Lesticetlart Invisu
 
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Lesticetlart Invisu
 
Diffuser pour mieux préserver : l’expérience de beQuali
Diffuser pour mieux préserver : l’expérience de beQualiDiffuser pour mieux préserver : l’expérience de beQuali
Diffuser pour mieux préserver : l’expérience de beQuali
Lesticetlart Invisu
 

Plus de Lesticetlart Invisu (20)

Invisu plaquette 2017
Invisu plaquette 2017Invisu plaquette 2017
Invisu plaquette 2017
 
Publier à quel prix?
Publier à quel prix? Publier à quel prix?
Publier à quel prix?
 
Plaquette InVisu 2016
Plaquette InVisu 2016Plaquette InVisu 2016
Plaquette InVisu 2016
 
Kit de survie: Création et gestion d'une bibliothèque d'images numériques
Kit de survie: Création et gestion d'une bibliothèque d'images numériquesKit de survie: Création et gestion d'une bibliothèque d'images numériques
Kit de survie: Création et gestion d'une bibliothèque d'images numériques
 
Kit de survie : Gestion et traitement des images numériques
Kit de survie : Gestion et traitement des images numériquesKit de survie : Gestion et traitement des images numériques
Kit de survie : Gestion et traitement des images numériques
 
Atelier Zotero intermédiaire
Atelier Zotero intermédiaireAtelier Zotero intermédiaire
Atelier Zotero intermédiaire
 
Gérer ses références bibliographiques avec Zotero
Gérer ses références bibliographiques avec ZoteroGérer ses références bibliographiques avec Zotero
Gérer ses références bibliographiques avec Zotero
 
Dossier thématique droit cnrs
Dossier thématique droit cnrsDossier thématique droit cnrs
Dossier thématique droit cnrs
 
Plaquette InVisu 2015
Plaquette InVisu 2015Plaquette InVisu 2015
Plaquette InVisu 2015
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
 
Structurer, relier et diffuser des données avec les technologies du web séman...
Structurer, relier et diffuser des données avec les technologies du web séman...Structurer, relier et diffuser des données avec les technologies du web séman...
Structurer, relier et diffuser des données avec les technologies du web séman...
 
IdRef – Référentiels pour l’Enseignement Supérieur et la Recherche
IdRef – Référentiels pour l’Enseignement Supérieur et la RechercheIdRef – Référentiels pour l’Enseignement Supérieur et la Recherche
IdRef – Référentiels pour l’Enseignement Supérieur et la Recherche
 
Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...
Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...
Le Thésaurus pour l'indexation des archives locales et le Web de données, INH...
 
Réaliser un plan de gestion de données
Réaliser un plan de gestion de donnéesRéaliser un plan de gestion de données
Réaliser un plan de gestion de données
 
Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...Accompagnement actif des chercheurs à la gestion et au partage des données de...
Accompagnement actif des chercheurs à la gestion et au partage des données de...
 
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
Indigeo, une infrastructure de données spatiales dédiée à la recherche et l’o...
 
Illustration des questions de dialogue et coordination entre les acteurs à tr...
Illustration des questions de dialogue et coordination entre les acteurs à tr...Illustration des questions de dialogue et coordination entre les acteurs à tr...
Illustration des questions de dialogue et coordination entre les acteurs à tr...
 
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
Problématique du devenir des données au Centre de Calcul de l'IN2P3 - Pascal ...
 
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...Pérennisation et mise à disposition des données de l’Observatoire de recherch...
Pérennisation et mise à disposition des données de l’Observatoire de recherch...
 
Diffuser pour mieux préserver : l’expérience de beQuali
Diffuser pour mieux préserver : l’expérience de beQualiDiffuser pour mieux préserver : l’expérience de beQuali
Diffuser pour mieux préserver : l’expérience de beQuali
 

Dernier

A2-Critiques-gastronomiques activités critiques
A2-Critiques-gastronomiques activités critiquesA2-Critiques-gastronomiques activités critiques
A2-Critiques-gastronomiques activités critiques
lebaobabbleu
 
Formation M2i - Attitude constructive : développer l'art de l'optimisme
Formation M2i - Attitude constructive : développer l'art de l'optimismeFormation M2i - Attitude constructive : développer l'art de l'optimisme
Formation M2i - Attitude constructive : développer l'art de l'optimisme
M2i Formation
 
L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...
L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...
L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...
Faga1939
 
apprendre-a-programmer-avec-python-3.pdf
apprendre-a-programmer-avec-python-3.pdfapprendre-a-programmer-avec-python-3.pdf
apprendre-a-programmer-avec-python-3.pdf
kamouzou878
 
A2-Faire-une-appreciation positive et/ou négative (A2)
A2-Faire-une-appreciation positive et/ou négative (A2)A2-Faire-une-appreciation positive et/ou négative (A2)
A2-Faire-une-appreciation positive et/ou négative (A2)
lebaobabbleu
 
Présentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
Présentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaPrésentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
Présentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
siemaillard
 
Burkina Faso libraries newsletter for June 2024
Burkina Faso libraries newsletter for June 2024Burkina Faso libraries newsletter for June 2024
Burkina Faso libraries newsletter for June 2024
Friends of African Village Libraries
 
MARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptx
MARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptxMARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptx
MARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptx
Martin M Flynn
 
Cours Gestion d’actifs BNP -- CAMGESTION
Cours Gestion d’actifs BNP -- CAMGESTIONCours Gestion d’actifs BNP -- CAMGESTION
Cours Gestion d’actifs BNP -- CAMGESTION
Sékou Oumar SYLLA
 
MS-203 Microsoft 365 Messaging Study Guide to prepare the certification
MS-203 Microsoft 365 Messaging Study Guide to prepare the certificationMS-203 Microsoft 365 Messaging Study Guide to prepare the certification
MS-203 Microsoft 365 Messaging Study Guide to prepare the certification
OlivierLumeau1
 
[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf
[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf
[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf
mcevapi3
 
Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...
Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...
Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...
dokposeverin
 
Zineb Mekouar.pptx Écrivaine marocaine
Zineb Mekouar.pptx   Écrivaine  marocaineZineb Mekouar.pptx   Écrivaine  marocaine
Zineb Mekouar.pptx Écrivaine marocaine
Txaruka
 
Microbiologie: le monde microbien et les techniques de mise en évidence.
Microbiologie: le monde microbien et les techniques de mise en évidence.Microbiologie: le monde microbien et les techniques de mise en évidence.
Microbiologie: le monde microbien et les techniques de mise en évidence.
MahouwetinJacquesGBO
 
1eT Revolutions Empire Revolution Empire
1eT Revolutions Empire Revolution Empire1eT Revolutions Empire Revolution Empire
1eT Revolutions Empire Revolution Empire
NadineHG
 

Dernier (15)

A2-Critiques-gastronomiques activités critiques
A2-Critiques-gastronomiques activités critiquesA2-Critiques-gastronomiques activités critiques
A2-Critiques-gastronomiques activités critiques
 
Formation M2i - Attitude constructive : développer l'art de l'optimisme
Formation M2i - Attitude constructive : développer l'art de l'optimismeFormation M2i - Attitude constructive : développer l'art de l'optimisme
Formation M2i - Attitude constructive : développer l'art de l'optimisme
 
L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...
L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...
L'ÉDUCATION AVEC INTELLIGENCE ARTIFICIELLE ET LES DÉFICIENCES DE SON APPLICAT...
 
apprendre-a-programmer-avec-python-3.pdf
apprendre-a-programmer-avec-python-3.pdfapprendre-a-programmer-avec-python-3.pdf
apprendre-a-programmer-avec-python-3.pdf
 
A2-Faire-une-appreciation positive et/ou négative (A2)
A2-Faire-une-appreciation positive et/ou négative (A2)A2-Faire-une-appreciation positive et/ou négative (A2)
A2-Faire-une-appreciation positive et/ou négative (A2)
 
Présentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
Présentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaPrésentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
Présentation3.pptxaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
 
Burkina Faso libraries newsletter for June 2024
Burkina Faso libraries newsletter for June 2024Burkina Faso libraries newsletter for June 2024
Burkina Faso libraries newsletter for June 2024
 
MARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptx
MARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptxMARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptx
MARTYRS DE HOLLANDE - La révolte hollandaise et les guerres de religion..pptx
 
Cours Gestion d’actifs BNP -- CAMGESTION
Cours Gestion d’actifs BNP -- CAMGESTIONCours Gestion d’actifs BNP -- CAMGESTION
Cours Gestion d’actifs BNP -- CAMGESTION
 
MS-203 Microsoft 365 Messaging Study Guide to prepare the certification
MS-203 Microsoft 365 Messaging Study Guide to prepare the certificationMS-203 Microsoft 365 Messaging Study Guide to prepare the certification
MS-203 Microsoft 365 Messaging Study Guide to prepare the certification
 
[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf
[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf
[218_phot_d'Autriche-Hongrie_et_des_[...]Vaffier_Hubert_btv1b8594559c.pdf
 
Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...
Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...
Manuel-5.-Elevage-de-poisson-chat-africain-Clarias-gariepinus-en-bacs-hors-so...
 
Zineb Mekouar.pptx Écrivaine marocaine
Zineb Mekouar.pptx   Écrivaine  marocaineZineb Mekouar.pptx   Écrivaine  marocaine
Zineb Mekouar.pptx Écrivaine marocaine
 
Microbiologie: le monde microbien et les techniques de mise en évidence.
Microbiologie: le monde microbien et les techniques de mise en évidence.Microbiologie: le monde microbien et les techniques de mise en évidence.
Microbiologie: le monde microbien et les techniques de mise en évidence.
 
1eT Revolutions Empire Revolution Empire
1eT Revolutions Empire Revolution Empire1eT Revolutions Empire Revolution Empire
1eT Revolutions Empire Revolution Empire
 

OpenRefine: traitement de données en masse

  • 1. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Les TIC et l’art OpenRefine traitement de données en masse Antoine Courtin / Pierre Mounier /Antonio Mendes da Silva – jeudi 9 juin 2016
  • 2. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr LOD cloud diagram d’août 2014 L’outil OpenRefine est historiquement lié à l’existence de Freebase, l’un des tous premiers projets collaboratifs d’entrepôts de données sémantiques sur le web
  • 3. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Qu’est-ce qu’OpenRefine ? Historique : 2007 mars : Metaweb lance Freebase 2010 : Freebase est proposée avec l’outil de nettoyage et de traitement des données Gridworks (v1.0) 2010 juillet : Google rachète Metaweb 2010 nov : Gridworks devient Google Refine 2012 oct : Arrêt de Google Refine dont le code est libéré et qui devient OpenRefine [2012 : Le contenu de Freebase est transféré sur Wikidata 2014 déc : Google annonce la fermeture de Freebase 2015 : Fermeture progressive de Freebase et des services associés 2016 mai : Fermeture définitive de Freebase …………………..]
  • 4. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Un tutoriel pas à pas sur OpenRefine : http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial
  • 5. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr 1. Installation d’OpenRefine : http://openrefine.org/download.html
  • 6. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr 2. Récupérer un set de données à nettoyer pour l’atelier : http://enipedia.tudelft.nl/wiki/OpenRefine_Tutorial
  • 7. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Exercices…
  • 8. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Où les trouver ? Comment les installer ? • Sur le site officiel, à la page des téléchargments -> http://openrefine.org/download.html • sur Github, dans des répertoires spécifiques (recherche sur « plugin et/ou extension) -> http://bit.ly/1X9TEx4 -> http://bit.ly/1UEghq1 • Fermer l’application • Se rendre dans le répertoire où se trouve l’application • Dans le dossier /webapp/, créer le dossier « extensions » si celui-ci n’existe pas • Télécharger l’extension souhaitée au format .zip, le dézipper et placer ce répertoire dans le répertoire /webapp/extensions • Relancer l’application « Augmenter » le comportement d’OpenRefine
  • 9. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr « Augmenter » le comportement d’OpenRefine Les plugins/extensions les + utiles • Exporter les données en RDF (à partir d’un squelette issue d’une ontologie par ex.) • https://github.com/fadmaa/grefine-rdf- extension/releases • (ATTENTION: renommer le dossier dezippé en « rdf-extension » avant de le copier dans le répertoire /webapp/extensions/) • Extraction d’entités nommées • https://github.com/RubenVerborgh/Refine-NER- Extension • VIB-BITS: 3 plugins (gestions des actions/historique; comparaison entre 2 textes; gestions des facettes) • https://www.bits.vib.be/index.php/software- overview/openrefine • Réaliser des statistiques • https://github.com/sparkica/refine-stats Des services à paramétrer • La reconciliation avec VIAF • http://refine.codefork.com/ • Aller dans « Add Standard Service » puis ajouter le code suivant: http://refine.codefork.com/reconcile/viaf
  • 10. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Une utilisation « augmentée » d’OpenRefine Quelques exemples/exercices • Utiliser l’API de Google pour géolocaliser des lieux • Ajouter à la colonne Lieu_naissance 1, le terme de Etats-Unis • Jouer avec les filtres pour avoir dans la zone centrale, les architectes nés à Bennington, Aurora et Allegheny. • Lancer la géolocalisation via « by fetching URL » • "http://maps.google.com/maps/api/geocode/json?sensor=false&address=" + escape(value, "url ») • Extraite les coordonnées géographiques dans une autre colonne • Procéder à une « reconciliation » avec VIAF sur les élèves nés à New York • Créer une colonne avec pour créer le nom complet • Filtrer sur les élèves nés à New York • Procéder à la réconciliation en utilisant le VIAF • Utiliser l’interface pour valider et choisir la réconciliation • Créer une colonne en extrayant l’id des résultats de la reconciliation avec VIAF
  • 11. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr OpenRefine & les plugins • Utiliser l’API de Google pour géolocaliser des lieux • Ajouter à la colonne Lieu_naissance 1, le terme de Etats-Unis • cells['Lieu_naissance 1'].value + ", Etats-Unis" • Jouer avec les filtres pour avoir dans la zone centrale, les architectes nés à Bennington, Aurora et Allegheny. • Lancer la géolocalisation via « by fetching URL » • "http://maps.google.com/maps/api/geocode/json?sensor=false&address=" + escape(value, "url ») • Extraite les coordonnées géographiques dans une autre colonne • with(value.parseJson().results[0].geometry.location, pair, pair.lat +", " + pair.lng) • Procéder à une « reconciliation » avec VIAF sur les élèves nés à New York • Créer une colonne avec pour créer le nom complet • cells['Nom_usuel'].value + ", " + cells['Prenom_usuel'].value • Filtrer sur les élèves nés à New York • Procéder à la réconciliation en utilisant le VIAF • Utiliser l’interface pour valider et choisir la réconciliation • Créer une colonne en extrayant l’id des résultats de la reconciliation avec VIAF • cell.recon.match.id Quelques exemples/exercices -> réponses
  • 12. Les TIC et l'art OpenRefine 9 juin 2016 Institut national d'histoire de l'art Accès: 6, rue des Petits-Champs 75002Paris Adresse postale: 2, rue Vivienne 75002Paris Métro : Bourse, Pyramides Palais royal/Musée du Louvre Tél. : +33 (0) 1 47 03 8984 Fax : +33 (0) 1 47 03 8636 lesticetlart@inha.fr http://invisu.inha.fr Certains des + d’OpenRefine • Pouvoir facilement relier 2 projets et ajouter des données de l’un à l’autre des projets • cell.cross("My Address Book", "friend")[0].cells["address"].value[0] • Pouvoir sauvegarder et rejouer un ensemble des tâches ultérieurement grâce à un fichier json • Aller dans l’onglet “Unod/Redo” puis dans Extract/Aplply • Extraire des données d’une page web • Grâce à lafonction “Add column by fetching URL” + la fonctionparseHTML Paramétrages pratiques • Paramétrer le nombre de facettes autorisées • http://127.0.0.1:3333/preferences • Ajouter ui.browsing.listFacet.limit (ex 10000) • Augmenter la mémoire allouer à OpenRefine (pour traiter des fichiers + gros) • modifier le paramètre-XXmx2048M dansle fichier “google.refine.l4j.ini”