Atelier réalisé dans le cadre de la journée "Kit de survie pour l'historien de l'art en milieu numérique" organisé à l'INHA le 23 septembre 2016.
L'objectif étant d'avoir une introduction aux principes de bases de la visualisation de données en SHS tout en réalisant un focus sur l'histoire de l'art avec notamment la manipulation de l'outil web Palladio.
(Brève) Introduction à la visualisation de données (en SHS)
1. Antoine Courtin
Responsable de la cellule d’ingénierie documentaire du départements des études et de la recherche, INHA
Introduction à la visualisation de données
2. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
Par Sam Fentress, CC BY-SA 2.0, https://commons.wikimedia.org/w/index.php?curid=215276
3. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
2
temps
Introduction « théorique » Atelier pratique
Historique
Concepts-clés
Quelques exemples
Ressources
Visualisation d’un
corpus à l’aide de
Palladio, outils full-
web de l’Université
de Stanford
Manipulations avec
d’autres outils
5. C’est l’ensemble des techniques de
représentation graphique et
d’exploration visuelle de données
quantitative et/ou statistiques
permettant de traduire un ensemble de
données brutes en information décisive
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
6. … outil d’aide à la décision / contrôle qualité
… outil d’accès et d’exploration de ressources
… outil d’aide à l’interprétation
Infovisualisation comme…
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
Une/Des terminologies
o Dataviz/datavision
o Visualisation de données
o Design d’information
o Infographie
o etc,
7. Méthode qualitative / Méthode quantitative
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
8. o Faire « parler » des données (brutes) ?
o Traduire un important corpus de manière visuelle
o Synthétiser les enjeux essentiels d’un corpus
Mettre en image/graphiques des informations/
données chiffrées
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
9. A quoi sert la visualisation de données
Ce qu’en dit Jacques Bertin.
1. A traiter des données pour comprendre et et en tirer de
l’information
→ Idée de la fouille de données
→ Traiter des données implique l’exhaustivité.
2. A communiquer cette information
→ Il faut quelques heures pour construire un graphique ; quelques
secondes pour le lire.
→ Communiquer implique (souvent) la simplification.
source Christophe Bontemps
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
10. Diagramme des causes de mortalité au sein de l'armée en
Orient par Florence Nightingale.
Carte figurative des pertes successives en hommes de l'armée
française dans la campagne de Russie 1812-1813 par Charles-
Joseph Minard.
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
En fait de calculs et de proportions, le plus sûr moyen de
frapper l’esprit, est de parler aux yeux
William Playfair, 1780
12. Mickaël Friendly, Milestones in the history of thematic cartography,statistical
graphics, and data visualization, http://www.datavis.ca/
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
13. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
14. Statistiques. Les corrélations de l’absurde, http://goo.gl/9mM7zI
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
15. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
16. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
Boite noire ? / Algorithmes
17. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
http://www.sealthreinhold.com/school/tuftes-rules/
18. Dans la vision académique d’Edward Tufte, l’excellence graphique
peut être estimée au travers de 3 critères fondateurs :
o data-ink ratio
o Le ratio entre informations restituées/encre utilisée ().
o lie-factor
o distorsion de la restitution par rapport à la réalité des
données sources).
o chartjunk
o L’absence de scories graphiques (élément décoratif
n’apportant aucune plus-value informative)
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
19. Visualisation de données
temporelles Visualisation de données
géolocalisées
Visualisation de la relation
entre plusieurs variables
Visualisation d’une
arborescence
Visualisation des proportions
Visualisation de réseaux
Visualisation de flux
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
20. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
21. Conception et source d’inspiration
http://www.datavizcatalogue.com
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
http://www.visualcomplexity.com/vc/
22. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
Acquisition
des données
• saisie des
données
• collecte de
données
• enrichissem
ent des
données
tierces
Structurer les
données
• nettoyer les
données
• optimiser
les formats
• compléter
les données
Visualiser
l’information
• choisir des
informations
à révéler
• tester les
formes de
visualisation
Editorialiser
la
visualisation
de données
• apporter un
discours
• légender
23. Où sont les données ?
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
24. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
25. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
https://media.licdn.com/mpr/mpr/AAEAAQAAAAAAAALAAAAAJGU3YjAwY2I5LTg1ODMtNDg5Ny04MTg2LTNhMWUwYTdkZDk2Zg
Dirty Data – SparkPlugs, http://www.slideshare.net/SSMM_JoshMartin/dirty-
data-sparkplugsslides
26. ✦ Le dictionnaire comme un cas d’école
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
28. o Croiser les dimensions
o temporelle (date d’entrée à l’école)
o géospatiale (par ville de naissance des élèves)
o catégorielle (par âge d’entrée à l’école des beaux-arts)
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
29. o SNA (Social Network Analysis)
o Relation entre élèves-architectes et atelier
o Corpus: les élèves nés entre 1800 et 1900
o Ne sont affichés que les ateliers ayant au minimum 3 élèves
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
31. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
32. Atelier pratique
Visualisation d’un corpus à l’aide de
Palladio, outils full-web de l’Université de
Stanford
Manipulations avec d’autres outils
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
33. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
34. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
https://goo.gl/rwoHNu
35. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
36. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
37. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
38. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
https://frama.link/AtelierInfoVizHDA
39. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
40. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
41. L’outil OpenRefine est historiquement lié à
l’existence de Freebase, l’un des tous
premiers projets collaboratifs d’entrepôts de
données sémantiques sur le web
Historique :
2007 mars : Metaweb lance Freebase
2010 : Freebase est proposée avec l’outil de nettoyage et
de traitement des données Gridworks (v1.0)
2010 juillet : Google rachète Metaweb
2010 nov : Gridworks devient Google Refine
2012 oct : Arrêt de Google Refine dont le code est libéré et
qui devient OpenRefine
————
[
2014 déc : Google annonce la fermeture de Freebase
2015:Fermeture progressive de Freebase et des services
associés
2016 mai: Fermeture définitive de Freebase
]
Installation d’OpenRefine :
http://openrefine.org/download.html
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
42. Des services à paramétrer
• La reconciliation avec VIAF
• http://refine.codefork.com/
• Aller dans « Add Standard Service » puis
ajouter le code suivant: http://
refine.codefork.com/reconcile/viaf
Les plugins/extensions les + utiles
• Exporter les données en RDF (à partir d’un squelette
issue d’une ontologie par ex.)
• https://github.com/fadmaa/grefine-rdf-extension/
releases
• (ATTENTION: renommer le dossier dezippé en
« rdf-extension » avant de le copier dans le
répertoire /webapp/extensions/)
• Extraction d’entités nommées
• https://github.com/RubenVerborgh/Refine-NER-
Extension
• VIB-BITS: 3 plugins (gestions des actions/historique;
comparaison entre 2 textes; gestions des facettes)
• https://www.bits.vib.be/index.php/software-
overview/openrefine
• Réaliser des statistiques
• https://github.com/sparkica/refine-stats
« Augmenter » le comportement d’OpenRefine
Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
43. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
44. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
45. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
47. Introduction à la visualisation de données – Kit de survie de l’historien de l’art en milieu numérique 23 septembre 2016
Conclusion
o Visualisation très efficace mais à condition de suivre des règles strictes
o Tout ne s’y prête pas forcément
o Garder un esprit critique faces aux visualisations
o Les visualisations efficaces nécessitent un apprentissage
“On ne lit pas un graphique, on lui
pose des questions”
Jacques Bertin, 1981