Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Les cles de la data visualisation

320 vues

Publié le

Quoi de plus primordiale pour un data scientist que de comprendre ses données pour mieux les valoriser et partager ses résultats ?
La visualisation de données intervient dans différentes phases d’un projet de data science :

- Analyse exploratoire des données afin de deviner les premières caractéristiques, tester les premières relations, esquisser les premiers patterns, ..
- Faciliter la compréhension et l’interprétation
- Optimiser et accélérer la prise de décision
- Améliorer la communication

Mais connaissez-vous les clés d’une représentation efficace ? Avez-vous les bons réflexes et les bonnes méthodes pour ne pas tromper votre auditoire ou vous même ?

A travers une approche théorique et en s’appuyant sur les travaux remarquables de Jacques Bertin et Edward Tufte, avec néanmoins quelques exemples et contre-exemples, Alexia Audevart vous initiera au monde magique de la data visualisation.

Speaker : Alexia Audevart est data & enthusiasm et fondatrice de datactik, cabinet spécialisé en valorisation de données (Big Data, Machine/Deep Learning, Intelligence Artificielle). Elle est également la présidente du meetup Toulouse Data Science et l’une des organisatrices du Devfest Toulouse.

Publié dans : Données & analyses
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Les cles de la data visualisation

  1. 1. La Data Visualisation Mardi 29 Mai 2018Meetup Big Data – Data Science Montpellier
  2. 2. Alexia Audevart Data & Enthusiasm @aaudevart President of Toulouse Data Science meet-up Co-organizer of Toulouse DevFest conference Founder of datactik Data Scientist
  3. 3. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik “Il existe 3 catégories de personnes : celles qui voient, celles qui voient quand on leur montre, celles qui ne voient jamais” Léonard de Vinci
  4. 4. 1 Définition L’efficacité graphique selon Jacques Bertin L’excellence graphique d’Edward Tufte Perception Visuelle Le Story Telling Good or Bad ? 1 2 3 Sommaire 4 5 6
  5. 5. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Définition de la data visualisation ? Ensemble de méthodes et techniques de représentation des données sous forme visuelle
  6. 6. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Quand utilise-t-on la data visualisation ? Communication implies simplification, Data exploration implies exhaustivity Exploration des données Représentation des données
  7. 7. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik 60 000 fois plus Rapide d’analyser une image que du texte 85% du cerveau Dédié à l’analyse des images 1 image vaut 1000 mots
  8. 8. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Besoin de raisonner, à un certain niveau de difficulté et pour une certaine quantité d’informations => utilisation de supports externes Ce principe est nommé la cognition externe Le raisonnement humain
  9. 9. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Le raisonnement humain 2 Phases
  10. 10. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Frise chronologique : Lien • Première représentation graphique 100 avant JC • Essentiellement des cartographies • 18ème siècle : représentation de données quantitatives • 1765 : time line – Joseph Priestley • 1786 : William Playfair – inventeur de 3 graphiques • Série chronologique • Histogramme • Camembert • 19ème siècle : • Apparition de la couleur • Diagramme en 3D • Diagramme de flux A partir du 20ème siècle, opposition de 2 conceptions de représentation de données : démarche artistique vs vision plus scientifique Des premières cartes au premier graphiques
  11. 11. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Variables qualitatives ou catégorielles expriment une qualité => Représente des catégories que l’on nomme avec un label Exemple : • signe astrologique • liste des pays Opération : = , ≠ Variables Nominales => Catégories naturellement ordonnées = le rang Exemple : • un peu, moyen, beaucoup, à la folie Opération : = , ≠, <, > Variables Ordinales Différents types de variables
  12. 12. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Variables quantitatives contiennent des valeurs mesurables Þ Variables numériques ayant des valeurs dénombrables entre deux valeurs Þ Variables ayant des valeurs finies Exemple : • Nombre de voitures dans la rue • Nombre de personnes majeures • Nombre de candidats à l’examen Variables Discrètes => Variables numériques ayant un nombre infini de valeurs entre deux valeurs. Exemple : • La vitesse d’une voiture • La taille, le poids d’une personne • Le temps de réalisation d’une tâche Variables Continues Différents types de variables
  13. 13. 1 Définition L’efficacité graphique selon Jacques Bertin L’excellence graphique d’Edward Tufte Perception Visuelle Le Story Telling Good or Bad ? 1 2 3 Sommaire 4 5 6
  14. 14. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Jacques Bertin (1918-2010) • Père fondateur de la visualisation de l’information • Auteur de l’ouvrage : Sémiologie graphique Les diagrammes, les réseaux, les cartes 1ère publication : 1967 Sémiologie (étude de la signification) graphique répond à 2 questions : • Dans quel cas faut-il faire un dessin ? • Quel dessin faut-il faire ? Le 1er à formaliser un corpus scientifique structuré dans une perspective d’analyse de données Les Travaux de Jacques Bertin
  15. 15. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les variables visuelles définies par Bertin Le langage graphique s’exprime par des variables visuelles Les Travaux de Jacques Bertin
  16. 16. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Si 100% des prisonniers US sont représentés par le carré vert, quelle est la proportion de chaque groupe ? 100% 43% 37% 16% Ethic composition of prisoners in Jail in 2008 in the USA. (Le Monde 5/12/2014) QUIZZ
  17. 17. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les formes ne sont pas adaptées pour représenter la proportionnalité Les Travaux de Jacques Bertin : Les formes
  18. 18. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik En revanche, les tailles sont adaptées pour représenter la proportionnalité (variation quantitative) Les Travaux de Jacques Bertin : La Taille
  19. 19. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les couleurs traduisent des différences non ordonnées ! QUIZZ : Trier par ordre croissant
  20. 20. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Few (2008) a défini des palettes de couleurs (utilisées dans les heatmaps) QUIZZ : Trier par ordre croissant
  21. 21. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Relation entre les données MOOC COURSERA - ENS – Cartographie thématique
  22. 22. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les variables visuelles définies par Bertin
  23. 23. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les variables visuelles définies par Bertin https://interstices.info/jcms/n_51807/la-visualisation-analytique-pour-comprendre-des-donnees-complexes
  24. 24. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les variables les plus couramment utilisées sont la valeur, la couleur, la taille et la forme. --------- Les variables sont fréquemment associées lorsqu'elles ont les mêmes propriétés pour gagner en efficacité et en longueur.
  25. 25. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les Travaux de Jacques Bertin - Tables & Matrices
  26. 26. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les Travaux de Jacques Bertin - Tables & Matrices
  27. 27. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Les Travaux de Jacques Bertin - Tables & Matrices
  28. 28. 1 Définition L’efficacité graphique selon Jacques Bertin L’excellence graphique d’Edward Tufte Perception Visuelle Le Story Telling Good or Bad ? 1 2 3 Sommaire 4 5 6
  29. 29. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Edward Tufte : • Professeur Américain • “Leonard de Vinci des données” par le NY Times • Auteur de 4 livres : http://www.edwardtufte.com/tufte/ “Graphics are instruments for reasoning about quantitative information. Often the most effective way to describe , explore and summarize a set of numbers - even a large set - is to look at pictures of those numbers” Les Travaux de Tufte
  30. 30. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik • Data : Avant tout montrer les données ! • Question : • Inciter le spectateur à réfléchir à la substance plutôt qu'à la méthodologie ou à la conception graphique. • Encourager l'œil à comparer différentes données. • Concept du data-ink ratio => Maximiser la data densité • Intégrité : Eviter les manipulations / tordre les données • General to Specific • Le Contexte Les Travaux de Tufte
  31. 31. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Distribution d’une variable continue en 4 groupes Les Travaux de Tufte : Data-ink ratio
  32. 32. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Suppression de l’encre ne représentant pas les données Distribution d’une variable continue en 4 groupes Les Travaux de Tufte : Data-ink ratio
  33. 33. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Suppression de toutes les informations redondantes Distribution d’une variable continue en 4 groupes Les Travaux de Tufte : Data-ink ratio
  34. 34. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactikDistribution d’une variable continue en 4 groupes Suppression de toutes les informations redondantes Les Travaux de Tufte : Data-ink ratio
  35. 35. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactikDistribution d’une variable continue en 4 groupes Mise en évidence des données Les Travaux de Tufte : Data-ink ratio
  36. 36. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Distribution d’une variable continue en 4 groupes Les Travaux de Tufte : Data-ink ratio L’excellence graphique se détermine donc par la conjonction de la densité de l’information associée à une faible densité visuelle Avons nous perdu des informations ? Quelle information est mise en évidence ?
  37. 37. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Integrité : The lie Factor Fuel Economy Standards – NY Times 1978 Les Travaux de Tufte : Intégrité – Lie Factor
  38. 38. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Integrité : The lie Factor Les Travaux de Tufte : Intégrité – Lie Factor Fuel Economy Standards – Revisited
  39. 39. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik • Salaires : 28 % représentés par... 200 % • Heures de vol : 200 % de différence pour représenter 23 % Le Point : https://twitter.com/lepoint/status/657611278832287744 Attention aux manipulations : Intégrité – Lie Factor
  40. 40. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik L’effet visuel doit être égal à l’effet dans les données Lie Factor = 1 sinon DISTORSION Les Travaux de Tufte : Intégrité – Lie Factor
  41. 41. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik « Le meilleur graphique statistique jamais tracé » [Tufte] Carte figurative des pertes successives en hommes de l’Armée française dans la campagne de Russie en 1812-1813 Par Charles Joseph Minard (1869)
  42. 42. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik “ The graphics (…) tells a story ” [Tufte, Visual display … p.30] Un schéma pour 1888 nombres
  43. 43. 1 Définition L’efficacité graphique selon Jacques Bertin L’excellence graphique d’Edward Tufte Perception Visuelle Le Story Telling Good or Bad ? 1 2 3 Sommaire 4 5 6
  44. 44. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Capacités pré-attentives • Perception inconsciente • Mécanismes bas niveau du système visuel • Extrêmement rapide : réaction en 200 ms • Montée en charge : le temps de réaction croit lentement avec le nombre d’objets • Différents types de stimuli
  45. 45. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik http://flowingdata.com/2014/06/25/duck-vs-rabbit-plot/ QUIZZ : Que voyez-vous ?
  46. 46. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik 1212234245768631531965 3916539153965239861596 3516539176596375965326 5965396539762517653289 7461951976437261872649 1873765419873634856198 7687315461537176987189 3542561 QUIZZ : Compter le nombre de 3
  47. 47. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik 1212234245768631531965 3916539153965239861596 3516539176596375965326 5965396539762517653289 7461951976437261872649 1873765419873634856198 7687315461537176987189 3542561 QUIZZ : Compter le nombre de 3
  48. 48. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trouver le point rouge
  49. 49. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trouver le point rouge
  50. 50. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trouver le point rouge
  51. 51. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trouver l’intrus
  52. 52. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trouver l’intrus
  53. 53. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trouver l’intrus
  54. 54. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trier par ordre croissant
  55. 55. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trier par ordre croissant
  56. 56. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Trier par ordre croissant
  57. 57. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : En quelle année a eu lieu le plus grand écart ?
  58. 58. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik 1926 QUIZZ : En quelle année a eu lieu le plus grand écart ?
  59. 59. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Illusion de Ebbinghaus/Titchener
  60. 60. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Illusion de Ebbinghaus/Titchener
  61. 61. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Perspective
  62. 62. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Perspective – Variante de l’illusion de Ponzo
  63. 63. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Capacité pré-attentives : Couleurs - Daltonisme
  64. 64. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Capacité pré-attentives : Couleurs - Daltonisme
  65. 65. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Perceptions Visuelles Limites et freins de la nature humaine • Physiologie de l’oeil • Illusions graphiques • Fausses interprétations • Daltonisme • Erreurs d’appréciation • Préjugés de formes • Charge cognitive
  66. 66. 1 Définition L’efficacité graphique selon Jacques Bertin L’excellence graphique d’Edward Tufte Perception Visuelle Le Story Telling Good or Bad ? 1 2 3 Sommaire 4 5 6
  67. 67. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Expliquer Eclairer Engager / Divertir Les clés du Data Storytelling
  68. 68. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Le Data Storytelling permet de démocratiser l’accès aux données et de faciliter la prise de décision Les clés du Data Storytelling
  69. 69. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik • Quel est le message que vous souhaitez transmettre ? • A quel public est-il destiné ? • Quelles questions se pose ce public ? • Quelles réponses lui apportez-vous? • Les données les plus importantes sont-elles mises en valeur ? • La compréhension de votre visualisation est-elle rapide ? • Est-elle intelligible par elle même ? Posez-vous les bonnes questions !
  70. 70. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik http://www.concerthotels.com/100-years-of-rock/ Exemples
  71. 71. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik http://mbtaviz.github.io/ Exemples
  72. 72. 1 Définition L’efficacité graphique selon Jacques Bertin L’excellence graphique d’Edward Tufte Perception Visuelle Le Story Telling Good or Bad ? 1 2 3 Sommaire 4 5 6
  73. 73. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Bernard Lebelle – Convaincre avec des graphiques efficaces QUIZZ : Good or Bad ? Trop de décorum tue l’information
  74. 74. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Bernard Lebelle – Convaincre avec des graphiques efficaces QUIZZ : Good or Bad ?
  75. 75. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Définir un emplacement judicieux des légendes QUIZZ : Good or Bad ? - Le mouvement pendulaire
  76. 76. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik FIGURE – Major Cause of Worker Disability (1975-2010) (J. Schwabish, 2014). QUIZZ : Good or Bad ?
  77. 77. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik QUIZZ : Good or Bad ? • Quelle est la valeur observée la plus élevée ? C'était quand ? • En 2010, quelle était la cause principale d’invalidité ? • Est-ce que le cancer (courbe rouge) augmente durant la période représentée ? • Au cours des dernières années, quelles sont les causes qui ont augmenté (diminué) le plus ?
  78. 78. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Scinder en mini-canevas les univers complexes FIGURE – Major Cause of Worker Disability (1975-2010) (J. Schwabish, 2014). QUIZZ : Good or Bad ? - Les effets spaghettis
  79. 79. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Bernard Lebelle – Convaincre avec des graphiques efficaces Eviter les 3D malsaines ! QUIZZ : Good or Bad ?
  80. 80. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Ne pas surcharger les graphiques ! QUIZZ : Good or Bad ? Bernard Lebelle – Convaincre avec des graphiques efficaces
  81. 81. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Ne pas occulter le point zéro ! QUIZZ : Good or Bad ? Bernard Lebelle – Convaincre avec des graphiques efficaces
  82. 82. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Choisir des incréments naturels ! QUIZZ : Good or Bad ? Bernard Lebelle – Convaincre avec des graphiques efficaces
  83. 83. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Ne pas étirer ou déformer les axes QUIZZ : Good or Bad ? Bernard Lebelle – Convaincre avec des graphiques efficaces
  84. 84. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Construction d’un bon graphique • Utiliser les attributs graphiques adaptés • S’appuyer sur la pré-attention • Ne pas distraire le lecteur • Ne pas mentir au lecteur
  85. 85. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik http://datavizcatalogue.com/search.html Construction d’un bon graphique
  86. 86. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik KISS Keep It Significant & Shareable ! Conclusion
  87. 87. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik “There are no “good” nor “bad” graphics (...), there are graphics answering legitimate questions and graphics that do not answer question at all ” Bertin (1981)
  88. 88. Alexia Audevart Data & Enthusiasm alexia@datactik.com @aaudevart Thank You ! Do you have any questions ?
  89. 89. Alexia Audevart – Meetup Big Data / Data Science Montpellier© 2018 – datactik Sources Jacques Bertin : Livre Semiology of Graphics Edward Tufte : Livre The Visual Display of Quantitative Information Convaincre avec des graphiques efficaces – Bernard Lebelle Eyrolles : https://www.eyrolles.com/Entreprise/Livre/convaincre-avec-des-graphiques-efficaces-9782212553994 MOOC ENS - Coursera - Cartographie thématique : https://www.coursera.org/learn/cartographie Christophe Bontemps : • https://speakerdeck.com/toulousedatascience/number-26-la-data-visualisation-pour-la-data-science- et-les-data-scientists • http://data.visualisation.free.fr/

×