SlideShare une entreprise Scribd logo
1  sur  7
Dataviz
PRÉSENTATION DES DONNÉES
Dataviz
 Ensemble des techniques de représentation graphique et d’exploration
visuelle des données quantitatives
 Le but étant de transformer des données brutes en informations utiles à la
prise de décision
 La représentation doit être interprétable, facile à appréhender quel que
soit le volume
 Elle doit être pertinente, répondre à un besoin métier
 Elle doit être originale, afin de découvrir de nouvelles informations dans la
donnée
2
Le quartet d’Anscombe 3
Le quartet d'Anscombe est constitué de quatre ensembles de données qui ont les
mêmes propriétés statistiques simples mais qui sont en réalité très différents ce qui se
voit facilement lorsqu'on les représente sous forme de graphiques.
Ils ont été construits en 1973 par le statisticien Francis Anscombe dans le but de
démontrer l'importance de tracer des graphiques avant d'analyser des données, car
cela permet notamment d'estimer l'incidence des données aberrantes sur les
différents indices statistiques que l'on pourrait calculer.
Le quartet d’Anscombe 4
Propriété Valeur
Moyenne des x 9,0
Variance des x 10,0
Moyenne des y 7,5
Variance des y 3,75
Coefficient de corrélation entre les x et les y 0,816
Équation de la droite de régression linéaire y=3 + 0,5 x
Somme des carrés des erreurs
relativement à la moyenne
110,0
Le quartet d’Anscombe 5
x Jeu 1 Jeu 2 Jeu 3 Jeu 4
10,0 8,04 9,14 7,46 6,58
8,0 6,95 8,14 6,77 5,76
13,0 7,58 8,74 12,74 7,71
9,0 8,81 8,77 7,11 8,84
11,0 8,33 9,26 7,81 8,47
14,0 9,96 8,10 8,84 7,04
6,0 7,24 6,13 6,08 5,25
4,0 4,26 3,10 5,39 12,50
12,0 10,84 9,13 8,15 5,56
7,0 4,82 7,26 6,42 7,91
5,0 5,68 4,74 5,73 6,89
Le quartet d’Anscombe 6
Outils Dataviz
 https://flourish.studio/features/
 https://datastudio.google.com/
 Avec application locale : https://public.tableau.com/s/
 https://public.tableau.com/fr-fr/gallery/?tab=viz-of-the-day&type=viz-of-the-
day
 https://powerbi.microsoft.com/en-us/
 www.datawrapper.de
7

Contenu connexe

Plus de Patrick Bury

10 big data hadoop
10 big data hadoop10 big data hadoop
10 big data hadoopPatrick Bury
 
09 big data mapreduce
09 big data mapreduce09 big data mapreduce
09 big data mapreducePatrick Bury
 
06 cloud souverain
06 cloud souverain06 cloud souverain
06 cloud souverainPatrick Bury
 
05 creation instance ovh
05 creation instance ovh05 creation instance ovh
05 creation instance ovhPatrick Bury
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseursPatrick Bury
 
03 big data stockage
03 big data stockage03 big data stockage
03 big data stockagePatrick Bury
 
03 big data échelle
03 big data échelle03 big data échelle
03 big data échellePatrick Bury
 
02 big data definition
02 big data definition02 big data definition
02 big data definitionPatrick Bury
 
01 big data introduction
01 big data introduction01 big data introduction
01 big data introductionPatrick Bury
 
16 graph databases
16 graph databases16 graph databases
16 graph databasesPatrick Bury
 
15 map reduce on azure
15 map reduce on azure15 map reduce on azure
15 map reduce on azurePatrick Bury
 
14 big data gitlab
14 big data gitlab14 big data gitlab
14 big data gitlabPatrick Bury
 
13 big data docker
13 big data docker13 big data docker
13 big data dockerPatrick Bury
 
10 big data hadoop
10 big data hadoop10 big data hadoop
10 big data hadoopPatrick Bury
 

Plus de Patrick Bury (20)

10 big data hadoop
10 big data hadoop10 big data hadoop
10 big data hadoop
 
12 big data azure
12 big data azure12 big data azure
12 big data azure
 
09 big data mapreduce
09 big data mapreduce09 big data mapreduce
09 big data mapreduce
 
07 big data sgbd
07 big data sgbd07 big data sgbd
07 big data sgbd
 
06 cloud souverain
06 cloud souverain06 cloud souverain
06 cloud souverain
 
05 creation instance ovh
05 creation instance ovh05 creation instance ovh
05 creation instance ovh
 
04 big data fournisseurs
04 big data fournisseurs04 big data fournisseurs
04 big data fournisseurs
 
03 big data stockage
03 big data stockage03 big data stockage
03 big data stockage
 
03 big data échelle
03 big data échelle03 big data échelle
03 big data échelle
 
02 big data definition
02 big data definition02 big data definition
02 big data definition
 
01 open data
01 open data01 open data
01 open data
 
01 big data introduction
01 big data introduction01 big data introduction
01 big data introduction
 
16 graph databases
16 graph databases16 graph databases
16 graph databases
 
15 map reduce on azure
15 map reduce on azure15 map reduce on azure
15 map reduce on azure
 
14 big data gitlab
14 big data gitlab14 big data gitlab
14 big data gitlab
 
100 évaluation
100 évaluation100 évaluation
100 évaluation
 
13 big data docker
13 big data docker13 big data docker
13 big data docker
 
12 big data azure
12 big data azure12 big data azure
12 big data azure
 
11 big data aws
11 big data aws11 big data aws
11 big data aws
 
10 big data hadoop
10 big data hadoop10 big data hadoop
10 big data hadoop
 

08 big data dataviz

  • 2. Dataviz  Ensemble des techniques de représentation graphique et d’exploration visuelle des données quantitatives  Le but étant de transformer des données brutes en informations utiles à la prise de décision  La représentation doit être interprétable, facile à appréhender quel que soit le volume  Elle doit être pertinente, répondre à un besoin métier  Elle doit être originale, afin de découvrir de nouvelles informations dans la donnée 2
  • 3. Le quartet d’Anscombe 3 Le quartet d'Anscombe est constitué de quatre ensembles de données qui ont les mêmes propriétés statistiques simples mais qui sont en réalité très différents ce qui se voit facilement lorsqu'on les représente sous forme de graphiques. Ils ont été construits en 1973 par le statisticien Francis Anscombe dans le but de démontrer l'importance de tracer des graphiques avant d'analyser des données, car cela permet notamment d'estimer l'incidence des données aberrantes sur les différents indices statistiques que l'on pourrait calculer.
  • 4. Le quartet d’Anscombe 4 Propriété Valeur Moyenne des x 9,0 Variance des x 10,0 Moyenne des y 7,5 Variance des y 3,75 Coefficient de corrélation entre les x et les y 0,816 Équation de la droite de régression linéaire y=3 + 0,5 x Somme des carrés des erreurs relativement à la moyenne 110,0
  • 5. Le quartet d’Anscombe 5 x Jeu 1 Jeu 2 Jeu 3 Jeu 4 10,0 8,04 9,14 7,46 6,58 8,0 6,95 8,14 6,77 5,76 13,0 7,58 8,74 12,74 7,71 9,0 8,81 8,77 7,11 8,84 11,0 8,33 9,26 7,81 8,47 14,0 9,96 8,10 8,84 7,04 6,0 7,24 6,13 6,08 5,25 4,0 4,26 3,10 5,39 12,50 12,0 10,84 9,13 8,15 5,56 7,0 4,82 7,26 6,42 7,91 5,0 5,68 4,74 5,73 6,89
  • 7. Outils Dataviz  https://flourish.studio/features/  https://datastudio.google.com/  Avec application locale : https://public.tableau.com/s/  https://public.tableau.com/fr-fr/gallery/?tab=viz-of-the-day&type=viz-of-the- day  https://powerbi.microsoft.com/en-us/  www.datawrapper.de 7