2. Dataviz
Ensemble des techniques de représentation graphique et d’exploration
visuelle des données quantitatives
Le but étant de transformer des données brutes en informations utiles à la
prise de décision
La représentation doit être interprétable, facile à appréhender quel que
soit le volume
Elle doit être pertinente, répondre à un besoin métier
Elle doit être originale, afin de découvrir de nouvelles informations dans la
donnée
2
3. Le quartet d’Anscombe 3
Le quartet d'Anscombe est constitué de quatre ensembles de données qui ont les
mêmes propriétés statistiques simples mais qui sont en réalité très différents ce qui se
voit facilement lorsqu'on les représente sous forme de graphiques.
Ils ont été construits en 1973 par le statisticien Francis Anscombe dans le but de
démontrer l'importance de tracer des graphiques avant d'analyser des données, car
cela permet notamment d'estimer l'incidence des données aberrantes sur les
différents indices statistiques que l'on pourrait calculer.
4. Le quartet d’Anscombe 4
Propriété Valeur
Moyenne des x 9,0
Variance des x 10,0
Moyenne des y 7,5
Variance des y 3,75
Coefficient de corrélation entre les x et les y 0,816
Équation de la droite de régression linéaire y=3 + 0,5 x
Somme des carrés des erreurs
relativement à la moyenne
110,0