Statistique
Faculté de Médecine
Année préparatoire
présenté Par :
Saad Bouh Sidaty REGAD
12/11/2014
1
• Discuter l’intérêt des statistiques en Sc médicales
• Définir les variables, citer un exemple pour chaque type de
variab...
Le terme statistique vient du mot latin "status" .
La statistique est l’ensemble de méthodes à partir
desquelles on recuei...
La Biostatistique est l’application de la statistique dans le
domaine biologique et médicale.
"La recherche biomédicale s’...
Vocabulaire élémentaire
 Élément/Objet/Individu/Sujet
 Population
 Échantillon
 Échantillon aléatoire
 Échantillon re...
Types de variables
Variables
qualitatives
Variables
quantitatives
nominales
ordinales continuesdiscrètes
V. binaire
6
Présentation tabulaire
 Enumération des observations (Série statistique)
 Lorsque les observations sont nombreuses, il p...
Caractère qualitatif
8
Niveau d’instruction
ni fi
Néant 450 0,8
Primaire 1200 0,48
Secondaire 750 0,30
Supérieure 100 0,04...
Caractère quantitatif discret
Tableau (4) :
Nombre des
mères ayant
ni fi Fi
0 enfant 8 26.66 26.66
1 8 26.66 53.32
2 7 23....
Caractère quantitatif continu
il est souvent nécessaire de regrouper en classes
les valeurs obs
La classe est définie par ...
Exemple : Dans une population donnée, on a pour l’âge la
distribution suivante :
Age
xi ni
0 – 10 5 75
10 – 20 15 150
20 –...
Représentations graphiques
12
Le type de représentation graphique à réaliser dépend de la nature
qualitative ou quantitati...
Représentation par tuyaux d’orgue (diagrammes à bandes)
13
Représentation par secteurs (Camembert)
14
Les caractères quantitatifs discret
Diagramme en barres ou en bâtons
Il est établi en traçant parallèlement à l’axe des or...
Diagramme en bâtons
16
Diagramme cumulatif
17
Les caractères quantitatifs continus
Histogramme
Les histogrammes se composent de rectangles contigus dont les
intervalles...
19
20
Statistique descriptive
Présentation
tabulaire
Représentation
graphique
Réduction des
données
Paramètres de
dispersion
Par...
Paramètres de position
MédianeModeMoyennes
arithmétique Harmonique Géométrique Quadratique
22
La médiane (Me)
Me est la valeur qui divise la population en deux parties égales
Pour les données non groupées
le nombre d...
Pour les distributions groupées
La médiane (Me) (suite)
Me = binf + a .
M e
1i
n
N
2
n


Nombre des
mères ayant
ni fi Fi...
n
ni
n
ni
n
ni
Salaires ni fi Fi
0-10 10 0.1 0.1
10-15 50 0.5 0.6
15-20 25 0.25 0.85
20-25 10 0.1 0.95
25-30 3 0.03 0.98
3...
les quartiles partagent la série des valeurs rangées par ordre croissant
en quatre parties contenant chacune 25% des obser...
Le mode (Mo)
Mo est la valeur de la variable qui se rencontre le plus fréquemment
2, 5, 5, 5, 7, 13, 16
Xi 0 1 2 3 4 5 6
n...
Le mode (Mo) (Suite)
Classes 48- 50 50- 52 52- 54 54- 56 56- 58 58– 60 60 - 62
ni 3 10 9 7 7 3 1
28
Mo = 50 + 2 (10-3)/((1...
La moyenne arithmétique
n
x
X
n
1i
i


n
xn
X
n
1i
ii


Xi ni nixi
0 24 0
1 57 57
2 75 150
3 53 159
4 33 132
5 7 35
...
Cas d’une variable continue
Classes Xi ni nixi
48 – 49 48,5 3 145,5
50 – 51 50,5 10 505
52 – 53 52,5 9 472,5
54 – 55 54,5 ...
Paramètres de dispersion
Ces paramètres permettent de chiffrer la variabilité des valeurs
observées autour d’un paramètre ...
L’étendue ( e )
e= Xn – X1
Écarts interquantiles
Écart interquartile : IQ = Q3 – Q1
Écart interdécile : ID = D9 – D1
Écart...
L’écart type
Il s’agit d’une distance moyenne des observations par rapport
à la moyenne arithmétique
2
i
)x(x
n
1
  2
i
...
Le coefficient de variation
X
S
xCV )(
Comparer la variabilité des distributions qui ne sont pas de
même nature ou encore...
Statistique descriptive à deux dimensions
 La Statistique descriptive à deux dimensions a pour but
 de caractériser les ...
36
Observation
N°
Modalités de X Modalités de Y
1 X1 Y1
2 X2 Y2
.
.
n Xn Yn
37
Yj
Xi Y1 Y2 Yq 
X1 n11 n12 n1q n1.
X2 n21 n22 n2q n2.
XP np1 np2 npq np.
 n.1 n.2 n.q n..=n
Nuage de points
38
35 40 45 50 55 60 65 70
1213141516
Age
Tension
Diagramme à barres 3D
39
Médecin
TSS
IDE
IMS
TS
Masculin
Féminin0
10
20
30
40
50
60
Masculin
Féminin
40
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Médecin TSS IDE IMS TS
Féminin
Masculin
Corrélation
41
Le coefficient de corrélation de Pearson mesure l’intensité de
la linéarité et le sens de la relation entre...
Le coefficient de corrélation des
rangs de Spearman (rs)
42
Pour calculer rs :
•présenter les données en couples de valeur...
 Étud : 1 2 3 4 5 6 7 8 9 10
 Corr 1 : 7 6 8 9 8 10 11 15 13 12
 Corr 2 : 4 7 13 9 7 5 10 13 5 6
 Correcteur 1 : 2 1 3...
Merci de
votre attention
44
Prochain SlideShare
Chargement dans…5
×

Stat1

1 057 vues

Publié le

chapitre 1 en biostatistique

Publié dans : Formation
0 commentaire
2 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 057
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5
Actions
Partages
0
Téléchargements
33
Commentaires
0
J’aime
2
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Stat1

  1. 1. Statistique Faculté de Médecine Année préparatoire présenté Par : Saad Bouh Sidaty REGAD 12/11/2014 1
  2. 2. • Discuter l’intérêt des statistiques en Sc médicales • Définir les variables, citer un exemple pour chaque type de variables • Construire à partir d’une série statistique : Un tableau de classes élémentaires Un tableau de données groupées Un histogramme Un polygone Un diagramme en barre (tuyau d’orgue) Un diagramme en cercle •Calculer la moyenne, le mode, la médiane, l’écart type •Calculer la corrélation de Pearson et de Spearman Objectifs éducationnels 2
  3. 3. Le terme statistique vient du mot latin "status" . La statistique est l’ensemble de méthodes à partir desquelles on recueille, organise, résume, présente et analyse des données, afin d’en tirer des conclusions et de prendre des décisions. Introduction C’est une méthode de raisonnement/ d’analyse permettant d’interpréter un grand nombre de données pour tirer des informations chiffrées et utilisables. des statistique = des données 3
  4. 4. La Biostatistique est l’application de la statistique dans le domaine biologique et médicale. "La recherche biomédicale s’appuie beaucoup sur la statistique qui permet notamment de comparer l’effet de différents traitements à partir d’un échantillon de patients. La statistique est absolument ubiquitaire et actuellement aucun article médical ne peut être publié sans qu’il ne contienne des intervalles de confiance, des écarts- types ou des tests statistiques avec leur p." Introduction 4
  5. 5. Vocabulaire élémentaire  Élément/Objet/Individu/Sujet  Population  Échantillon  Échantillon aléatoire  Échantillon représentatif  Variable statistique 5
  6. 6. Types de variables Variables qualitatives Variables quantitatives nominales ordinales continuesdiscrètes V. binaire 6
  7. 7. Présentation tabulaire  Enumération des observations (Série statistique)  Lorsque les observations sont nombreuses, il peut être utile de les condenser sous la forme d’une distribution de fréquences  Le nombre d’occurrence d’une même valeur observée est sa fréquence absolue (ni) 7 i n if n 
  8. 8. Caractère qualitatif 8 Niveau d’instruction ni fi Néant 450 0,8 Primaire 1200 0,48 Secondaire 750 0,30 Supérieure 100 0,04 Non déclaré 5 0,002 TOTAL 2505 100
  9. 9. Caractère quantitatif discret Tableau (4) : Nombre des mères ayant ni fi Fi 0 enfant 8 26.66 26.66 1 8 26.66 53.32 2 7 23.33 76.65 3 3 10 86.65 4 2 6.66 93.31 5 1 3.33 96.64 6 1 3.33 99 .97 TOTAL 30 100 9
  10. 10. Caractère quantitatif continu il est souvent nécessaire de regrouper en classes les valeurs obs La classe est définie par une amplitude La fréquence d’une classe est le nombre d’observations qui y sont contenues xi = Le nombre de classes est généralement compris entre 6 et 20. Il est proportionnel à l’effectif de la population étudié. a = (limite supérieure de la série – limite inférieure de la série)/ N  Autres formes empiriques :  N = 1 + 10/3 log10(n)  N = 2,5 4 n 10 2 supb inf b 
  11. 11. Exemple : Dans une population donnée, on a pour l’âge la distribution suivante : Age xi ni 0 – 10 5 75 10 – 20 15 150 20 – 30 25 100 30 – 40 35 125 40 – 50 45 75 50 - 60 55 100 60 - 70 65 50 TOTAL 11
  12. 12. Représentations graphiques 12 Le type de représentation graphique à réaliser dépend de la nature qualitative ou quantitative, discrète ou continue du caractère étudié. Le graphique doit respecter les normes suivantes : Un titre qui indique l’objet de la représentation graphique Des axes de références La source des données Les caractères qualitatifs
  13. 13. Représentation par tuyaux d’orgue (diagrammes à bandes) 13
  14. 14. Représentation par secteurs (Camembert) 14
  15. 15. Les caractères quantitatifs discret Diagramme en barres ou en bâtons Il est établi en traçant parallèlement à l’axe des ordonnées et en regard de chaque valeur observée Xi, un segment de longueur égale à la fréquence de cette valeur Diagramme cumulatif Le diagramme cumulatif est obtenu à partir des fréquences cumulées croissantes. Dans le cas d’une variable discrète, la courbe cumulative se présente comme une courbe en escalier. 15
  16. 16. Diagramme en bâtons 16
  17. 17. Diagramme cumulatif 17
  18. 18. Les caractères quantitatifs continus Histogramme Les histogrammes se composent de rectangles contigus dont les intervalles de classes sont les bases et les fréquences les hauteurs, de telle sorte que les aires des rectangles sont proportionnelles aux fréquences. Lorsque l’intervalle de classe (amplitudes) est variable, il est indispensable de porter en ordonnées les fréquences unitaires Polygone des fréquences On obtient un polygone de fréquences en joignant par une ligne brisée les milieux des segments supérieurs de chaque rectangle de l’histogramme. 18
  19. 19. 19
  20. 20. 20
  21. 21. Statistique descriptive Présentation tabulaire Représentation graphique Réduction des données Paramètres de dispersion Paramètres de position Paramètres de forme Paramètres de concentration 21
  22. 22. Paramètres de position MédianeModeMoyennes arithmétique Harmonique Géométrique Quadratique 22
  23. 23. La médiane (Me) Me est la valeur qui divise la population en deux parties égales Pour les données non groupées le nombre d’observations est impair Me = 2 1)(n X  2 3 5 9 12 15 17 Lorsque n est pair 2 )X(X 1) 2 n ( n/2   2 3 5 9 12 15 17 20 23
  24. 24. Pour les distributions groupées La médiane (Me) (suite) Me = binf + a . M e 1i n N 2 n   Nombre des mères ayant ni fi Fi 0 enfant 8 26.66 26.66 1 8 26.66 53.32 2 7 23.33 76.65 3 3 10 86.65 4 2 6.66 93.31 5 1 3.33 96.64 6 1 3.33 99 .97 TOTAL 30 24
  25. 25. n ni n ni n ni Salaires ni fi Fi 0-10 10 0.1 0.1 10-15 50 0.5 0.6 15-20 25 0.25 0.85 20-25 10 0.1 0.95 25-30 3 0.03 0.98 30-50 2 0.02 1  100 1 25 La médiane (Me) (suite) Me = 10 + 5 . (0.5-0.1)/0.5
  26. 26. les quartiles partagent la série des valeurs rangées par ordre croissant en quatre parties contenant chacune 25% des observations. Quintile : 5 parties F(qu3)=3/5 Déciles : 10 parties F(D1)= 1/10 F(D7)= 7/10 Centiles ou percentiles : 100 parties F(C5)=5/100 Les quartiles : 26
  27. 27. Le mode (Mo) Mo est la valeur de la variable qui se rencontre le plus fréquemment 2, 5, 5, 5, 7, 13, 16 Xi 0 1 2 3 4 5 6 ni 24 57 75 53 33 7 4 Cas d’une variable continue 21 1 inf EE E abMo   27
  28. 28. Le mode (Mo) (Suite) Classes 48- 50 50- 52 52- 54 54- 56 56- 58 58– 60 60 - 62 ni 3 10 9 7 7 3 1 28 Mo = 50 + 2 (10-3)/((10-3)+(10-9))=50.25
  29. 29. La moyenne arithmétique n x X n 1i i   n xn X n 1i ii   Xi ni nixi 0 24 0 1 57 57 2 75 150 3 53 159 4 33 132 5 7 35 6 4 24 TOTAL 253 557 29
  30. 30. Cas d’une variable continue Classes Xi ni nixi 48 – 49 48,5 3 145,5 50 – 51 50,5 10 505 52 – 53 52,5 9 472,5 54 – 55 54,5 7 381,5 56 – 57 56,5 7 395,5 58 – 59 58,5 3 175,5 60 - 61 60,5 1 60,5 TOTAL 40 2136 La moyenne arithmétique (suite) i k 1i i k 1i ii k21 kk2211 xf n xn .....nnn xn.....xnxn X         30
  31. 31. Paramètres de dispersion Ces paramètres permettent de chiffrer la variabilité des valeurs observées autour d’un paramètre de position. X: 2 3 4 5 6 4X Y: 4 4 4 4 4 4Y 31
  32. 32. L’étendue ( e ) e= Xn – X1 Écarts interquantiles Écart interquartile : IQ = Q3 – Q1 Écart interdécile : ID = D9 – D1 Écart intercentile : IC = C99 – C1 La série dont l’étendue est grand sera plus dispersée que celle dont l’étendue est petit e est souvent rejeté 32
  33. 33. L’écart type Il s’agit d’une distance moyenne des observations par rapport à la moyenne arithmétique 2 i )x(x n 1   2 i 2 xx n 1 = Pour les données non groupées S2 = Pour les données groupées S2 = 2 ii )x(xn n 1   )(2 VarianceSS  33
  34. 34. Le coefficient de variation X S xCV )( Comparer la variabilité des distributions qui ne sont pas de même nature ou encore de même nature et des différentes unités. Interpréter la variabilité quand il s’agit d’une seule distribution CV0,33 la dispersion est importante et les valeurs de la variable sont éloignées de leur moyenne CV <0,33 la dispersion est moins importante et les valeurs sont resserrées autour de leur moyenne. 34
  35. 35. Statistique descriptive à deux dimensions  La Statistique descriptive à deux dimensions a pour but  de caractériser les relations  qui peuvent exister entre deux séries d’observations considérées simultanément. 35  Tableaux statistiques  Représentations graphiques  Réduction des données Les observations relatives à deux variables (X, Y) peuvent se présenter d’une manière simple sous la forme d’une série statistique double : X= x1, x2, ………………….xn Y= y1, y2, ………………….yn
  36. 36. 36 Observation N° Modalités de X Modalités de Y 1 X1 Y1 2 X2 Y2 . . n Xn Yn
  37. 37. 37 Yj Xi Y1 Y2 Yq  X1 n11 n12 n1q n1. X2 n21 n22 n2q n2. XP np1 np2 npq np.  n.1 n.2 n.q n..=n
  38. 38. Nuage de points 38 35 40 45 50 55 60 65 70 1213141516 Age Tension
  39. 39. Diagramme à barres 3D 39 Médecin TSS IDE IMS TS Masculin Féminin0 10 20 30 40 50 60 Masculin Féminin
  40. 40. 40 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% Médecin TSS IDE IMS TS Féminin Masculin
  41. 41. Corrélation 41 Le coefficient de corrélation de Pearson mesure l’intensité de la linéarité et le sens de la relation entre les deux variables quantitatives yx SS yxCov r ),(  r est compris entre -1 et 1 : -r=1 : corrélation positive parfaite -r=0 : pas de corrélation -0.3r 0.6 : corrélation médiocre -0.6 r 1 : bonne corrélation
  42. 42. Le coefficient de corrélation des rangs de Spearman (rs) 42 Pour calculer rs : •présenter les données en couples de valeurs •classer séparément les x et les y. A chaque x correspond un rang de 1 à n et de même pour Y •à partir des n paires de xi et yi affectées du rang ri et ri’, on calcule pour chaque paire i la différence di=ri-ri’ •puis calculer rs )1( 6 1 2 2    nn d r i s
  43. 43.  Étud : 1 2 3 4 5 6 7 8 9 10  Corr 1 : 7 6 8 9 8 10 11 15 13 12  Corr 2 : 4 7 13 9 7 5 10 13 5 6  Correcteur 1 : 2 1 3.5 5 3.5 6 7 10 9 8  Correcteur 2 : 1 5.5 9.5 7 5.5 2.5 8 9.5 2.5 4  D : 1 -4.5 -6 -2 -2 3.5 -1 0.5 6.5 4  D2 : 1 20.25 36 4 4 12.25 1 0.25 42.25 16  43
  44. 44. Merci de votre attention 44

×