Cours n1 introduction_probabilits_et_variables_alatoires
étude d'une série statistiquebiostat.pdf
1. Dr Ouabdesselam
Maitre assistante en épidémiologie
et médecine préventive
Université Djillali Lyabes
Faculté de médecine
Département de médecine
Etude d’une série statistique: Type de variables
Paramètres statistiques : tendance centrale et
dispersion
2. Objectifs du TD
• Connaitre les types de variables
• Connaître l’intérêt de la représentation graphique des
données et tabulaire
• Connaître les différents types de graphes
• Savoir choisir le graphe en fonction du type de
données
• Connaître la légende d’une représentation graphique
3. Biostatistique
La statistique est l’étude de la collecte de données, leur
analyse, leur traitement, l’interprétation des résultats et leur
présentation afin de rendre les données compréhensibles
par tous.
4. Définitions
Population statistique: est l’ensemble des éléments sur lesquels porte l’étude. Les
éléments de la population sont appelés individus statistiques (ou unités
statistiques).
Individu (ou unités statistiques) :Les individus sont les éléments de la population
statistique étudiée. ou unité statistique
Variable statistique ou caractère: C'est ce qui est observé ou mesuré sur les
individus d'une population statistique
La modalité : Ce sont les différentes catégories que peut présenter une variable
5. • Exemple 1: On a procédé au recensement des 50 salariés de la
SONELGAZ en relevant les salaires horaires perçus:
Unité statistique: un salarié de SONELGAZ
Population: l’ensemble des 50 salariés de la société SONELGAZ
Caractère: le salaire horaire
Type de caractère: caractère quantitatif ou variable statistique
• Exemple 2: une enquête sur la nationalité des touristes visitant
l‘Algérie a concerné un échantillon de 500 touristes.
Unité statistique: un touriste
Population: l’ensemble des touriste visitant l‘Algérie
Caractère: nationalité
Type de caractère: qualitatif
6. Variables Modalités
Sexe masculin, féminin
Age 6 mois, 2 ans, 25 ans, 60 ans
Durée d’incubation d’une maladie 24h, 7 jours , 40 ans
Glycémie 0.65, 1.6, 2.8 g/l
Fréquence cardiaque 50,75,89,95,105 b/min
Notion de maladie malade, non malade
Couleur des yeux rouge , vert
Groupe sanguin A,B,O,AB….
Situation familiale célibataire, marié, divorcé .
Nombre de lit à l’hôpital 120 ,150 ….
Niveau d’instruction Primaire, moyen , secondaire et universitaire
7. 1.2 Vocabulaire (suite 2)
diapo 7
3 Types de données :
– Qualitatives (présence ou absence d’une caractéristique)
• Ordinale,
• Nominales.
– Quantitatives (compte ou mesure)
• Discontinues,
• Continues.
Types de variables
8. VARIABLES QUANTITATIVES
Variable quantitative :C’est un caractère dont les modalités s’exprimentpar
des valeurs numériques. = nombres exprimant une quantité
(Poids, taille, glycémie , tension artérielle, fréquence cardiaque, nombre d’étudiants
Variable quantitative
discrète:discontinue
Elle prend des valeurs isolées entières.
-le nombre d'enfants d'un ménage 2,4,5…
-Dentition:30, 31, 32 dents
Variable quantitative continue: elle
prend toutes les valeurs à l'intérieur d'un
intervalle entre deux modalités
-Taille: 1.72 m, Poids: 60 kg, âge: 24 ans
-Cholestérol: 2.22 g/l, glycémie .HT p..
Nombre entier
Intervalle
Variables discrètes -- Gaps entre les valeurs pas de gap entre les valeurs possibles
9. VARIABLES QUALITATIVES
Variable qualitative : elle prend des valeurs, ou modalités, s'expriment de
façon littérale (texte)
Ne permettent pas les calculs arithmétiques(moyenne…)
Variable qualitative
nominale :
Les modalités ne sont pas ordonnées
-Sexe: masculin, féminin
-Groupe sanguin: A, B, AB,O
-Maladie: malade, non malade
-Profession: médecin , infirmier
Variable qualitative ordinale
Les modalités sont ordonnées
-Satisfaction du malade (non satisfait
,peu satisfait ,satisfait ,très satisfait)
-Intensité de la douleur (légère,
moyenne, forte, très forte)
..
11. Pour synthétiser une série statistique, il est plus aisé d’utiliser un tableau
présentant en face de chaque modalité le nombre d’individus de
l’échantillon qui portent cette modalité.
Effectif : ou encore fréquence absolue d’une modalité M, le nombre
d’individus de l’échantillon qui possèdent cette modalité.
Le type de représentation graphique dépend de la nature
qualitative ou quantitative, discrète ou continue du caractère étudié.
Le graphique doit respecter les normes suivantes :
Un titre qui indique l’objet de la représentation graphique
Des axes de référence
La source des données
Tableaux de dénombrement
12. Important pour les tableaux
- Horizontalement on a les lignes
- Verticalement on a les colonnes
- Entre l’entête des colonnes et la colonne type, l’ensemble des
rubriques forme le corps du tableau.
- Le titre du tableau, en haut, comporte trois informations
essentielles, à savoir, le quoi, le quand et le ou, en plusde
la source des données.
18. Représentation graphique
Dans le cas du diagramme circulaire , par secteurs, ou Cambert chaque
modalité est représentée par une portion de disque proportionnelle à l’effectif
de la modalité (secteur).
Exemple : Etat matrimonial des détenus
d’une prison
Etat
matrimoni
al
Code Fréquen
ces
Angle
Marié 1 0,35 126
Célibataire 2 0,43 153
Divorcé 3 0,15 54
Veuf 4 0,08 27
Total 1,00 360
Graphique : Représentation par le diagramme circulaire de l’état
matrimonial des détenus d’une prison
0,35x360=126
19. 130 personnes ont été interrogées sur leur addiction au chocolat
300 personnes à propos de leur couleur des yeux
Modalités Effectifs Fréquences %
Bleu 60 0.200 20,0
Noir 160 0,533 53,3
Noisette 40 0,133 13,3
Vert 40 0,133 13,3
Total : 300 1 100
L’angle du secteur est proportionnel aux fréquences.
Pour définir l ’angle, on multiplie par 360° la fréquence.ex: noir :360 x 0.54
20. • distribution de 50 malades selon le sexe.
• 15 de sexe masculin et 35 de sexe féminin.
Fréquence relative (sexe masculin) = 15/50 = 0.3 = 30%.
Fréquence relative (sexe féminin) = 35/50 = 0.7 = 70%.
Graphe 1: Répartition de 50 étudiants (qui ?) selon le sexe faculté de médecine médecine de
SBA (où?) (2018) (quand?)
22. Tableau à simple entrée, où les données sont placées .
La première colonne renseigne les différentes valeurs du caractère, et les
deux suivantes les effectifs, fréquences
Noms Nombre d'enfants
M.Azim 2
MFarid 3
Mme Latifi 0
Melle Fatiha 0
M. Ahmed 1
M. Salih 0
M. Berrada 1
Mme Réda 0
Melle Fatiha 2
M. Halim 4
M. Chadi 1
Mme Faouzi 3
M. Ali 2
Melle Loubna 0
M Fatih 0
M. Said 1
M. Radi 2
Mme Faraj 2
Tableaux de dénombrement
24. Dans le cas du diagramme en bâtons, les modalités de la variable sont représentées en
bâtonnets dont les hauteurs sont proportionnelles aux effectifs des modalités
Exemple : Graphique en bâtonnets de la distribution du nombre d’enfants à charge des
employés d’une entreprise.
Nombre
d’enfants
Effectif
0 5
1 5
2 2
3 1
4 2
6 1
6 1
7 2
10 1
Total 20
26. Regrouper ces valeurs en classes dans un tableau
À chaque classe on fait correspondre une fréquence ou une fréquence
relative
Pour construire une distribution de fréquence, de fréquence relative pour
valeurs groupées on doit procéder de la manière suivante :
1. Déterminer le nombre declasses
2. Déterminer l’amplitude des classes
3. Déterminer les différentesclasses
On calcule l’étendue de la série: Valeur maximale –valeur minimale
1) On partage l’étendue en classes de même amplitude, en pratique le
nombre de classes est entre 5 et 20, de préférence
1) Pour chaque classe on détermine le nombre d’observations
(comptage des données appartenant à chaque classe;
27. une série brute de 60 valeurs du prime mensuelle d’une entreprise et le tableau
des effectifs obtenus.
28. diapo 28
On a mesuré le poids en kilogramme de 80 personnes.
Les données brutes sont comme suit :
La plus grande valeur est : 97 / La plus petite est : 53
L’étendue est :E= 97-53= 44
En fixant le nombre de classes à 10, l’amplitude des classes est
44/10= 4,4 soit équivaut à une amplitude de 4
29. Pour les trois dernières années, le débit mensuel moyen d'une rivière,
exprimé en milliers de mètres cubes par seconde, a été le suivant :
Posons X = la variable statistique représentant le débit mensuel moyen d’une rivière.
31. Les caractères quantitatifs continus
Histogramme: Ensemble de rectangles
contigus.
Pour chaque classe on trace un rectangle :
de base B proportionnelle à l’amplitude
de la classe
de hauteur h proportionnelle
à la densité de fréquence de
la classe
L’aire du rectangle sera alors
proportionnelle à la fréquence de la
classe.
Polygone de fréquences :on rejoint par une
ligne brisée les milieux des segments
supérieurs de chaque rectangle de
l’histogramme.
32. Graphique 1 : Polygone de fréquences de la distribution du
salaire mensuel des travailleurs de l’entreprise X en janvier
2008
NB : La surface délimitée par la courbe des
fréquences (en rouge sur le graphique) est
égale à celle de l’histogramme de la série
(surface en bleu).
Histogramme et polygone de fréquences
33. diapo 33
HORIZON® - CIPE / Tous Droits Réservés
Exemple : on souhaite étudier le salaires de 50 employés de la
société SONELGAZ
Salaires Fréquences
absolus ni
Fréquences
relatives fi
Amplitudes ai
6000-7000 12 24% 1000
7000-8000 10 20% 1000
8000-9000 15 30% 1000
9000-10000 8 16% 1000
10000-11000 5 10% 1000
Total 50 100%
35. RESUME
VARIABLE QUALITATIVE
TABLEAUX ET GRAPHIQUES
Nominale Ordinale
Effectifs ou Fréquences
VARIABLE QUANTITATIVE
Discrète Continue
Effectifs ou Fréquences
Diagramme en Diagramme en
barres barres
Diagramme circulaire
Diagramme en
bâtons
Histogramme
36. Questions
• Parmi les variables suivantes , donnez le type
de la variable ainsi que son échelle de
classification :
37.
38. Solution :
Pour le premier cas, la variable statistique est qualitative.
Pour le deuxième cas, la variable statistique est quantitative
continue.
Pour le troisième cas, la variable statistique est quantitative
discrète.
39. • 1.- Nombre d’enfants dans une famille
Type: Variable quantitative
Echelle de classification: discontinue
2.- Couleur des cheveux
• Type: Variable qualitative
• Echelle de classification: nominale
3.- Glycémie
• Type: Variable quantitative
• Echelle de classification: continue
40. • 4.- Notion de tabagisme
• Tabagique / non tabagique
• Type: Variable qualitative
• Echelle de classification: nominale
• Binaire ou dichotomique
• Ex: Malade / non malade
• Masculin/féminin
• Marche /arrêt
• On/off
41. • 5.- Taille d’un individu
• Type: Variable quantitative
• Echelle de classification: continue
44. • 7.- Nombre de colonies bactériennes dans un milieu
de culture
• Type: Variable quantitative
• Echelle de classification: discontinue
• 8.- Réussite à l’examen
• Type: Variable qualitative
• Echelle de classification: nominale
• Si oui /non binaire
9-Hauteur : Petit, Moyen, Grand
Poids: Très léger,Léger,Moyen, Lourd, Très lourd
• Type: Variable quantitative
• Echelle de classification: ordinale
45. Exercice 4
• Pour chacune des variables suivantes, précisersi
elle est qualitative, quantitative discrète ou
quantitative continue,
• (a) Revenu annuel.
• (b) Citoyenneté.
• (c) Distance.
• d) Taille.
• (e) Lieu de résidence.
• (f) Âge.
• (g) Couleur des yeux.
• (h) Nombre de langues parlées.
46. - Le tableau suivant donne la répartition selon le groupe sanguin de 40
individus pris au hasard dans une population,
1. Déterminer la variable statistique et son type.
2. Déterminer l’effectif des personnes ayant un groupe sanguin AB.
3,Donner toutes les représentations graphiques possibles de cette distribution.
47. Solution 1 - La population dans cette étude est les 40 personnes.
Donc N = 40.
La variable statistique est le groupe sanguin des individus et elle est
qualitative.
2 - L’effectif total est égal à 40. Par conséquent,
N = 40 =20 + 10 + n3 + 5
Alors,
Ce qui implique que n3 = 5.
3- Nous avons deux représentations possibles "Tyaux d’orgue" et
"Diagramme en secteur".
48. Exercice 8
- Le gérant d’un magasin vendant des articles de consommation
courante a relevé pour un article particulier qui semble connaître une
très forte popularité, le nombre d’articles vendus par jour.
- Son relevé a porté sur les ventes des mois de Mars et Avril, ce qui
correspond à 52 jours de vente.
- Le relevé des observations se présente comme suit :
7 13 8 10 9 12 10 8 9 10 6 14 7 15 9 11 12 11 12 5 14 11 8 10 14 12 8
5 7 13 12 16 11 9 11 11 12 12 15 14 5 14 9 9 14 13 11 10 11 12 9 15.
1. Quel type est la variable statistique étudiée.
2. Déterminer le tableau statistique en fonction des effectifs, des
fréquences.
3. Tracer le diagramme correspondant à la variable X.
49. Solution 1 - La population est les 52 jours et la variable statistique étudiée est le nombre
d’articles vendus par jour. Son type est bien évidement quantitatif discret (nombre).
50. Exercice 5
• - Pour les sujets d’étude qui suivent, spécifier
• la variable statistique et son type (modalité,)
• 1. Étude du temps de validité des lampes
électriques.
• 2. Étude de l’absentéisme des ouvriers, en jours,
dans une usine.
• 3. Répartition des étudiants d’une promotion
selon la mention obtenue au Bac.
51. Poids de naissance de 246 nouveaux nés à
terme dans une maternité
Poids en
gramme
Effectif
2200-2400 5
2400-2600 9
2600-2800 15
2800-3000 21
3000-3200 31
3200-3400 38
3400-3600 38
3600-3800 34
3800-4000 26
4000-4200 18
4200-4400 8
4400-4600 3
52. Tableau 1.2. Distribution du nombre d’épisodes de syndrome
grippal parmi 19 personnes
Nomb
re
d’épisod
es (xi)
Effectif
(ni)
%
0 3 15,8
1 7 36,8
2 6 31,6
3 2 10,5
4 1 5,3
Total 19 100,0 Diagramme en bâtons
54. Pds kg Centre de
classe
effectif %
50-54 52 1 5.3
55-59 57 2 10.5
60-64 62 5 26.3
65-69 67 4 21.1
70-74 72 3 15.8
75-79 77 3 15.8
80-84 82 1 5.3
total 19 100
Tableau 2: Répartition de 19 étudiants (qui ?) selon le poids faculté de médecine de SBA
(où?) (2018) (quand?)
55.
56. Enoncé du problème
On a étudié la taille en cm chez 20 enfants de quatrième
année primaire à l’école de SBA année scolaire 2016-
2017 et on a obtenu les résultats suivants :
127 128 136 139 130 133 127 126 131 130
120 129 126 133 138 132 122 139 133 134
• Questions
• 1- type de variable étudiée?:
• justifiez?
• Comment peut-on exprimer cette variable?
• 2- organiser ces observations par ordre croissant.
• 3- présentation tabulaire
• 4- représentation graphique
57. Réponses
• 1- Le type de variable étudiée: variable quantitative
continue
• Justification : (Numérique –intervalle)
• Cette variable s’exprime sur : tableaux , graphes .
• 2- organisation des observations par ordre croissant.
• 3- présentation tabulaire
• 4- représentation graphique(histogramme)
• 2- organiser ces données
• 120 122 126 126 127 127 128 129 130 130 131 132 133
133 133 134 136 138 139 139
58. 3- faire un tableau de fréquence
Taille (cm) Feffectif Fréquence en %
120-124 02 10
125-129 06 30
130-134 08 40
135-139 04 20
total 20 100
Tableau 03:Réparttion de la taille chez 20 enfants de quatrième année
primaire à l’école de SBA année scolaire 2016-2017