SlideShare une entreprise Scribd logo
EchantillonnageEchantillonnage
L’échantillonnageL’échantillonnage
Jean-Sébastien PierreJean-Sébastien Pierre
UMR 6553UMR 6553
20/01/200920/01/2009
EchantillonnageEchantillonnage
PlanPlan
 1. Introduction1. Introduction
 2. L’échantillonnage aléatoire2. L’échantillonnage aléatoire
 SimpleSimple
 Séquentiel en deux étapesSéquentiel en deux étapes
 3. L’échantillonnage stratifié3. L’échantillonnage stratifié
 Mise en œuvre et analyseMise en œuvre et analyse
 OptimisationOptimisation
 4. L’échantillonnage en grappes4. L’échantillonnage en grappes
 Mise en œuvre et analyseMise en œuvre et analyse
 OptimisationOptimisation
EchantillonnageEchantillonnage
IntroductionIntroduction
« Pas de modèle sans échantillon, pas d’échantillon sans modèle »« Pas de modèle sans échantillon, pas d’échantillon sans modèle »
Un professionnel du prêt-à-porterUn professionnel du prêt-à-porter
« Les tissus, disponibles en quantité limitée, ne peuvent être ni repris ni« Les tissus, disponibles en quantité limitée, ne peuvent être ni repris ni
échangés.échangés.
Par contre vous pouvez obtenir un échantillon de chacun des tissus pourPar contre vous pouvez obtenir un échantillon de chacun des tissus pour
un prix modique. »un prix modique. »
La boutique A&A, http://www.a-et-a.com/La boutique A&A, http://www.a-et-a.com/
EchantillonnageEchantillonnage
Le dictionnaire RobertLe dictionnaire Robert
 1. Vx Étalon de mesure. (1636) Mod. Type réglementaire de certains matériaux1. Vx Étalon de mesure. (1636) Mod. Type réglementaire de certains matériaux
de construction.de construction. Bois d'échantillon. Brique, pavé d'échantillon.Bois d'échantillon. Brique, pavé d'échantillon. — Mar.— Mar. BâtimentBâtiment
de fort, de petit, de faible échantillon,de fort, de petit, de faible échantillon, suivant la largeur et l'épaisseur des piècessuivant la largeur et l'épaisseur des pièces
de construction.de construction.

2. (1407) Cour. Petite quantité d'une marchandise qu'on montre pour donner une2. (1407) Cour. Petite quantité d'une marchandise qu'on montre pour donner une
idée de l'ensemble.idée de l'ensemble. Les échantillons d'une gamme de produits. Échantillons deLes échantillons d'une gamme de produits. Échantillons de
vin, de café. Un cahier d'échantillonsvin, de café. Un cahier d'échantillons (d'étoffe).(d'étoffe). Une palette d'échantillonsUne palette d'échantillons (de(de
peinture).peinture). Boîte, jeux d'échantillons à usage commercial.Boîte, jeux d'échantillons à usage commercial. Þ Þ collectioncollection,, présentoirprésentoir..
« Il étale ses échantillons, lentement, devant le client »« Il étale ses échantillons, lentement, devant le client » ((MauroisMaurois)). « Quel danger,. « Quel danger,
quelle folie de choisir sur des échantillons »quelle folie de choisir sur des échantillons » ((SarrauteSarraute))..
 Spécimen remarquable d'une espèce, d'un genre. Þ Spécimen remarquable d'une espèce, d'un genre. Þ  représentantreprésentant .. « Une« Une
très jolie servante, charmant échantillon de la beauté des femmes detrès jolie servante, charmant échantillon de la beauté des femmes de
Malaga »Malaga » ((GautierGautier))..
 Fig. Aperçu.Fig. Aperçu. « Je voulus lui donner un échantillon de mon talent »« Je voulus lui donner un échantillon de mon talent »
((RousseauRousseau)).. Þ Þ exempleexemple..

3. Spécialt (Statist.) Fraction d'une population destinée à être étudiée par3. Spécialt (Statist.) Fraction d'une population destinée à être étudiée par
sondage.sondage. panelpanel..

4. Inform. Élément d'une suite discrète résultant de l'échantillonnage d'une4. Inform. Élément d'une suite discrète résultant de l'échantillonnage d'une
grandeur analogique.grandeur analogique.
EchantillonnageEchantillonnage
Pourquoi échantillonner ?Pourquoi échantillonner ?
 Impossibilité d’accéderImpossibilité d’accéder
 À tous les individus d’une populationÀ tous les individus d’une population
 À la totalité d’une aireÀ la totalité d’une aire
 => On procède donc par inférence=> On procède donc par inférence
 EchantillonnageEchantillonnage
 SondageSondage
EchantillonnageEchantillonnage
Deux grandes stratégiesDeux grandes stratégies
 AléatoireAléatoire
 SimpleSimple
 StratifiéStratifié
 En grappe ou par degrésEn grappe ou par degrés
 SystématiqueSystématique
 Transects et grillesTransects et grilles
 Décimation/quantisationDécimation/quantisation
 Échantillonnage temporelÉchantillonnage temporel
EchantillonnageEchantillonnage
Limites du coursLimites du cours
 On se limitera à l’échantillonnageOn se limitera à l’échantillonnage
aléatoirealéatoire
 Les problèmes de l’échantillonnageLes problèmes de l’échantillonnage
systématique seront abordés danssystématique seront abordés dans
d’autes UE à propos ded’autes UE à propos de
 La statistique spatialeLa statistique spatiale
 L’analyse des séries chronologiquesL’analyse des séries chronologiques
EchantillonnageEchantillonnage
2. L’échantillonnage2. L’échantillonnage
aléatoirealéatoire
SimpleSimple
Séquentiel en deux étapesSéquentiel en deux étapes
EchantillonnageEchantillonnage
Echantillonnage aléatoireEchantillonnage aléatoire
simplesimple
 DéfinitionDéfinition
 Les individus de la population sont tousLes individus de la population sont tous
équivalentséquivalents
 Le nombre d’individus à échantillonner estLe nombre d’individus à échantillonner est
déterminé à l’avancedéterminé à l’avance
 Chaque individu de la population a la mêmeChaque individu de la population a la même
probabilitéprobabilité a prioria priori d’être choisid’être choisi
 Le choix d’un individu ne favorise ni neLe choix d’un individu ne favorise ni ne
défavorise le choix ultérieur d’aucun autredéfavorise le choix ultérieur d’aucun autre
individu de la population (tirages indépendants)individu de la population (tirages indépendants)
EchantillonnageEchantillonnage
Les individus ou unitésLes individus ou unités
d’échantillonnaged’échantillonnage
 NaturelsNaturels
 Animaux, plantes individualiséesAnimaux, plantes individualisées
 ArbitrairesArbitraires
 Unités de surface, de volume, de poidsUnités de surface, de volume, de poids
 0.25 m0.25 m22
de prairiede prairie
 1dm1dm33
d’eau dans un étangd’eau dans un étang
 1k de sol1k de sol
 Attention alors !Attention alors !
 Population biologiquePopulation biologique
 Population statistiquePopulation statistique
EchantillonnageEchantillonnage
Deux mode de tirageDeux mode de tirage
 Avec remiseAvec remise
 Ou non exhaustifOu non exhaustif
 La probabilité de sélection resteLa probabilité de sélection reste
constante au cours de l’échantillonnageconstante au cours de l’échantillonnage
 Sans remiseSans remise
 Ou exhaustifOu exhaustif
 La probabilité de sélection s’accroît auLa probabilité de sélection s’accroît au
cours de l’échantillonnagecours de l’échantillonnage
EchantillonnageEchantillonnage
Une approximationUne approximation
 Dans les très grandes populations, onDans les très grandes populations, on
considère souvent l’échantillonnageconsidère souvent l’échantillonnage
comme avec remise, même lorsqu’ilcomme avec remise, même lorsqu’il
n’y a pas remisen’y a pas remise
 Dans les populations plus petites, il yDans les populations plus petites, il y
aura lieu de prendre en compte leaura lieu de prendre en compte le
taux de sondagetaux de sondage f = n/Nf = n/N
EchantillonnageEchantillonnage
Le modèle statistiqueLe modèle statistique
µ
^
E
σ2
σ2
Ω
x-
EchantillonnageEchantillonnage
Les paramètres deLes paramètres de
l’échantillonl’échantillon
 Moyenne deMoyenne de
l’échantillon :l’échantillon :
 Variance deVariance de
l’échantillon :l’échantillon :
x
n
xi
i
n
=
=
∑
1
1
s
n
x xi
i
n
2
1
21
= −
=
∑( )
EchantillonnageEchantillonnage
Paramètres et estimateursParamètres et estimateurs
 La moyenne est unLa moyenne est un estimateur sansestimateur sans
biaisbiais de la moyenne de la populationde la moyenne de la population
 La variance sLa variance s22
est un estimateurest un estimateur biaisébiaisé
par défautpar défaut (mais(mais asymptotiquementasymptotiquement
sans biais) de la variance de lasans biais) de la variance de la
populationpopulation
( )E x µ=
( )2 2
E s σ<
EchantillonnageEchantillonnage
Voir annexe polycopiéeVoir annexe polycopiée
EchantillonnageEchantillonnage
Le biaisLe biais
0 5000 10000 15000 20000 25000
4.04.55.0
n
s Comparaison des deux estimateurs sur un même échantillon
EchantillonnageEchantillonnage
Le biaisLe biais
0 20 40 60 80 100
510152025
scale
lvar
EchantillonnageEchantillonnage
La précisionLa précision
d’échantillonnaged’échantillonnage
Quelle connaissanceQuelle connaissance
avons nous de la moyenneavons nous de la moyenne
de la population ?de la population ?
EchantillonnageEchantillonnage
Les mesures de précisionLes mesures de précision
 La varianceLa variance
 Incommode (exprimée dans le carré des unités)Incommode (exprimée dans le carré des unités)
 L’erreur standardL’erreur standard
 Utilisée par les anglo-saxonsUtilisée par les anglo-saxons
 Le coefficient de variationLe coefficient de variation
 Utilisé par les agronomesUtilisé par les agronomes
 Le ½ intervalle de confianceLe ½ intervalle de confiance
 C’est un véritable encadrementC’est un véritable encadrement
EchantillonnageEchantillonnage
La précision estLa précision est
 Proportionnelle à l’écart-type de laProportionnelle à l’écart-type de la
moyenne (en général de l’estimateur) oumoyenne (en général de l’estimateur) ou
erreur standard sur la moyenneerreur standard sur la moyenne
 Comment la calcule-t-on ?Comment la calcule-t-on ?
 Population infiniePopulation infinie
 Ou tirage avec remiseOu tirage avec remise
 Population finiePopulation finie
 Et tirage sans remiseEt tirage sans remise
m
n
σ
σ =
( )1m f
n
σ
σ = −
EchantillonnageEchantillonnage
estimateursestimateurs
 Population infiniePopulation infinie
 Ou tirage nonOu tirage non
exhaustifexhaustif
 Population finiePopulation finie
 Et tirage exhaustifEt tirage exhaustif
ˆ
ˆm
n
σ
σ =
( )
ˆ
ˆ 1m f
n
σ
σ = −
EchantillonnageEchantillonnage
Le demi intervalle deLe demi intervalle de
confianceconfiance
 On sait « encadrer » la moyenneOn sait « encadrer » la moyenne
avec une probabilité d’erreur définieavec une probabilité d’erreur définie
par l’intervalle de confiance (voirpar l’intervalle de confiance (voir
annexe)annexe)
 Ou, siOu, si nn < 30< 30
2 2
ˆ ˆ
,cI x z x z
n n
a a
s sé ù
= - +ê ú
ê úë û
1
2 2
1 ˆ ˆ
, n
n
cI x t x t
n na a
s s
-
-
é ù
ê ú= - +
ê úë û
EchantillonnageEchantillonnage
Précision absolue etPrécision absolue et
relativerelative
 La quantité :La quantité :
 Ou, pour n>30Ou, pour n>30
 Sera utilisée comme « précision absolue »Sera utilisée comme « précision absolue »
La quantitéLa quantité
 Sera nommée : « précision relativeSera nommée : « précision relative
2
1 ˆn
d t
na
s-
=
2
ˆ
d z
n
a
s
=
rel
d
d
x
=
EchantillonnageEchantillonnage
Un exempleUn exemple
La taille du parasitoïdeLa taille du parasitoïde
leptomastix dactylopiileptomastix dactylopii
EchantillonnageEchantillonnage
L’animalL’animal
EchantillonnageEchantillonnage
L’échantillonL’échantillon
 On a prélevé au hasard 50 individusOn a prélevé au hasard 50 individus
femelles à partir de cochenilles du maniocfemelles à partir de cochenilles du manioc
provenant d’un champ du congo (donnéesprovenant d’un champ du congo (données
André Biassangama)André Biassangama)
> print(biassang)> print(biassang)
numer tail long fec stratenumer tail long fec strate
1 1 0.63 29 52 11 1 0.63 29 52 1
2 2 0.75 25 56 12 2 0.75 25 56 1
3 12 0.85 31 57 13 12 0.85 31 57 1
……………………………………………………………………………………………………………………………………………………
48 29 2.72 39 115 248 29 2.72 39 115 2
49 32 2.84 39 119 249 32 2.84 39 119 2
50 31 2.92 37 121 250 31 2.92 37 121 2
EchantillonnageEchantillonnage
Exemple : taille deExemple : taille de
leptomastixleptomastix
> attach(biassang)> attach(biassang) # définition du jeu de données# définition du jeu de données
> sd<-sqrt(var(tail)/n)> sd<-sqrt(var(tail)/n) # calcul de l’erreur standard# calcul de l’erreur standard
> qnorm(1-0.025)> qnorm(1-0.025) # calcul de z (alpha/2)# calcul de z (alpha/2)
[1] 1.959964[1] 1.959964
> d<-sd*qnorm(1-0.025)> d<-sd*qnorm(1-0.025) # précision absolue# précision absolue
> d> d
[1] 0.1474185[1] 0.1474185
> mean(tail)> mean(tail) # taille moyenne (mm)# taille moyenne (mm)
[1] 1.7818[1] 1.7818
> mean(tail)-d> mean(tail)-d # borne inférieure# borne inférieure
[1] 1.634382[1] 1.634382
> mean(tail)+d> mean(tail)+d # borne supérieure# borne supérieure
[1] 1.929218[1] 1.929218
EchantillonnageEchantillonnage
Encadrement de laEncadrement de la
moyenne :moyenne :
 La taille moyenne de la population dLa taille moyenne de la population d
de la population des femelles dude la population des femelles du
parasitoïdeparasitoïde Leptomastix dactylopiiLeptomastix dactylopii estest
estimée à 1.78 mmestimée à 1.78 mm
 On peut affirmer – avec 5% desOn peut affirmer – avec 5% des
chances de se tromper – qu’elle estchances de se tromper – qu’elle est
comprise entre 1.63 et 1.93 mmcomprise entre 1.63 et 1.93 mm
EchantillonnageEchantillonnage
La précision absolue etLa précision absolue et
relativerelative
 La moyenne est connue à plus ouLa moyenne est connue à plus ou
moins 0.15 mm prèsmoins 0.15 mm près
 C’est à dire à 8.3% prèsC’est à dire à 8.3% près
> d/(mean(tail))*100> d/(mean(tail))*100
[1] 8.273571[1] 8.273571
EchantillonnageEchantillonnage
Contrôler la précisionContrôler la précision
d’échantillonnaged’échantillonnage
La base du travail pratiqueLa base du travail pratique
EchantillonnageEchantillonnage
Comment évolue laComment évolue la
précision ?précision ?
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0 50 100 150 200 250 300 350 400
Effectif de l'échantillon (n)
Précision relative
0.1
0.2
0.5
1
EchantillonnageEchantillonnage
Le gain marginal deLe gain marginal de
précisionprécision
 La dérivée de la précision relative donne le gain marginalLa dérivée de la précision relative donne le gain marginal
par unité supplémentaire d’échantillonnage.par unité supplémentaire d’échantillonnage.
Gain marginal de précision
-5
-4
-3
-2
-1
0
1
2 4 6 8 10 12 14 16 18 20
Série1
Série2
Série3
Série4
EchantillonnageEchantillonnage
Calculer l’effectifCalculer l’effectif
nécessairenécessaire
 1. Définir l’objectif à atteindre1. Définir l’objectif à atteindre
 Le risqueLe risque αα accepté (le plus souvent 0.05)accepté (le plus souvent 0.05)
 La précision absolue ou relative désiréeLa précision absolue ou relative désirée
 2. Déterminer la variance de la population2. Déterminer la variance de la population
 On a souvent besoin d’un pré-échantillonnageOn a souvent besoin d’un pré-échantillonnage
 3. Déterminer3. Déterminer nn
EchantillonnageEchantillonnage
Un paradoxe !Un paradoxe !
« Pour faire un bon échantillonnage« Pour faire un bon échantillonnage
faites en d’abord un mauvais »faites en d’abord un mauvais »
(J.S. Pierre, pensées)(J.S. Pierre, pensées)
EchantillonnageEchantillonnage
La détermination deLa détermination de nn
 De la définition de la précisionDe la définition de la précision
 On déduit :On déduit :
2
ˆ
d z
n
a
s
£
2
2
2
2
ˆ
n z
d
a
s
³
EchantillonnageEchantillonnage
Et si on parlait argent ?Et si on parlait argent ?
 On définit :On définit :
 L’effort d’échantillonnage : c’estL’effort d’échantillonnage : c’est nn
 Le coût de prise en charge de l’échantillonnageLe coût de prise en charge de l’échantillonnage CCoo
 Fabrication des cadres, pièges, coûtFabrication des cadres, pièges, coût
du trajet, affrètement d’un bateau,du trajet, affrètement d’un bateau,
etc…etc…
 Le coût unitaire de prélèvement d’un individuLe coût unitaire de prélèvement d’un individu cc
 Mesuré en temps de travail, enMesuré en temps de travail, en
euros, en litres de fuel (chalutier)euros, en litres de fuel (chalutier)
etc…etc…
 Le coût total de l’échantillonnage :Le coût total de l’échantillonnage : 0TC C nc= +
EchantillonnageEchantillonnage
OptimisationOptimisation
 Stratégies de type « minimax »Stratégies de type « minimax »
 Maximiser l’information (minimiser laMaximiser l’information (minimiser la
précision)précision)
 En minimisant, ou au moins enEn minimisant, ou au moins en
maîtrisant les coûtsmaîtrisant les coûts
 Pas de solution universellePas de solution universelle
EchantillonnageEchantillonnage
ExempleExemple
 La taille moyenne de la population deLa taille moyenne de la population de
LeptomastixLeptomastix est connue à 8.3% prèsest connue à 8.3% près
avec un échantillon de 50 femellesavec un échantillon de 50 femelles
 Quel échantillon est nécessaire pourQuel échantillon est nécessaire pour
atteindre une précision de 5% suratteindre une précision de 5% sur
cette moyenne ?cette moyenne ?
EchantillonnageEchantillonnage
SolutionSolution
 Ecrivons la formule de la précisionEcrivons la formule de la précision
relativerelative
 On cherche à résoudre l’inégalité :On cherche à résoudre l’inégalité :
 Donc :Donc :
2
r
z
d
x n
a s
=
2
0.05 0.05r
z
d
x n
a s
£ Þ £
2 2
2 2 2 2
2 20.0025
0.0025
z z
n
x n x
a as s
£ Þ ³
EchantillonnageEchantillonnage
Numériquement :Numériquement :
 On prendraOn prendra n=n=137137
 CommenterCommenter
2
2
2 2
2
2
ˆ
0.0025
1.96
ˆ 0.2829
1.71818
136.908
z
n
x
z
x
n
a
a
s
s
³
=
=
=
³
EchantillonnageEchantillonnage
L’échantillonnageL’échantillonnage
séquentiel en deux étapesséquentiel en deux étapes
Doit-on refaire unDoit-on refaire un
échantillon de 137échantillon de 137
individus ?individus ?
EchantillonnageEchantillonnage
Non !Non !
 Il est licite de compléter l’échantillonIl est licite de compléter l’échantillon
de 50 individus à 137de 50 individus à 137
 C’est à dire d’aller prélever auxC’est à dire d’aller prélever aux
hasard 137 - 50 = 87 nouveauxhasard 137 - 50 = 87 nouveaux
individusindividus
 Cette procédure s’appelle :Cette procédure s’appelle :
« échantillonnage séquentiel en deux« échantillonnage séquentiel en deux
étapes »étapes »
EchantillonnageEchantillonnage
OuvertureOuverture
 Un échantillonnage est ditUn échantillonnage est dit séquentielséquentiel s’il ests’il est
conduit parconduit par étapesétapes jusqu’à un critère d’arrêt.jusqu’à un critère d’arrêt.
 L’échantillon est alors ditL’échantillon est alors dit informatifinformatif il renseigne auil renseigne au
fur et à mesure sur la précision atteinte ou surfur et à mesure sur la précision atteinte ou sur
d’autres critères d’arrêtd’autres critères d’arrêt
 Deux types principaux :Deux types principaux :
 Echantillonnage séquentiel à précision fixéeEchantillonnage séquentiel à précision fixée
 Echantillonnage décisionnelEchantillonnage décisionnel
 Voir par exemple le livre de Frontier : stratégiesVoir par exemple le livre de Frontier : stratégies
d’échantillonnage en écologied’échantillonnage en écologie
EchantillonnageEchantillonnage
3. L’échantillonnage3. L’échantillonnage
stratifiéstratifié
Du bon usage des stratesDu bon usage des strates
EchantillonnageEchantillonnage
Que faire si la variance desQue faire si la variance des
individus est élevée ?individus est élevée ?
 L’obtention d’une bonne précision estL’obtention d’une bonne précision est
alors extrêmement coûteusealors extrêmement coûteuse
 Mais la population est peut-être trèsMais la population est peut-être très
hétérogène ?hétérogène ?
 On peut alors la diviser enOn peut alors la diviser en soussous
populationspopulations plus homogènesplus homogènes
 On gagne alors beaucoup deOn gagne alors beaucoup de
précisionprécision
EchantillonnageEchantillonnage
Mise en oeuvreMise en oeuvre
Le modèle statistiqueLe modèle statistique
changechange
EchantillonnageEchantillonnage
Une nouvelle vision de laUne nouvelle vision de la
populationpopulation
 Et des paramètresEt des paramètres
µ,σ2
Ω
S1
S2
S3
µ1,σ2
1
µ2,σ2
2
µ3,σ2
3
EchantillonnageEchantillonnage
Définition des stratesDéfinition des strates
 Les strates forment uneLes strates forment une partitionpartition dede
la populationla population
 C’est à dire que leurs intersectionsC’est à dire que leurs intersections
sont deux à deux vides (elles sontsont deux à deux vides (elles sont
disjointes)disjointes)
 Leur réunion est la population totaleLeur réunion est la population totale
EchantillonnageEchantillonnage
Hypothèse :Hypothèse :
 Les variances « intra » sontLes variances « intra » sont
inférieures à la variance totaleinférieures à la variance totale
2 2
1
2 2
2
2 2
3
s s
s s
s s
<
<
<
EchantillonnageEchantillonnage
Les poids des stratesLes poids des strates
 A chaque strate est affectée unA chaque strate est affectée un
poids : la proportion de la populationpoids : la proportion de la population
totale qu’elle représentetotale qu’elle représente
 ww11,,ww22,,ww33, en général, en général wwii
1
1
i
i
p
i
i
N
w
N
w
=
=
=å
EchantillonnageEchantillonnage
L’échantillon stratifiéL’échantillon stratifié
 On tire un échantillon aléatoire simple deOn tire un échantillon aléatoire simple de
tailletaille nnii dans la stratedans la strate ii..
 L’échantillon complet est de tailleL’échantillon complet est de taille nn
 On appelleOn appelle allocationallocation le poids de la stratele poids de la strate
ii dans l’échantillondans l’échantillon
 Si le poids de la strate dans l’échantillonSi le poids de la strate dans l’échantillon
est égal au poids de la strate dans laest égal au poids de la strate dans la
population on dit que l’allocation estpopulation on dit que l’allocation est
proportionnelleproportionnelle
EchantillonnageEchantillonnage
L’estimateur stratifiéL’estimateur stratifié
 On nommeOn nomme xxijij la valeur mesurée sur lela valeur mesurée sur le
jj ième individu de la strateième individu de la strate ii
 On noteOn note xxi.i. la moyenne du sous-la moyenne du sous-
échantillon de la strateéchantillon de la strate ii
 On a le choix entre deux estimateursOn a le choix entre deux estimateurs
de la moyenne de la population :de la moyenne de la population :
1 1
1
..
ip n
ij
i j
x x
n = =
= å å .
1
p
i i
i
x w x
=
= å
EchantillonnageEchantillonnage
Comparaison. a) biaisComparaison. a) biais
 Le premier estimateur est biaisé, saufLe premier estimateur est biaisé, sauf
si l’allocation est proportionnellesi l’allocation est proportionnelle
 Le second est sans biais à partir duLe second est sans biais à partir du
moment où le poids des strates dansmoment où le poids des strates dans
la population est connu sans erreurla population est connu sans erreur
EchantillonnageEchantillonnage
Comparaison. b) variance,Comparaison. b) variance,
précisionprécision
 Le second estimateur est de varianceLe second estimateur est de variance
inférieure au premierinférieure au premier
( ) ( )
2 2
2 2
1 1 1
1
..
ip n p
ij i
i j i
Var x Var x n
nn n
s s
= = =
= = =å å å
( ) ( )
2
2 2
.
1 1
i i
p p
i
i
ii i
Var x w Var x w
n
s
= =
= =å å
EchantillonnageEchantillonnage
OptimisationOptimisation
On va optimiser l’allocationOn va optimiser l’allocation
sous une contrainte desous une contrainte de
coûtcoût
EchantillonnageEchantillonnage
Fonction de coûtFonction de coût
 Coût de prise en charge + coût deCoût de prise en charge + coût de
prélèvement des unités de chaqueprélèvement des unités de chaque
strate :strate :
C C n CT i i
i
m
= +
=
∑0
1
.
EchantillonnageEchantillonnage
Le problèmeLe problème
 Minimiser la varianceMinimiser la variance
de l’estimateurde l’estimateur
 Par rapport auxPar rapport aux nnii
 Sous la contrainteSous la contrainte
 Problème deProblème de
minimisation sousminimisation sous
contraintecontrainte
C C n CT i i
i
m
= +
=
∑0
1
.
( )
2
2
1
i
m
i
ii
Var x w
n
s
=
= å
EchantillonnageEchantillonnage
Technique du LagrangienTechnique du Lagrangien
 Ou du multiplicateur de LagrangeOu du multiplicateur de Lagrange
 Voir annexe 2Voir annexe 2
 On trouve :On trouve :
.
.
i i
i
i
w
n
C
σ
λ
=
2 2
1
0
. .
m
i i i
i
T
w C
C C
σ
λ =
=
−
∑
EchantillonnageEchantillonnage
Intervalle de confiance etIntervalle de confiance et
précisionprécision
 L’estimateur stratifié de la moyenneL’estimateur stratifié de la moyenne
est distribué comme unest distribué comme un tt àà n-mn-m
degrés de libertédegrés de liberté
 D’où l’intervalle de confiance :D’où l’intervalle de confiance :
 Et la précisionEt la précision
2 2
2 2
2 2
1 1
ˆ ˆ
,i i
m m
n m n mi i
i ii i
x t w x t w
n n
a a
s s
m - -
= =
é ù
ê ú- +Î ê ú
ê úë û
å å
EchantillonnageEchantillonnage
Application àApplication à LeptomastixLeptomastix
 La strate 1 représente 70% des hôtesLa strate 1 représente 70% des hôtes
dans la nature, la strate 2 30%dans la nature, la strate 2 30%
 Corriger l’estimation de la moyenneCorriger l’estimation de la moyenne
de la populationde la population
 Estimer son intervalle de confiance etEstimer son intervalle de confiance et
sa précisionsa précision
 L’allocation est-elle optimale ?L’allocation est-elle optimale ?
EchantillonnageEchantillonnage
Intérêt des stratesIntérêt des strates
 Comment juger de l’intérêt de laComment juger de l’intérêt de la
stratification ?stratification ?
 Par analyse de variancePar analyse de variance
 Une technique qui permet de comparer laUne technique qui permet de comparer la
variance inter-strate avec la variance intra-variance inter-strate avec la variance intra-
stratestrate
 Plus lePlus le FF est grand, plus la stratification estest grand, plus la stratification est
intéressanteintéressante
 A l’inverse, si F est non significatif, laA l’inverse, si F est non significatif, la
stratification est dépourvue d’intérêtstratification est dépourvue d’intérêt
EchantillonnageEchantillonnage
ExempleExemple
 Taille deTaille de LeptomastixLeptomastix
> attach(biassang)> attach(biassang)
> anova(lm(tail~strate),test="F")> anova(lm(tail~strate),test="F")
Analysis of Variance TableAnalysis of Variance Table
Response: tailResponse: tail
Df Sum Sq Mean Sq F value Pr(>F)Df Sum Sq Mean Sq F value Pr(>F)
strate 1 8.5617 8.5617 77.559 1.367e-11 ***strate 1 8.5617 8.5617 77.559 1.367e-11 ***
Residuals 48 5.2987 0.1104Residuals 48 5.2987 0.1104
------
Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` 'Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` '
11
EchantillonnageEchantillonnage
Contrôle graphiqueContrôle graphique
1 2
1.01.52.02.53.0
Effet des strates, taille de leptomastix
EchantillonnageEchantillonnage
4. L’échantillonnage en4. L’échantillonnage en
grappesgrappes
Ou échantillonnage duOu échantillonnage du
premier degrépremier degré
(échantillonnage par(échantillonnage par
degrés)degrés)
EchantillonnageEchantillonnage
DéfinitionDéfinition
 La population peut être subdivisé en unitésLa population peut être subdivisé en unités
primaires ou grappesprimaires ou grappes
 Chaque grappe contient un certain nombreChaque grappe contient un certain nombre
d’individus ou grainsd’individus ou grains
 Le tirage au hasard s’effectue en deuxLe tirage au hasard s’effectue en deux
phasesphases
 Choix deChoix de mm grappesgrappes
 Choix deChoix de nn grains par grappegrains par grappe
 Analogie : strates très nombreuses, on neAnalogie : strates très nombreuses, on ne
peut les sonder toutespeut les sonder toutes
EchantillonnageEchantillonnage
Image de la population etImage de la population et
du tiragedu tirage
µ,σ2
Ω
Grappe sondée
Grappe non sondée
Grain sondé
Grain non sondé
EchantillonnageEchantillonnage
Un schéma hiérarchiqueUn schéma hiérarchique
Ω
1 2 3
1 2 3 1 2 1 2 3
Population
Grappes
Grains
EchantillonnageEchantillonnage
 A est une variable aléatoire attachée à laA est une variable aléatoire attachée à la
grappe, d’espérance nulle et de variancegrappe, d’espérance nulle et de variance
(variance intergrappes)(variance intergrappes)
 εε est une variable aléatoire attachée àest une variable aléatoire attachée à
chaque grain, d’espérance nulle et dechaque grain, d’espérance nulle et de
variance (variance résiduelle ou intravariance (variance résiduelle ou intra
grappe)grappe)
 Par ailleurs, les Ai etPar ailleurs, les Ai et εεij sont indépendantsij sont indépendants
2.1. Modèle statistique2.1. Modèle statistique
ijiij
Ay ε++µ=
2
Aσ
2
Rσ
EchantillonnageEchantillonnage
2.2. Estimateurs2.2. Estimateurs
 On se limitera au cas simple où lesOn se limitera au cas simple où les
grappes sont d’effectifs égaux, et oùgrappes sont d’effectifs égaux, et où
on tire un nombre constant de grainson tire un nombre constant de grains
par grappe. Dans ces conditions lapar grappe. Dans ces conditions la
moyenne générale de l’échantillon :moyenne générale de l’échantillon :
 est un estimateur sans biais deest un estimateur sans biais de µµ
∑∑= =
=
m
1i
n
1j
ij.. y
m.n
1
y
EchantillonnageEchantillonnage
Démonstration :Démonstration :
 Il suffit d’appliquer le modèle :Il suffit d’appliquer le modèle :
..
1 1
1
( ) ( )
.
m n
ij
i j
E y E y
n m = =
= å å
1 1 1 1
0 0
1 1
( ) ( )
. .
m n m n
i ij
i j i j
E A E
n m n m
m e m
= = = =
= =
= + + =å å å å
1444444442 444444443 1444444442 444444443
1 1
1
( )
.
m n
i ij
i j
E A
n m
m e
= =
= + +å å
EchantillonnageEchantillonnage
Sa varianceSa variance
 Dépend à la fois de et de  Dépend à la fois de et de  
2
Aσ 2
Rσ
.. 2 2
1 1
1
( ) ( )
.
m n
ij
i j
Var y Var y
n m = =
æ ö÷ç ÷= ç ÷ç ÷÷çè ø
å å
2 2
1 1
1
.
m n
i ij
i j
Var A
n m
m e
= =
æ ö÷ç ÷= + +ç ÷ç ÷÷çè ø
å å
2
2 2 2 2
1 1 1
1 1
0 . ( )
. .
R
m m n
i ij
i i j
Var n A Var
n m n m
s
e
= = =
=
æ ö÷ç= + +÷ç ÷÷çè ø
å å å 14442 4443
2
2 2
1
1
..
m
R
i
i
Var n A
n mn m
s
=
æ ö÷ç= +÷ç ÷÷çè ø
å 2
2
2
1
1
( )
.
A
m
R
i
i
Var A
n mm
s
s
= =
= +å 14442 4443
EchantillonnageEchantillonnage
FinalementFinalement
 L’échantillonnage du premier degré est d’autantL’échantillonnage du premier degré est d’autant
moins précis que les grappes sont plus différentesmoins précis que les grappes sont plus différentes
les unes des autres. Sans considérations de coût,les unes des autres. Sans considérations de coût,
si le produit n.m est fixé, la précision est optimalesi le produit n.m est fixé, la précision est optimale
pour n=1 (un seul grain par grappe). On voit bienpour n=1 (un seul grain par grappe). On voit bien
les limites de cette stratégie : il est alorsles limites de cette stratégie : il est alors
impossible d’estimerimpossible d’estimer
( )2 2
..
1
( ) .
. A RVar y n
n m
s s= +
EchantillonnageEchantillonnage
Grappes et analyse deGrappes et analyse de
variancevariance
 Modèle d’analyse de variance aléatoireModèle d’analyse de variance aléatoire
 UnUn FF important signifie que les grappesimportant signifie que les grappes
sont très différentes entre elles,sont très différentes entre elles,
relativement homogènes au niveau intrarelativement homogènes au niveau intra
 Incite à faire porter l’effort sur les grappesIncite à faire porter l’effort sur les grappes
plutôt que sur les grainsplutôt que sur les grains
 Estimation des composantes de la varianceEstimation des composantes de la variance
EchantillonnageEchantillonnage
Analyse de varianceAnalyse de variance
SourceSource SCESCE dldl CMCM FF
TotalTotal nm-1nm-1 SCESCETT/(/(nmnm-1)-1)
Inter (B)Inter (B) m-1m-1 SCESCEBB/(/(m-m-1)1) CMCMBB/CM/CMWW
Intra (W)Intra (W) nm-mnm-m SCESCEWW/(/(nm-mnm-m))
( )
2
1 1
..
m n
ij
i j
y y
= =
−∑∑
( )
2
.
1
..
m
i
i
n y y
=
−∑
( )
2
.
1 1
m n
ij i
i j
y y
= =
−∑∑
EchantillonnageEchantillonnage
OptimisationOptimisation
EchantillonnageEchantillonnage
Le problème d’optimisationLe problème d’optimisation
 Minimiser la variance de la moyenneMinimiser la variance de la moyenne
 En déterminant à l’avance le coûtEn déterminant à l’avance le coût
total de l’opérationtotal de l’opération
 Combien de grappes ?Combien de grappes ?
 Combien de grains par grappe ?Combien de grains par grappe ?
 Il faut déterminerIl faut déterminer
 Le coût de prise en charge d’une grappeLe coût de prise en charge d’une grappe
 Le coût de prélèvement d’un grainLe coût de prélèvement d’un grain
EchantillonnageEchantillonnage
On forme le lagrangienOn forme le lagrangien
 Sous la fonction de coût :Sous la fonction de coût :
( ) ( ) ( )2 2
0 1 2
1
, , .
. A R TL n m n C C mc nmc
n m
l s s l= + + - - -
0 1 2TC C mc nmc= + +
EchantillonnageEchantillonnage
Dérivation par rapport àDérivation par rapport à nn
etet mm
( )
2
22
2 2
1 22 2
0
.
0
.
R
A R
L
mc
n n m
L
c nc
m m n m
s
l
s s
l
ì ¶ïï =- + =ï ¶ïïí
ï ¶ï =- - + - =ïï ¶ïî
2
2
2
2 .
R
m
c n
s
l
=
( )2 2
1
2
2
A R
R
n nc
n
c
s s
s
+
+ =
2
12
2
2
R
A
c
n
c
s
s
=
EchantillonnageEchantillonnage
Et finalement :Et finalement :
 Evidemment, on en déduitEvidemment, on en déduit mm à partirà partir
de la fonction de coûtde la fonction de coût
2
1
2
2
R
A
c
n
c
s
s
=
Grappe
chère
Grain cher
Grains
variables
Grappes
variables
+ de grains/grappe
+ de grappes
+ de grains/grappe
+ de grappes
EchantillonnageEchantillonnage
BilanBilan
 On ne fait pas un échantillonnage enOn ne fait pas un échantillonnage en
grappes pour gagner de la précisiongrappes pour gagner de la précision
 En général, au contraire, on en perd parEn général, au contraire, on en perd par
rapport à l’échantillonnage aléatoire simplerapport à l’échantillonnage aléatoire simple
 On l’adopte pour sa commodité et sonOn l’adopte pour sa commodité et son
faible coûtfaible coût
 N’oubliez pas de l’optimiser dès que vousN’oubliez pas de l’optimiser dès que vous
avez de l’information sur les deuxavez de l’information sur les deux
composantes de la variance !composantes de la variance !
EchantillonnageEchantillonnage
5. Autres plans5. Autres plans
d’échantillonnaged’échantillonnage
Echantillonnage par degrés,Echantillonnage par degrés,
échantillonnage en différentes occasions,échantillonnage en différentes occasions,
échantillonnage par régressionéchantillonnage par régression
EchantillonnageEchantillonnage
Echantillonnage par degrésEchantillonnage par degrés
 Généralisation de l’échantillonnage enGénéralisation de l’échantillonnage en
grappesgrappes
 Echantillonnage en grappe =Echantillonnage en grappe =
échantillonnage du premier degrééchantillonnage du premier degré
 Echantillonnage du second degré :Echantillonnage du second degré :
 On tire au hasard des unités primairesOn tire au hasard des unités primaires
 Dans chaque unité primaire on tire au hasardDans chaque unité primaire on tire au hasard
des unités secondairesdes unités secondaires
 Dans chaque unité secondaire des unitésDans chaque unité secondaire des unités
tertiaires (grains)tertiaires (grains)
 En anglais :En anglais : cluster samplingcluster sampling
EchantillonnageEchantillonnage
ExempleExemple
 Etude de la croissance des brochets au Canada :Etude de la croissance des brochets au Canada :
 Unités primaires = lacsUnités primaires = lacs
 Unités secondaires = barquesUnités secondaires = barques
 Unités tertiaires = brochets (grains)Unités tertiaires = brochets (grains)
 Analyse :Analyse :
 Analyse de variance hiérarchisée (nested)Analyse de variance hiérarchisée (nested)
 Estimation des composantes de la varianceEstimation des composantes de la variance
 Ici : trois composantesIci : trois composantes
 Entre lacsEntre lacs
 Entre barquesEntre barques
 Entre brochets (résiduelle)Entre brochets (résiduelle)
EchantillonnageEchantillonnage
Echantillonnage àEchantillonnage à
différentes occasionsdifférentes occasions
 On tire au hasard un certain nombreOn tire au hasard un certain nombre
d’individus dans une populationd’individus dans une population
 On les repèreOn les repère
 On mesure une caractéristique plusieursOn mesure une caractéristique plusieurs
fois (occasions)fois (occasions)
 Exemples : croissance sur des animaux ouExemples : croissance sur des animaux ou
plantes marquéesplantes marquées
 Analyse : « mesures répétées » (repeatedAnalyse : « mesures répétées » (repeated
measures)measures)
EchantillonnageEchantillonnage
Echantillonnage parEchantillonnage par
régressionrégression
 On mesure une caractéristique peuOn mesure une caractéristique peu
coûteusecoûteuse xx sur un très grand nombresur un très grand nombre NN
d’individusd’individus
 Sur un sous-échantillon aléatoire de tailleSur un sous-échantillon aléatoire de taille
nn, on mesure une autre caractéristique,, on mesure une autre caractéristique,
très coûteuse,très coûteuse, yy
 Ce sous échantillon permet d’estimer leCe sous échantillon permet d’estimer le
coefficient de corrélation entre les deuxcoefficient de corrélation entre les deux
caractéristiquescaractéristiques
 L’estimation précise de la moyenne deL’estimation précise de la moyenne de xx
permet alors de corriger la moyenne depermet alors de corriger la moyenne de yy
EchantillonnageEchantillonnage
ExempleExemple
 ChezChez Leptomastix dactylopiiLeptomastix dactylopii onon
mesure :mesure :
 La taille sur 1000 individusLa taille sur 1000 individus
 La taille et la fécondité sur 50 d’entreLa taille et la fécondité sur 50 d’entre
euxeux
EchantillonnageEchantillonnage
ExempleExemple
> mean(tail)> mean(tail) # Echantillon de 50# Echantillon de 50
[1] 1.7818[1] 1.7818
> mean(tail2)> mean(tail2) # Echantillon de 1000# Echantillon de 1000
[1] 1.971004[1] 1.971004
> lm(fec~tail)->m1 # Régression fécondité / taille> lm(fec~tail)->m1 # Régression fécondité / taille
> m1> m1
Call:Call:
lm(formula = fec ~ tail)lm(formula = fec ~ tail)
Coefficients:Coefficients:
(Intercept) tail(Intercept) tail
22.41 34.3322.41 34.33
> mean(fec)> mean(fec) # Echantillon de 50# Echantillon de 50
[1] 83.58[1] 83.58
> mean(tail2)-mean(tail)->bt> mean(tail2)-mean(tail)->bt # Biais sur la taille# Biais sur la taille
> bt*m1$coeff[2]+mean(fec)> bt*m1$coeff[2]+mean(fec) # Correction du biais# Correction du biais
féconditéfécondité
[1] 90.07582[1] 90.07582
>>
EchantillonnageEchantillonnage
Variance de l’estimateurVariance de l’estimateur
par régressionpar régression
 On le donne ci dessous sansOn le donne ci dessous sans
démonstration :démonstration :
2
2
(1 )
y
n
s
r-
Variance
habituelle
Coefficient de
corrélation
entre x et y
EchantillonnageEchantillonnage
Suite de l’exempleSuite de l’exemple
> # Variance de la moyenne fécondité> # Variance de la moyenne fécondité
> var(fec)/50> var(fec)/50
[1] 7.28089[1] 7.28089
> #correction par la corrélation avec la taille> #correction par la corrélation avec la taille
> cor(tail,fec)> cor(tail,fec)
[1] 0.9570068[1] 0.9570068
> (1-cor(tail,fec))*var(fec)/50> (1-cor(tail,fec))*var(fec)/50
[1] 0.3130290[1] 0.3130290
> v<-(1-cor(tail,fec))*var(fec)/50> v<-(1-cor(tail,fec))*var(fec)/50
> # Erreur standard> # Erreur standard
> sqrt(v)> sqrt(v)
[1] 0.5594899[1] 0.5594899
> # précision> # précision
> sqrt(v)*1.96> sqrt(v)*1.96
[1] 1.096600[1] 1.096600
> #précision relative> #précision relative
> sqrt(v)*1.96/mean(fec)*100> sqrt(v)*1.96/mean(fec)*100
[1] 1.312037[1] 1.312037 # 1.31% grace à la mesure des 1000 tailles# 1.31% grace à la mesure des 1000 tailles
>>
EchantillonnageEchantillonnage
ConclusionsConclusions
En forme de conseilsEn forme de conseils
EchantillonnageEchantillonnage
ConclusionsConclusions
 Connaître les plans types est fondamentalConnaître les plans types est fondamental
 Il est essentiel de savoir définirIl est essentiel de savoir définir
 Ses objectifs (précision, erreur de décision)Ses objectifs (précision, erreur de décision)
 Ses moyensSes moyens
 L’optimisation permet de gagner du tempsL’optimisation permet de gagner du temps
et de l’argentet de l’argent
 FaitesFaites simplesimple et si possibleet si possible standardstandard
 Evitez les plans « astucieux » qu’on ne sait pasEvitez les plans « astucieux » qu’on ne sait pas
traiter ou qui se révèlent coûteuxtraiter ou qui se révèlent coûteux

Contenu connexe

Tendances

Schema etude-de-projet
Schema etude-de-projetSchema etude-de-projet
Schema etude-de-projet
Fatima Abboud
 
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
HAFID Ait Bihi
 
Projet de création d'entreprise: exemple
Projet de création d'entreprise: exempleProjet de création d'entreprise: exemple
Projet de création d'entreprise: exemple
YassineHammoucha
 
Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...
Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...
Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...
Eve-Anaelle Blandin
 
Management des risque etude de cas 1 - MOSAR/MADS
Management des risque   etude de cas 1 - MOSAR/MADSManagement des risque   etude de cas 1 - MOSAR/MADS
Management des risque etude de cas 1 - MOSAR/MADS
ibtissam el hassani
 
La Gestion des carrières et performances des petites et moyennes entreprises ...
La Gestion des carrières et performances des petites et moyennes entreprises ...La Gestion des carrières et performances des petites et moyennes entreprises ...
La Gestion des carrières et performances des petites et moyennes entreprises ...
Patrice Piardon
 
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-marocantilaman
 
5.2 Régression linéaire
5.2 Régression linéaire5.2 Régression linéaire
5.2 Régression linéaire
Boris Guarisma
 
projet-d-irrigation
projet-d-irrigationprojet-d-irrigation
projet-d-irrigation
Mohamed Rmaali
 
Rapport pfe v1
Rapport pfe v1Rapport pfe v1
Rapport pfe v1
Mina Riyahi
 
Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
Adad Med Chérif
 
Outils et techniques des gestion des risques
Outils et techniques des gestion des risquesOutils et techniques des gestion des risques
Outils et techniques des gestion des risques
GBO
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
Mohamed Amine Sansar
 
21.la gestion de la production
21.la gestion de la production21.la gestion de la production
21.la gestion de la productionOULAAJEB YOUSSEF
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
André Michel Bimbai
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigéshadhoum
 
Analyse stratégique Cosumar
Analyse stratégique CosumarAnalyse stratégique Cosumar
Analyse stratégique Cosumar
Lamiae Kabbaj
 
Rapport de Stage perfectionnement
Rapport de Stage perfectionnementRapport de Stage perfectionnement
Rapport de Stage perfectionnement
Gharbi Soumaya
 
Gestion de carrière
Gestion de carrièreGestion de carrière
Gestion de carrière
Imane SBAI
 
PRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentaire
PRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentairePRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentaire
PRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentaire
jounayd
 

Tendances (20)

Schema etude-de-projet
Schema etude-de-projetSchema etude-de-projet
Schema etude-de-projet
 
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
Projet de fin d'études licence Pro TCF Université Ibn Zohr Agadir {Gestion de...
 
Projet de création d'entreprise: exemple
Projet de création d'entreprise: exempleProjet de création d'entreprise: exemple
Projet de création d'entreprise: exemple
 
Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...
Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...
Mémoire fin d'études EABLANDIN "Enquête qualitative sur la réception online d...
 
Management des risque etude de cas 1 - MOSAR/MADS
Management des risque   etude de cas 1 - MOSAR/MADSManagement des risque   etude de cas 1 - MOSAR/MADS
Management des risque etude de cas 1 - MOSAR/MADS
 
La Gestion des carrières et performances des petites et moyennes entreprises ...
La Gestion des carrières et performances des petites et moyennes entreprises ...La Gestion des carrières et performances des petites et moyennes entreprises ...
La Gestion des carrières et performances des petites et moyennes entreprises ...
 
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
21252637 optimisation-du-systeme-d’approvisionnement-de-la-fromagerie-bel-maroc
 
5.2 Régression linéaire
5.2 Régression linéaire5.2 Régression linéaire
5.2 Régression linéaire
 
projet-d-irrigation
projet-d-irrigationprojet-d-irrigation
projet-d-irrigation
 
Rapport pfe v1
Rapport pfe v1Rapport pfe v1
Rapport pfe v1
 
Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Outils et techniques des gestion des risques
Outils et techniques des gestion des risquesOutils et techniques des gestion des risques
Outils et techniques des gestion des risques
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
 
21.la gestion de la production
21.la gestion de la production21.la gestion de la production
21.la gestion de la production
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Analyse stratégique Cosumar
Analyse stratégique CosumarAnalyse stratégique Cosumar
Analyse stratégique Cosumar
 
Rapport de Stage perfectionnement
Rapport de Stage perfectionnementRapport de Stage perfectionnement
Rapport de Stage perfectionnement
 
Gestion de carrière
Gestion de carrièreGestion de carrière
Gestion de carrière
 
PRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentaire
PRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentairePRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentaire
PRESENTATION DE L’ANALYSE SWOT Agriculture et Agro-alimentaire
 

Similaire à Echantillonnage

02_Echantillonnage.pdf
02_Echantillonnage.pdf02_Echantillonnage.pdf
02_Echantillonnage.pdf
SmartTv74
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
Jean-Michel POU
 
Echantillon
EchantillonEchantillon
Echantillon
Kaiogan
 
Echantillonnage.pptx
Echantillonnage.pptxEchantillonnage.pptx
Echantillonnage.pptx
amoussaroukiyath
 
Cours masterlyon
Cours masterlyonCours masterlyon
Cours masterlyon
Olivier Coulibaly
 

Similaire à Echantillonnage (6)

02_Echantillonnage.pdf
02_Echantillonnage.pdf02_Echantillonnage.pdf
02_Echantillonnage.pdf
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
Echantillon
EchantillonEchantillon
Echantillon
 
Echantillonnage.pptx
Echantillonnage.pptxEchantillonnage.pptx
Echantillonnage.pptx
 
Cours masterlyon
Cours masterlyonCours masterlyon
Cours masterlyon
 

Echantillonnage

  • 2. EchantillonnageEchantillonnage PlanPlan  1. Introduction1. Introduction  2. L’échantillonnage aléatoire2. L’échantillonnage aléatoire  SimpleSimple  Séquentiel en deux étapesSéquentiel en deux étapes  3. L’échantillonnage stratifié3. L’échantillonnage stratifié  Mise en œuvre et analyseMise en œuvre et analyse  OptimisationOptimisation  4. L’échantillonnage en grappes4. L’échantillonnage en grappes  Mise en œuvre et analyseMise en œuvre et analyse  OptimisationOptimisation
  • 3. EchantillonnageEchantillonnage IntroductionIntroduction « Pas de modèle sans échantillon, pas d’échantillon sans modèle »« Pas de modèle sans échantillon, pas d’échantillon sans modèle » Un professionnel du prêt-à-porterUn professionnel du prêt-à-porter « Les tissus, disponibles en quantité limitée, ne peuvent être ni repris ni« Les tissus, disponibles en quantité limitée, ne peuvent être ni repris ni échangés.échangés. Par contre vous pouvez obtenir un échantillon de chacun des tissus pourPar contre vous pouvez obtenir un échantillon de chacun des tissus pour un prix modique. »un prix modique. » La boutique A&A, http://www.a-et-a.com/La boutique A&A, http://www.a-et-a.com/
  • 4. EchantillonnageEchantillonnage Le dictionnaire RobertLe dictionnaire Robert  1. Vx Étalon de mesure. (1636) Mod. Type réglementaire de certains matériaux1. Vx Étalon de mesure. (1636) Mod. Type réglementaire de certains matériaux de construction.de construction. Bois d'échantillon. Brique, pavé d'échantillon.Bois d'échantillon. Brique, pavé d'échantillon. — Mar.— Mar. BâtimentBâtiment de fort, de petit, de faible échantillon,de fort, de petit, de faible échantillon, suivant la largeur et l'épaisseur des piècessuivant la largeur et l'épaisseur des pièces de construction.de construction.  2. (1407) Cour. Petite quantité d'une marchandise qu'on montre pour donner une2. (1407) Cour. Petite quantité d'une marchandise qu'on montre pour donner une idée de l'ensemble.idée de l'ensemble. Les échantillons d'une gamme de produits. Échantillons deLes échantillons d'une gamme de produits. Échantillons de vin, de café. Un cahier d'échantillonsvin, de café. Un cahier d'échantillons (d'étoffe).(d'étoffe). Une palette d'échantillonsUne palette d'échantillons (de(de peinture).peinture). Boîte, jeux d'échantillons à usage commercial.Boîte, jeux d'échantillons à usage commercial. Þ Þ collectioncollection,, présentoirprésentoir.. « Il étale ses échantillons, lentement, devant le client »« Il étale ses échantillons, lentement, devant le client » ((MauroisMaurois)). « Quel danger,. « Quel danger, quelle folie de choisir sur des échantillons »quelle folie de choisir sur des échantillons » ((SarrauteSarraute))..  Spécimen remarquable d'une espèce, d'un genre. Þ Spécimen remarquable d'une espèce, d'un genre. Þ  représentantreprésentant .. « Une« Une très jolie servante, charmant échantillon de la beauté des femmes detrès jolie servante, charmant échantillon de la beauté des femmes de Malaga »Malaga » ((GautierGautier))..  Fig. Aperçu.Fig. Aperçu. « Je voulus lui donner un échantillon de mon talent »« Je voulus lui donner un échantillon de mon talent » ((RousseauRousseau)).. Þ Þ exempleexemple..  3. Spécialt (Statist.) Fraction d'une population destinée à être étudiée par3. Spécialt (Statist.) Fraction d'une population destinée à être étudiée par sondage.sondage. panelpanel..  4. Inform. Élément d'une suite discrète résultant de l'échantillonnage d'une4. Inform. Élément d'une suite discrète résultant de l'échantillonnage d'une grandeur analogique.grandeur analogique.
  • 5. EchantillonnageEchantillonnage Pourquoi échantillonner ?Pourquoi échantillonner ?  Impossibilité d’accéderImpossibilité d’accéder  À tous les individus d’une populationÀ tous les individus d’une population  À la totalité d’une aireÀ la totalité d’une aire  => On procède donc par inférence=> On procède donc par inférence  EchantillonnageEchantillonnage  SondageSondage
  • 6. EchantillonnageEchantillonnage Deux grandes stratégiesDeux grandes stratégies  AléatoireAléatoire  SimpleSimple  StratifiéStratifié  En grappe ou par degrésEn grappe ou par degrés  SystématiqueSystématique  Transects et grillesTransects et grilles  Décimation/quantisationDécimation/quantisation  Échantillonnage temporelÉchantillonnage temporel
  • 7. EchantillonnageEchantillonnage Limites du coursLimites du cours  On se limitera à l’échantillonnageOn se limitera à l’échantillonnage aléatoirealéatoire  Les problèmes de l’échantillonnageLes problèmes de l’échantillonnage systématique seront abordés danssystématique seront abordés dans d’autes UE à propos ded’autes UE à propos de  La statistique spatialeLa statistique spatiale  L’analyse des séries chronologiquesL’analyse des séries chronologiques
  • 9. EchantillonnageEchantillonnage Echantillonnage aléatoireEchantillonnage aléatoire simplesimple  DéfinitionDéfinition  Les individus de la population sont tousLes individus de la population sont tous équivalentséquivalents  Le nombre d’individus à échantillonner estLe nombre d’individus à échantillonner est déterminé à l’avancedéterminé à l’avance  Chaque individu de la population a la mêmeChaque individu de la population a la même probabilitéprobabilité a prioria priori d’être choisid’être choisi  Le choix d’un individu ne favorise ni neLe choix d’un individu ne favorise ni ne défavorise le choix ultérieur d’aucun autredéfavorise le choix ultérieur d’aucun autre individu de la population (tirages indépendants)individu de la population (tirages indépendants)
  • 10. EchantillonnageEchantillonnage Les individus ou unitésLes individus ou unités d’échantillonnaged’échantillonnage  NaturelsNaturels  Animaux, plantes individualiséesAnimaux, plantes individualisées  ArbitrairesArbitraires  Unités de surface, de volume, de poidsUnités de surface, de volume, de poids  0.25 m0.25 m22 de prairiede prairie  1dm1dm33 d’eau dans un étangd’eau dans un étang  1k de sol1k de sol  Attention alors !Attention alors !  Population biologiquePopulation biologique  Population statistiquePopulation statistique
  • 11. EchantillonnageEchantillonnage Deux mode de tirageDeux mode de tirage  Avec remiseAvec remise  Ou non exhaustifOu non exhaustif  La probabilité de sélection resteLa probabilité de sélection reste constante au cours de l’échantillonnageconstante au cours de l’échantillonnage  Sans remiseSans remise  Ou exhaustifOu exhaustif  La probabilité de sélection s’accroît auLa probabilité de sélection s’accroît au cours de l’échantillonnagecours de l’échantillonnage
  • 12. EchantillonnageEchantillonnage Une approximationUne approximation  Dans les très grandes populations, onDans les très grandes populations, on considère souvent l’échantillonnageconsidère souvent l’échantillonnage comme avec remise, même lorsqu’ilcomme avec remise, même lorsqu’il n’y a pas remisen’y a pas remise  Dans les populations plus petites, il yDans les populations plus petites, il y aura lieu de prendre en compte leaura lieu de prendre en compte le taux de sondagetaux de sondage f = n/Nf = n/N
  • 13. EchantillonnageEchantillonnage Le modèle statistiqueLe modèle statistique µ ^ E σ2 σ2 Ω x-
  • 14. EchantillonnageEchantillonnage Les paramètres deLes paramètres de l’échantillonl’échantillon  Moyenne deMoyenne de l’échantillon :l’échantillon :  Variance deVariance de l’échantillon :l’échantillon : x n xi i n = = ∑ 1 1 s n x xi i n 2 1 21 = − = ∑( )
  • 15. EchantillonnageEchantillonnage Paramètres et estimateursParamètres et estimateurs  La moyenne est unLa moyenne est un estimateur sansestimateur sans biaisbiais de la moyenne de la populationde la moyenne de la population  La variance sLa variance s22 est un estimateurest un estimateur biaisébiaisé par défautpar défaut (mais(mais asymptotiquementasymptotiquement sans biais) de la variance de lasans biais) de la variance de la populationpopulation ( )E x µ= ( )2 2 E s σ<
  • 17. EchantillonnageEchantillonnage Le biaisLe biais 0 5000 10000 15000 20000 25000 4.04.55.0 n s Comparaison des deux estimateurs sur un même échantillon
  • 18. EchantillonnageEchantillonnage Le biaisLe biais 0 20 40 60 80 100 510152025 scale lvar
  • 19. EchantillonnageEchantillonnage La précisionLa précision d’échantillonnaged’échantillonnage Quelle connaissanceQuelle connaissance avons nous de la moyenneavons nous de la moyenne de la population ?de la population ?
  • 20. EchantillonnageEchantillonnage Les mesures de précisionLes mesures de précision  La varianceLa variance  Incommode (exprimée dans le carré des unités)Incommode (exprimée dans le carré des unités)  L’erreur standardL’erreur standard  Utilisée par les anglo-saxonsUtilisée par les anglo-saxons  Le coefficient de variationLe coefficient de variation  Utilisé par les agronomesUtilisé par les agronomes  Le ½ intervalle de confianceLe ½ intervalle de confiance  C’est un véritable encadrementC’est un véritable encadrement
  • 21. EchantillonnageEchantillonnage La précision estLa précision est  Proportionnelle à l’écart-type de laProportionnelle à l’écart-type de la moyenne (en général de l’estimateur) oumoyenne (en général de l’estimateur) ou erreur standard sur la moyenneerreur standard sur la moyenne  Comment la calcule-t-on ?Comment la calcule-t-on ?  Population infiniePopulation infinie  Ou tirage avec remiseOu tirage avec remise  Population finiePopulation finie  Et tirage sans remiseEt tirage sans remise m n σ σ = ( )1m f n σ σ = −
  • 22. EchantillonnageEchantillonnage estimateursestimateurs  Population infiniePopulation infinie  Ou tirage nonOu tirage non exhaustifexhaustif  Population finiePopulation finie  Et tirage exhaustifEt tirage exhaustif ˆ ˆm n σ σ = ( ) ˆ ˆ 1m f n σ σ = −
  • 23. EchantillonnageEchantillonnage Le demi intervalle deLe demi intervalle de confianceconfiance  On sait « encadrer » la moyenneOn sait « encadrer » la moyenne avec une probabilité d’erreur définieavec une probabilité d’erreur définie par l’intervalle de confiance (voirpar l’intervalle de confiance (voir annexe)annexe)  Ou, siOu, si nn < 30< 30 2 2 ˆ ˆ ,cI x z x z n n a a s sé ù = - +ê ú ê úë û 1 2 2 1 ˆ ˆ , n n cI x t x t n na a s s - - é ù ê ú= - + ê úë û
  • 24. EchantillonnageEchantillonnage Précision absolue etPrécision absolue et relativerelative  La quantité :La quantité :  Ou, pour n>30Ou, pour n>30  Sera utilisée comme « précision absolue »Sera utilisée comme « précision absolue » La quantitéLa quantité  Sera nommée : « précision relativeSera nommée : « précision relative 2 1 ˆn d t na s- = 2 ˆ d z n a s = rel d d x =
  • 25. EchantillonnageEchantillonnage Un exempleUn exemple La taille du parasitoïdeLa taille du parasitoïde leptomastix dactylopiileptomastix dactylopii
  • 27. EchantillonnageEchantillonnage L’échantillonL’échantillon  On a prélevé au hasard 50 individusOn a prélevé au hasard 50 individus femelles à partir de cochenilles du maniocfemelles à partir de cochenilles du manioc provenant d’un champ du congo (donnéesprovenant d’un champ du congo (données André Biassangama)André Biassangama) > print(biassang)> print(biassang) numer tail long fec stratenumer tail long fec strate 1 1 0.63 29 52 11 1 0.63 29 52 1 2 2 0.75 25 56 12 2 0.75 25 56 1 3 12 0.85 31 57 13 12 0.85 31 57 1 …………………………………………………………………………………………………………………………………………………… 48 29 2.72 39 115 248 29 2.72 39 115 2 49 32 2.84 39 119 249 32 2.84 39 119 2 50 31 2.92 37 121 250 31 2.92 37 121 2
  • 28. EchantillonnageEchantillonnage Exemple : taille deExemple : taille de leptomastixleptomastix > attach(biassang)> attach(biassang) # définition du jeu de données# définition du jeu de données > sd<-sqrt(var(tail)/n)> sd<-sqrt(var(tail)/n) # calcul de l’erreur standard# calcul de l’erreur standard > qnorm(1-0.025)> qnorm(1-0.025) # calcul de z (alpha/2)# calcul de z (alpha/2) [1] 1.959964[1] 1.959964 > d<-sd*qnorm(1-0.025)> d<-sd*qnorm(1-0.025) # précision absolue# précision absolue > d> d [1] 0.1474185[1] 0.1474185 > mean(tail)> mean(tail) # taille moyenne (mm)# taille moyenne (mm) [1] 1.7818[1] 1.7818 > mean(tail)-d> mean(tail)-d # borne inférieure# borne inférieure [1] 1.634382[1] 1.634382 > mean(tail)+d> mean(tail)+d # borne supérieure# borne supérieure [1] 1.929218[1] 1.929218
  • 29. EchantillonnageEchantillonnage Encadrement de laEncadrement de la moyenne :moyenne :  La taille moyenne de la population dLa taille moyenne de la population d de la population des femelles dude la population des femelles du parasitoïdeparasitoïde Leptomastix dactylopiiLeptomastix dactylopii estest estimée à 1.78 mmestimée à 1.78 mm  On peut affirmer – avec 5% desOn peut affirmer – avec 5% des chances de se tromper – qu’elle estchances de se tromper – qu’elle est comprise entre 1.63 et 1.93 mmcomprise entre 1.63 et 1.93 mm
  • 30. EchantillonnageEchantillonnage La précision absolue etLa précision absolue et relativerelative  La moyenne est connue à plus ouLa moyenne est connue à plus ou moins 0.15 mm prèsmoins 0.15 mm près  C’est à dire à 8.3% prèsC’est à dire à 8.3% près > d/(mean(tail))*100> d/(mean(tail))*100 [1] 8.273571[1] 8.273571
  • 31. EchantillonnageEchantillonnage Contrôler la précisionContrôler la précision d’échantillonnaged’échantillonnage La base du travail pratiqueLa base du travail pratique
  • 32. EchantillonnageEchantillonnage Comment évolue laComment évolue la précision ?précision ? 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 0 50 100 150 200 250 300 350 400 Effectif de l'échantillon (n) Précision relative 0.1 0.2 0.5 1
  • 33. EchantillonnageEchantillonnage Le gain marginal deLe gain marginal de précisionprécision  La dérivée de la précision relative donne le gain marginalLa dérivée de la précision relative donne le gain marginal par unité supplémentaire d’échantillonnage.par unité supplémentaire d’échantillonnage. Gain marginal de précision -5 -4 -3 -2 -1 0 1 2 4 6 8 10 12 14 16 18 20 Série1 Série2 Série3 Série4
  • 34. EchantillonnageEchantillonnage Calculer l’effectifCalculer l’effectif nécessairenécessaire  1. Définir l’objectif à atteindre1. Définir l’objectif à atteindre  Le risqueLe risque αα accepté (le plus souvent 0.05)accepté (le plus souvent 0.05)  La précision absolue ou relative désiréeLa précision absolue ou relative désirée  2. Déterminer la variance de la population2. Déterminer la variance de la population  On a souvent besoin d’un pré-échantillonnageOn a souvent besoin d’un pré-échantillonnage  3. Déterminer3. Déterminer nn
  • 35. EchantillonnageEchantillonnage Un paradoxe !Un paradoxe ! « Pour faire un bon échantillonnage« Pour faire un bon échantillonnage faites en d’abord un mauvais »faites en d’abord un mauvais » (J.S. Pierre, pensées)(J.S. Pierre, pensées)
  • 36. EchantillonnageEchantillonnage La détermination deLa détermination de nn  De la définition de la précisionDe la définition de la précision  On déduit :On déduit : 2 ˆ d z n a s £ 2 2 2 2 ˆ n z d a s ³
  • 37. EchantillonnageEchantillonnage Et si on parlait argent ?Et si on parlait argent ?  On définit :On définit :  L’effort d’échantillonnage : c’estL’effort d’échantillonnage : c’est nn  Le coût de prise en charge de l’échantillonnageLe coût de prise en charge de l’échantillonnage CCoo  Fabrication des cadres, pièges, coûtFabrication des cadres, pièges, coût du trajet, affrètement d’un bateau,du trajet, affrètement d’un bateau, etc…etc…  Le coût unitaire de prélèvement d’un individuLe coût unitaire de prélèvement d’un individu cc  Mesuré en temps de travail, enMesuré en temps de travail, en euros, en litres de fuel (chalutier)euros, en litres de fuel (chalutier) etc…etc…  Le coût total de l’échantillonnage :Le coût total de l’échantillonnage : 0TC C nc= +
  • 38. EchantillonnageEchantillonnage OptimisationOptimisation  Stratégies de type « minimax »Stratégies de type « minimax »  Maximiser l’information (minimiser laMaximiser l’information (minimiser la précision)précision)  En minimisant, ou au moins enEn minimisant, ou au moins en maîtrisant les coûtsmaîtrisant les coûts  Pas de solution universellePas de solution universelle
  • 39. EchantillonnageEchantillonnage ExempleExemple  La taille moyenne de la population deLa taille moyenne de la population de LeptomastixLeptomastix est connue à 8.3% prèsest connue à 8.3% près avec un échantillon de 50 femellesavec un échantillon de 50 femelles  Quel échantillon est nécessaire pourQuel échantillon est nécessaire pour atteindre une précision de 5% suratteindre une précision de 5% sur cette moyenne ?cette moyenne ?
  • 40. EchantillonnageEchantillonnage SolutionSolution  Ecrivons la formule de la précisionEcrivons la formule de la précision relativerelative  On cherche à résoudre l’inégalité :On cherche à résoudre l’inégalité :  Donc :Donc : 2 r z d x n a s = 2 0.05 0.05r z d x n a s £ Þ £ 2 2 2 2 2 2 2 20.0025 0.0025 z z n x n x a as s £ Þ ³
  • 41. EchantillonnageEchantillonnage Numériquement :Numériquement :  On prendraOn prendra n=n=137137  CommenterCommenter 2 2 2 2 2 2 ˆ 0.0025 1.96 ˆ 0.2829 1.71818 136.908 z n x z x n a a s s ³ = = = ³
  • 42. EchantillonnageEchantillonnage L’échantillonnageL’échantillonnage séquentiel en deux étapesséquentiel en deux étapes Doit-on refaire unDoit-on refaire un échantillon de 137échantillon de 137 individus ?individus ?
  • 43. EchantillonnageEchantillonnage Non !Non !  Il est licite de compléter l’échantillonIl est licite de compléter l’échantillon de 50 individus à 137de 50 individus à 137  C’est à dire d’aller prélever auxC’est à dire d’aller prélever aux hasard 137 - 50 = 87 nouveauxhasard 137 - 50 = 87 nouveaux individusindividus  Cette procédure s’appelle :Cette procédure s’appelle : « échantillonnage séquentiel en deux« échantillonnage séquentiel en deux étapes »étapes »
  • 44. EchantillonnageEchantillonnage OuvertureOuverture  Un échantillonnage est ditUn échantillonnage est dit séquentielséquentiel s’il ests’il est conduit parconduit par étapesétapes jusqu’à un critère d’arrêt.jusqu’à un critère d’arrêt.  L’échantillon est alors ditL’échantillon est alors dit informatifinformatif il renseigne auil renseigne au fur et à mesure sur la précision atteinte ou surfur et à mesure sur la précision atteinte ou sur d’autres critères d’arrêtd’autres critères d’arrêt  Deux types principaux :Deux types principaux :  Echantillonnage séquentiel à précision fixéeEchantillonnage séquentiel à précision fixée  Echantillonnage décisionnelEchantillonnage décisionnel  Voir par exemple le livre de Frontier : stratégiesVoir par exemple le livre de Frontier : stratégies d’échantillonnage en écologied’échantillonnage en écologie
  • 46. EchantillonnageEchantillonnage Que faire si la variance desQue faire si la variance des individus est élevée ?individus est élevée ?  L’obtention d’une bonne précision estL’obtention d’une bonne précision est alors extrêmement coûteusealors extrêmement coûteuse  Mais la population est peut-être trèsMais la population est peut-être très hétérogène ?hétérogène ?  On peut alors la diviser enOn peut alors la diviser en soussous populationspopulations plus homogènesplus homogènes  On gagne alors beaucoup deOn gagne alors beaucoup de précisionprécision
  • 47. EchantillonnageEchantillonnage Mise en oeuvreMise en oeuvre Le modèle statistiqueLe modèle statistique changechange
  • 48. EchantillonnageEchantillonnage Une nouvelle vision de laUne nouvelle vision de la populationpopulation  Et des paramètresEt des paramètres µ,σ2 Ω S1 S2 S3 µ1,σ2 1 µ2,σ2 2 µ3,σ2 3
  • 49. EchantillonnageEchantillonnage Définition des stratesDéfinition des strates  Les strates forment uneLes strates forment une partitionpartition dede la populationla population  C’est à dire que leurs intersectionsC’est à dire que leurs intersections sont deux à deux vides (elles sontsont deux à deux vides (elles sont disjointes)disjointes)  Leur réunion est la population totaleLeur réunion est la population totale
  • 50. EchantillonnageEchantillonnage Hypothèse :Hypothèse :  Les variances « intra » sontLes variances « intra » sont inférieures à la variance totaleinférieures à la variance totale 2 2 1 2 2 2 2 2 3 s s s s s s < < <
  • 51. EchantillonnageEchantillonnage Les poids des stratesLes poids des strates  A chaque strate est affectée unA chaque strate est affectée un poids : la proportion de la populationpoids : la proportion de la population totale qu’elle représentetotale qu’elle représente  ww11,,ww22,,ww33, en général, en général wwii 1 1 i i p i i N w N w = = =å
  • 52. EchantillonnageEchantillonnage L’échantillon stratifiéL’échantillon stratifié  On tire un échantillon aléatoire simple deOn tire un échantillon aléatoire simple de tailletaille nnii dans la stratedans la strate ii..  L’échantillon complet est de tailleL’échantillon complet est de taille nn  On appelleOn appelle allocationallocation le poids de la stratele poids de la strate ii dans l’échantillondans l’échantillon  Si le poids de la strate dans l’échantillonSi le poids de la strate dans l’échantillon est égal au poids de la strate dans laest égal au poids de la strate dans la population on dit que l’allocation estpopulation on dit que l’allocation est proportionnelleproportionnelle
  • 53. EchantillonnageEchantillonnage L’estimateur stratifiéL’estimateur stratifié  On nommeOn nomme xxijij la valeur mesurée sur lela valeur mesurée sur le jj ième individu de la strateième individu de la strate ii  On noteOn note xxi.i. la moyenne du sous-la moyenne du sous- échantillon de la strateéchantillon de la strate ii  On a le choix entre deux estimateursOn a le choix entre deux estimateurs de la moyenne de la population :de la moyenne de la population : 1 1 1 .. ip n ij i j x x n = = = å å . 1 p i i i x w x = = å
  • 54. EchantillonnageEchantillonnage Comparaison. a) biaisComparaison. a) biais  Le premier estimateur est biaisé, saufLe premier estimateur est biaisé, sauf si l’allocation est proportionnellesi l’allocation est proportionnelle  Le second est sans biais à partir duLe second est sans biais à partir du moment où le poids des strates dansmoment où le poids des strates dans la population est connu sans erreurla population est connu sans erreur
  • 55. EchantillonnageEchantillonnage Comparaison. b) variance,Comparaison. b) variance, précisionprécision  Le second estimateur est de varianceLe second estimateur est de variance inférieure au premierinférieure au premier ( ) ( ) 2 2 2 2 1 1 1 1 .. ip n p ij i i j i Var x Var x n nn n s s = = = = = =å å å ( ) ( ) 2 2 2 . 1 1 i i p p i i ii i Var x w Var x w n s = = = =å å
  • 56. EchantillonnageEchantillonnage OptimisationOptimisation On va optimiser l’allocationOn va optimiser l’allocation sous une contrainte desous une contrainte de coûtcoût
  • 57. EchantillonnageEchantillonnage Fonction de coûtFonction de coût  Coût de prise en charge + coût deCoût de prise en charge + coût de prélèvement des unités de chaqueprélèvement des unités de chaque strate :strate : C C n CT i i i m = + = ∑0 1 .
  • 58. EchantillonnageEchantillonnage Le problèmeLe problème  Minimiser la varianceMinimiser la variance de l’estimateurde l’estimateur  Par rapport auxPar rapport aux nnii  Sous la contrainteSous la contrainte  Problème deProblème de minimisation sousminimisation sous contraintecontrainte C C n CT i i i m = + = ∑0 1 . ( ) 2 2 1 i m i ii Var x w n s = = å
  • 59. EchantillonnageEchantillonnage Technique du LagrangienTechnique du Lagrangien  Ou du multiplicateur de LagrangeOu du multiplicateur de Lagrange  Voir annexe 2Voir annexe 2  On trouve :On trouve : . . i i i i w n C σ λ = 2 2 1 0 . . m i i i i T w C C C σ λ = = − ∑
  • 60. EchantillonnageEchantillonnage Intervalle de confiance etIntervalle de confiance et précisionprécision  L’estimateur stratifié de la moyenneL’estimateur stratifié de la moyenne est distribué comme unest distribué comme un tt àà n-mn-m degrés de libertédegrés de liberté  D’où l’intervalle de confiance :D’où l’intervalle de confiance :  Et la précisionEt la précision 2 2 2 2 2 2 1 1 ˆ ˆ ,i i m m n m n mi i i ii i x t w x t w n n a a s s m - - = = é ù ê ú- +Î ê ú ê úë û å å
  • 61. EchantillonnageEchantillonnage Application àApplication à LeptomastixLeptomastix  La strate 1 représente 70% des hôtesLa strate 1 représente 70% des hôtes dans la nature, la strate 2 30%dans la nature, la strate 2 30%  Corriger l’estimation de la moyenneCorriger l’estimation de la moyenne de la populationde la population  Estimer son intervalle de confiance etEstimer son intervalle de confiance et sa précisionsa précision  L’allocation est-elle optimale ?L’allocation est-elle optimale ?
  • 62. EchantillonnageEchantillonnage Intérêt des stratesIntérêt des strates  Comment juger de l’intérêt de laComment juger de l’intérêt de la stratification ?stratification ?  Par analyse de variancePar analyse de variance  Une technique qui permet de comparer laUne technique qui permet de comparer la variance inter-strate avec la variance intra-variance inter-strate avec la variance intra- stratestrate  Plus lePlus le FF est grand, plus la stratification estest grand, plus la stratification est intéressanteintéressante  A l’inverse, si F est non significatif, laA l’inverse, si F est non significatif, la stratification est dépourvue d’intérêtstratification est dépourvue d’intérêt
  • 63. EchantillonnageEchantillonnage ExempleExemple  Taille deTaille de LeptomastixLeptomastix > attach(biassang)> attach(biassang) > anova(lm(tail~strate),test="F")> anova(lm(tail~strate),test="F") Analysis of Variance TableAnalysis of Variance Table Response: tailResponse: tail Df Sum Sq Mean Sq F value Pr(>F)Df Sum Sq Mean Sq F value Pr(>F) strate 1 8.5617 8.5617 77.559 1.367e-11 ***strate 1 8.5617 8.5617 77.559 1.367e-11 *** Residuals 48 5.2987 0.1104Residuals 48 5.2987 0.1104 ------ Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` 'Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 11
  • 64. EchantillonnageEchantillonnage Contrôle graphiqueContrôle graphique 1 2 1.01.52.02.53.0 Effet des strates, taille de leptomastix
  • 65. EchantillonnageEchantillonnage 4. L’échantillonnage en4. L’échantillonnage en grappesgrappes Ou échantillonnage duOu échantillonnage du premier degrépremier degré (échantillonnage par(échantillonnage par degrés)degrés)
  • 66. EchantillonnageEchantillonnage DéfinitionDéfinition  La population peut être subdivisé en unitésLa population peut être subdivisé en unités primaires ou grappesprimaires ou grappes  Chaque grappe contient un certain nombreChaque grappe contient un certain nombre d’individus ou grainsd’individus ou grains  Le tirage au hasard s’effectue en deuxLe tirage au hasard s’effectue en deux phasesphases  Choix deChoix de mm grappesgrappes  Choix deChoix de nn grains par grappegrains par grappe  Analogie : strates très nombreuses, on neAnalogie : strates très nombreuses, on ne peut les sonder toutespeut les sonder toutes
  • 67. EchantillonnageEchantillonnage Image de la population etImage de la population et du tiragedu tirage µ,σ2 Ω Grappe sondée Grappe non sondée Grain sondé Grain non sondé
  • 68. EchantillonnageEchantillonnage Un schéma hiérarchiqueUn schéma hiérarchique Ω 1 2 3 1 2 3 1 2 1 2 3 Population Grappes Grains
  • 69. EchantillonnageEchantillonnage  A est une variable aléatoire attachée à laA est une variable aléatoire attachée à la grappe, d’espérance nulle et de variancegrappe, d’espérance nulle et de variance (variance intergrappes)(variance intergrappes)  εε est une variable aléatoire attachée àest une variable aléatoire attachée à chaque grain, d’espérance nulle et dechaque grain, d’espérance nulle et de variance (variance résiduelle ou intravariance (variance résiduelle ou intra grappe)grappe)  Par ailleurs, les Ai etPar ailleurs, les Ai et εεij sont indépendantsij sont indépendants 2.1. Modèle statistique2.1. Modèle statistique ijiij Ay ε++µ= 2 Aσ 2 Rσ
  • 70. EchantillonnageEchantillonnage 2.2. Estimateurs2.2. Estimateurs  On se limitera au cas simple où lesOn se limitera au cas simple où les grappes sont d’effectifs égaux, et oùgrappes sont d’effectifs égaux, et où on tire un nombre constant de grainson tire un nombre constant de grains par grappe. Dans ces conditions lapar grappe. Dans ces conditions la moyenne générale de l’échantillon :moyenne générale de l’échantillon :  est un estimateur sans biais deest un estimateur sans biais de µµ ∑∑= = = m 1i n 1j ij.. y m.n 1 y
  • 71. EchantillonnageEchantillonnage Démonstration :Démonstration :  Il suffit d’appliquer le modèle :Il suffit d’appliquer le modèle : .. 1 1 1 ( ) ( ) . m n ij i j E y E y n m = = = å å 1 1 1 1 0 0 1 1 ( ) ( ) . . m n m n i ij i j i j E A E n m n m m e m = = = = = = = + + =å å å å 1444444442 444444443 1444444442 444444443 1 1 1 ( ) . m n i ij i j E A n m m e = = = + +å å
  • 72. EchantillonnageEchantillonnage Sa varianceSa variance  Dépend à la fois de et de  Dépend à la fois de et de   2 Aσ 2 Rσ .. 2 2 1 1 1 ( ) ( ) . m n ij i j Var y Var y n m = = æ ö÷ç ÷= ç ÷ç ÷÷çè ø å å 2 2 1 1 1 . m n i ij i j Var A n m m e = = æ ö÷ç ÷= + +ç ÷ç ÷÷çè ø å å 2 2 2 2 2 1 1 1 1 1 0 . ( ) . . R m m n i ij i i j Var n A Var n m n m s e = = = = æ ö÷ç= + +÷ç ÷÷çè ø å å å 14442 4443 2 2 2 1 1 .. m R i i Var n A n mn m s = æ ö÷ç= +÷ç ÷÷çè ø å 2 2 2 1 1 ( ) . A m R i i Var A n mm s s = = = +å 14442 4443
  • 73. EchantillonnageEchantillonnage FinalementFinalement  L’échantillonnage du premier degré est d’autantL’échantillonnage du premier degré est d’autant moins précis que les grappes sont plus différentesmoins précis que les grappes sont plus différentes les unes des autres. Sans considérations de coût,les unes des autres. Sans considérations de coût, si le produit n.m est fixé, la précision est optimalesi le produit n.m est fixé, la précision est optimale pour n=1 (un seul grain par grappe). On voit bienpour n=1 (un seul grain par grappe). On voit bien les limites de cette stratégie : il est alorsles limites de cette stratégie : il est alors impossible d’estimerimpossible d’estimer ( )2 2 .. 1 ( ) . . A RVar y n n m s s= +
  • 74. EchantillonnageEchantillonnage Grappes et analyse deGrappes et analyse de variancevariance  Modèle d’analyse de variance aléatoireModèle d’analyse de variance aléatoire  UnUn FF important signifie que les grappesimportant signifie que les grappes sont très différentes entre elles,sont très différentes entre elles, relativement homogènes au niveau intrarelativement homogènes au niveau intra  Incite à faire porter l’effort sur les grappesIncite à faire porter l’effort sur les grappes plutôt que sur les grainsplutôt que sur les grains  Estimation des composantes de la varianceEstimation des composantes de la variance
  • 75. EchantillonnageEchantillonnage Analyse de varianceAnalyse de variance SourceSource SCESCE dldl CMCM FF TotalTotal nm-1nm-1 SCESCETT/(/(nmnm-1)-1) Inter (B)Inter (B) m-1m-1 SCESCEBB/(/(m-m-1)1) CMCMBB/CM/CMWW Intra (W)Intra (W) nm-mnm-m SCESCEWW/(/(nm-mnm-m)) ( ) 2 1 1 .. m n ij i j y y = = −∑∑ ( ) 2 . 1 .. m i i n y y = −∑ ( ) 2 . 1 1 m n ij i i j y y = = −∑∑
  • 77. EchantillonnageEchantillonnage Le problème d’optimisationLe problème d’optimisation  Minimiser la variance de la moyenneMinimiser la variance de la moyenne  En déterminant à l’avance le coûtEn déterminant à l’avance le coût total de l’opérationtotal de l’opération  Combien de grappes ?Combien de grappes ?  Combien de grains par grappe ?Combien de grains par grappe ?  Il faut déterminerIl faut déterminer  Le coût de prise en charge d’une grappeLe coût de prise en charge d’une grappe  Le coût de prélèvement d’un grainLe coût de prélèvement d’un grain
  • 78. EchantillonnageEchantillonnage On forme le lagrangienOn forme le lagrangien  Sous la fonction de coût :Sous la fonction de coût : ( ) ( ) ( )2 2 0 1 2 1 , , . . A R TL n m n C C mc nmc n m l s s l= + + - - - 0 1 2TC C mc nmc= + +
  • 79. EchantillonnageEchantillonnage Dérivation par rapport àDérivation par rapport à nn etet mm ( ) 2 22 2 2 1 22 2 0 . 0 . R A R L mc n n m L c nc m m n m s l s s l ì ¶ïï =- + =ï ¶ïïí ï ¶ï =- - + - =ïï ¶ïî 2 2 2 2 . R m c n s l = ( )2 2 1 2 2 A R R n nc n c s s s + + = 2 12 2 2 R A c n c s s =
  • 80. EchantillonnageEchantillonnage Et finalement :Et finalement :  Evidemment, on en déduitEvidemment, on en déduit mm à partirà partir de la fonction de coûtde la fonction de coût 2 1 2 2 R A c n c s s = Grappe chère Grain cher Grains variables Grappes variables + de grains/grappe + de grappes + de grains/grappe + de grappes
  • 81. EchantillonnageEchantillonnage BilanBilan  On ne fait pas un échantillonnage enOn ne fait pas un échantillonnage en grappes pour gagner de la précisiongrappes pour gagner de la précision  En général, au contraire, on en perd parEn général, au contraire, on en perd par rapport à l’échantillonnage aléatoire simplerapport à l’échantillonnage aléatoire simple  On l’adopte pour sa commodité et sonOn l’adopte pour sa commodité et son faible coûtfaible coût  N’oubliez pas de l’optimiser dès que vousN’oubliez pas de l’optimiser dès que vous avez de l’information sur les deuxavez de l’information sur les deux composantes de la variance !composantes de la variance !
  • 82. EchantillonnageEchantillonnage 5. Autres plans5. Autres plans d’échantillonnaged’échantillonnage Echantillonnage par degrés,Echantillonnage par degrés, échantillonnage en différentes occasions,échantillonnage en différentes occasions, échantillonnage par régressionéchantillonnage par régression
  • 83. EchantillonnageEchantillonnage Echantillonnage par degrésEchantillonnage par degrés  Généralisation de l’échantillonnage enGénéralisation de l’échantillonnage en grappesgrappes  Echantillonnage en grappe =Echantillonnage en grappe = échantillonnage du premier degrééchantillonnage du premier degré  Echantillonnage du second degré :Echantillonnage du second degré :  On tire au hasard des unités primairesOn tire au hasard des unités primaires  Dans chaque unité primaire on tire au hasardDans chaque unité primaire on tire au hasard des unités secondairesdes unités secondaires  Dans chaque unité secondaire des unitésDans chaque unité secondaire des unités tertiaires (grains)tertiaires (grains)  En anglais :En anglais : cluster samplingcluster sampling
  • 84. EchantillonnageEchantillonnage ExempleExemple  Etude de la croissance des brochets au Canada :Etude de la croissance des brochets au Canada :  Unités primaires = lacsUnités primaires = lacs  Unités secondaires = barquesUnités secondaires = barques  Unités tertiaires = brochets (grains)Unités tertiaires = brochets (grains)  Analyse :Analyse :  Analyse de variance hiérarchisée (nested)Analyse de variance hiérarchisée (nested)  Estimation des composantes de la varianceEstimation des composantes de la variance  Ici : trois composantesIci : trois composantes  Entre lacsEntre lacs  Entre barquesEntre barques  Entre brochets (résiduelle)Entre brochets (résiduelle)
  • 85. EchantillonnageEchantillonnage Echantillonnage àEchantillonnage à différentes occasionsdifférentes occasions  On tire au hasard un certain nombreOn tire au hasard un certain nombre d’individus dans une populationd’individus dans une population  On les repèreOn les repère  On mesure une caractéristique plusieursOn mesure une caractéristique plusieurs fois (occasions)fois (occasions)  Exemples : croissance sur des animaux ouExemples : croissance sur des animaux ou plantes marquéesplantes marquées  Analyse : « mesures répétées » (repeatedAnalyse : « mesures répétées » (repeated measures)measures)
  • 86. EchantillonnageEchantillonnage Echantillonnage parEchantillonnage par régressionrégression  On mesure une caractéristique peuOn mesure une caractéristique peu coûteusecoûteuse xx sur un très grand nombresur un très grand nombre NN d’individusd’individus  Sur un sous-échantillon aléatoire de tailleSur un sous-échantillon aléatoire de taille nn, on mesure une autre caractéristique,, on mesure une autre caractéristique, très coûteuse,très coûteuse, yy  Ce sous échantillon permet d’estimer leCe sous échantillon permet d’estimer le coefficient de corrélation entre les deuxcoefficient de corrélation entre les deux caractéristiquescaractéristiques  L’estimation précise de la moyenne deL’estimation précise de la moyenne de xx permet alors de corriger la moyenne depermet alors de corriger la moyenne de yy
  • 87. EchantillonnageEchantillonnage ExempleExemple  ChezChez Leptomastix dactylopiiLeptomastix dactylopii onon mesure :mesure :  La taille sur 1000 individusLa taille sur 1000 individus  La taille et la fécondité sur 50 d’entreLa taille et la fécondité sur 50 d’entre euxeux
  • 88. EchantillonnageEchantillonnage ExempleExemple > mean(tail)> mean(tail) # Echantillon de 50# Echantillon de 50 [1] 1.7818[1] 1.7818 > mean(tail2)> mean(tail2) # Echantillon de 1000# Echantillon de 1000 [1] 1.971004[1] 1.971004 > lm(fec~tail)->m1 # Régression fécondité / taille> lm(fec~tail)->m1 # Régression fécondité / taille > m1> m1 Call:Call: lm(formula = fec ~ tail)lm(formula = fec ~ tail) Coefficients:Coefficients: (Intercept) tail(Intercept) tail 22.41 34.3322.41 34.33 > mean(fec)> mean(fec) # Echantillon de 50# Echantillon de 50 [1] 83.58[1] 83.58 > mean(tail2)-mean(tail)->bt> mean(tail2)-mean(tail)->bt # Biais sur la taille# Biais sur la taille > bt*m1$coeff[2]+mean(fec)> bt*m1$coeff[2]+mean(fec) # Correction du biais# Correction du biais féconditéfécondité [1] 90.07582[1] 90.07582 >>
  • 89. EchantillonnageEchantillonnage Variance de l’estimateurVariance de l’estimateur par régressionpar régression  On le donne ci dessous sansOn le donne ci dessous sans démonstration :démonstration : 2 2 (1 ) y n s r- Variance habituelle Coefficient de corrélation entre x et y
  • 90. EchantillonnageEchantillonnage Suite de l’exempleSuite de l’exemple > # Variance de la moyenne fécondité> # Variance de la moyenne fécondité > var(fec)/50> var(fec)/50 [1] 7.28089[1] 7.28089 > #correction par la corrélation avec la taille> #correction par la corrélation avec la taille > cor(tail,fec)> cor(tail,fec) [1] 0.9570068[1] 0.9570068 > (1-cor(tail,fec))*var(fec)/50> (1-cor(tail,fec))*var(fec)/50 [1] 0.3130290[1] 0.3130290 > v<-(1-cor(tail,fec))*var(fec)/50> v<-(1-cor(tail,fec))*var(fec)/50 > # Erreur standard> # Erreur standard > sqrt(v)> sqrt(v) [1] 0.5594899[1] 0.5594899 > # précision> # précision > sqrt(v)*1.96> sqrt(v)*1.96 [1] 1.096600[1] 1.096600 > #précision relative> #précision relative > sqrt(v)*1.96/mean(fec)*100> sqrt(v)*1.96/mean(fec)*100 [1] 1.312037[1] 1.312037 # 1.31% grace à la mesure des 1000 tailles# 1.31% grace à la mesure des 1000 tailles >>
  • 92. EchantillonnageEchantillonnage ConclusionsConclusions  Connaître les plans types est fondamentalConnaître les plans types est fondamental  Il est essentiel de savoir définirIl est essentiel de savoir définir  Ses objectifs (précision, erreur de décision)Ses objectifs (précision, erreur de décision)  Ses moyensSes moyens  L’optimisation permet de gagner du tempsL’optimisation permet de gagner du temps et de l’argentet de l’argent  FaitesFaites simplesimple et si possibleet si possible standardstandard  Evitez les plans « astucieux » qu’on ne sait pasEvitez les plans « astucieux » qu’on ne sait pas traiter ou qui se révèlent coûteuxtraiter ou qui se révèlent coûteux