SlideShare une entreprise Scribd logo
1  sur  51
Télécharger pour lire hors ligne
Méthodes de sondages, le pouvoir de l’alea
Nathalie Villa-Vialaneix
http://www.nathalievilla.org
nathalie.villa@toulouse.inra.fr
Chargée de recherche INRA, Statistique
Lycée Jules Fil, Carcassonne - 27 Mars 2014
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 1 / 18
Loi des grands nombres
Outline
1 Loi des grands nombres
2 Utiliser le hasard pour un sondage
3 Théorème Centrale Limite
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 2 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1
2 0, 1
2 , 1
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1
2 0, 1
2 , 1
3 0, 1
3 , 2
3 , 1
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1
2 0, 1
2 , 1
3 0, 1
3 , 2
3 , 1
... ...
n 0, 1
n , 2
n , ..., 1
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1 1
2 , 1
2
2 0, 1
2 , 1
3 0, 1
3 , 2
3 , 1
... ...
n 0, 1
n , 2
n , ..., 1
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1 1
2 , 1
2
2 0, 1
2 , 1 1
4 , 1
2 , 1
4
3 0, 1
3 , 2
3 , 1
... ...
n 0, 1
n , 2
n , ..., 1
issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face}
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1 1
2 , 1
2
2 0, 1
2 , 1 1
4 , 1
2 , 1
4
3 0, 1
3 , 2
3 , 1 1
8 , 3
8 , 3
8 , 1
8
... ...
n 0, 1
n , 2
n , ..., 1
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Jeu de pile ou face
Issues possibles dans un jeu de pile ou face : {pile, face}
n jeux de pile ou face ; on considère
P =
pile
n
(fréquences de “pile” parmi les lancers)
n valeurs possibles pour P Probabilité d’avoir cette valeur
1 0, 1 1
2 , 1
2
2 0, 1
2 , 1 1
4 , 1
2 , 1
4
3 0, 1
3 , 2
3 , 1 1
8 , 3
8 , 3
8 , 1
8
... ... ...
n 0, 1
n , 2
n , ..., 1 1
2n , n
2n ,
n×(n−1)
2n+1 , ..., 1
2n
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
Loi des grands nombres
Répéter le jeu de pile ou face... longtemps !
Regardons comment P évolue :
1 lancer → P(1)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18
Loi des grands nombres
Répéter le jeu de pile ou face... longtemps !
Regardons comment P évolue :
1 lancer
2 lancers
→
→
P(1)
P(2)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18
Loi des grands nombres
Répéter le jeu de pile ou face... longtemps !
Regardons comment P évolue :
1 lancer
2 lancers
3 lancers
...
n lancers
→
→
→
...
→
P(1)
P(2)
P(3)
...
P(n)
tracer le graphique de P(n) en fonction de n...
Simulons !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18
Loi des grands nombres
Conclusion
Quand n devient très grand,
P(n) =
pile
n
se rapproche de 1
2 , càd, de la probabilité d’obtenir “pile” en lançant
une pièce !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 5 / 18
Loi des grands nombres
Conclusion
Quand n devient très grand,
P(n) =
pile
n
se rapproche de 1
2 , càd, de la probabilité d’obtenir “pile” en lançant
une pièce !
Loi des grands nombres
fréquence observée d’un événement sur un grand nombre d’essais
↓
probabilité (théorique) d’obtenir cet événement sur un essai
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 5 / 18
Loi des grands nombres
Perspective historique
“Ars Conjectandi” (1713) de Jacques Bernoulli est le premier ouvrage
contenant une démonstration de la loi des grands nombres dans le cas de
la fréquence de succès d’un événement (comme le jeu de “pile ou face”).
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 6 / 18
Loi des grands nombres
Perspective historique
“Ars Conjectandi” (1713) de Jacques Bernoulli est le premier ouvrage
contenant une démonstration de la loi des grands nombres dans le cas de
la fréquence de succès d’un événement (comme le jeu de “pile ou face”).
La démonstration lui prit 20 ans et fût publiée par son neveu huit ans après
sa mort. On appelle loi de Bernoulli une loi qui donne la probabilité du
succès d’un événement : “avoir un pile au jeu de pile ou face” (1/2), “avoir
un 6 au dé” (1/6), etc...
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 6 / 18
Loi des grands nombres
Extension au cas d’une loi quelconque
Expérience : On tire au hasard des nombres selon une distribution de
probabilité donnée (ex : tirer au hasard un nombre entre 0 et 1)
x1, x2, x3...
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18
Loi des grands nombres
Extension au cas d’une loi quelconque
Expérience : On tire au hasard des nombres selon une distribution de
probabilité donnée (ex : tirer au hasard un nombre entre 0 et 1)
x1, x2, x3...
Densité de la distribution de probabilité, fX : exemple de la densité de
la loi Gaussienne
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18
Loi des grands nombres
Extension au cas d’une loi quelconque
Expérience : On tire au hasard des nombres selon une distribution de
probabilité donnée (ex : tirer au hasard un nombre entre 0 et 1)
x1, x2, x3...
Densité de la distribution de probabilité, fX : exemple de la densité de
la loi Gaussienne
Espérance : E(X) = xfX (x)dx (exemple : pour la loi Gaussienne,
E(X) = 0 ; pour un nombre tiré au hasard entre 0 et 1 : E(X) = 0, 5)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18
Loi des grands nombres
Convergence vers l’espérance
On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xn
n
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18
Loi des grands nombres
Convergence vers l’espérance
On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xn
n
tracer le graphique de Xn en fonction de n...
Simulons !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18
Loi des grands nombres
Convergence vers l’espérance
On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xn
n
tracer le graphique de Xn en fonction de n...
Simulons !
Loi des grands nombres
Xn se rapproche de E(X)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18
Utiliser le hasard pour un sondage
Outline
1 Loi des grands nombres
2 Utiliser le hasard pour un sondage
3 Théorème Centrale Limite
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 9 / 18
Utiliser le hasard pour un sondage
Exemple introductif
On cherche à savoir le pourcentage de personnes en France qui aiment la
pizza (noté P et inconnu)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
Utiliser le hasard pour un sondage
Exemple introductif
On cherche à savoir le pourcentage de personnes en France qui aiment la
pizza (noté P et inconnu)
1 Solution 1 : interroger tous les habitants de France et leur demander
si ils aiment la pizza : c’est long !!!!!!!
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
Utiliser le hasard pour un sondage
Exemple introductif
On cherche à savoir le pourcentage de personnes en France qui aiment la
pizza (noté P et inconnu)
1 Solution 1 : interroger tous les habitants de France et leur demander
si ils aiment la pizza : c’est long !!!!!!!
2 Solution 2 (sondage aléatoire) : interroger au hasard n personnes
dans la population et calculer ˆP(n) le pourcentage de personnes qui
aiment la pizza
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
Utiliser le hasard pour un sondage
Exemple introductif
On cherche à savoir le pourcentage de personnes en France qui aiment la
pizza (noté P et inconnu)
1 Solution 1 : interroger tous les habitants de France et leur demander
si ils aiment la pizza : c’est long !!!!!!!
2 Solution 2 (sondage aléatoire) : interroger au hasard n personnes
dans la population et calculer ˆP(n) le pourcentage de personnes qui
aiment la pizza
la probabilité qu’une personne prise au hasard aime la pizza est P
(inconnue) donc
ˆP(n) P
si n est assez grand
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
Utiliser le hasard pour un sondage
Perspective historique
• le principe du sondage est pratiqué depuis le Moyen-Âge mais sans
contrôle probabiliste ;
•
au XVIIIe, Pierre-Simon de Laplace :
premières estimations pour évaluer la
population française à partir des naissances
(choix raisonné d’échantillonnage, notion
d’“erreur à craindre”) ;
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18
Utiliser le hasard pour un sondage
Perspective historique
• le principe du sondage est pratiqué depuis le Moyen-Âge mais sans
contrôle probabiliste ;
•
au XVIIIe, Pierre-Simon de Laplace :
premières estimations pour évaluer la
population française à partir des naissances
(choix raisonné d’échantillonnage, notion
d’“erreur à craindre”) ;
•
Arthur Bowley (∼ 1900) : premiers
sondages aléatoires (notion d’intervalle de
confiance) ;
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18
Utiliser le hasard pour un sondage
Perspective historique
• le principe du sondage est pratiqué depuis le Moyen-Âge mais sans
contrôle probabiliste ;
•
au XVIIIe, Pierre-Simon de Laplace :
premières estimations pour évaluer la
population française à partir des naissances
(choix raisonné d’échantillonnage, notion
d’“erreur à craindre”) ;
•
Arthur Bowley (∼ 1900) : premiers
sondages aléatoires (notion d’intervalle de
confiance) ;
• approche reconnue au congrès de l’IIS en 1925 (Rome) et qui se
généralise dans les instituts de sondage nationaux.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18
Utiliser le hasard pour un sondage
Méthodes de sondage aléatoires
Sondage simple
On choisit au hasard n personnes dans la population.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
Utiliser le hasard pour un sondage
Méthodes de sondage aléatoires
Sondage simple
On choisit au hasard n personnes dans la population.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
Utiliser le hasard pour un sondage
Méthodes de sondage aléatoires
Sondage par grappes
La population est divisée en (beaucoup de) petites sous-populations (ex :
les départements français)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
Utiliser le hasard pour un sondage
Méthodes de sondage aléatoires
Sondage par grappes
La population est divisée en (beaucoup de) petites sous-populations (ex :
les départements français) ⇒ on choisit au hasard quelques
sous-populations pour lesquelles on interroge tout le monde : c’est
moins coûteux... !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
Utiliser le hasard pour un sondage
Méthodes de sondage aléatoires
Sondage par strates
La population est divisée en un petit nombre de sous-populations qui ont
des valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
Utiliser le hasard pour un sondage
Méthodes de sondage aléatoires
Sondage par strates Simulons !
La population est divisée en un petit nombre de sous-populations qui ont
des valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges) ⇒
on choisit au hasard quelques personnes dans chaque
sous-population : réduit la variabilité de l’estimation... !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
Utiliser le hasard pour un sondage
Le sondage en pratique : souvent, la méthode des quotas
Actuellement, les instituts de sondage pratiquent souvent la
méthode des quotas
(construction d’un échantillon non aléatoire construit pour reproduire les
caractéristiques d’âge, sexe, CSP, etc de la population)
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 13 / 18
Utiliser le hasard pour un sondage
Le sondage en pratique : souvent, la méthode des quotas
Actuellement, les instituts de sondage pratiquent souvent la
méthode des quotas
(construction d’un échantillon non aléatoire construit pour reproduire les
caractéristiques d’âge, sexe, CSP, etc de la population)
Problème : Aucune possibilité de contrôler l’ampleur de l’erreur effectuée
lors de l’estimation avec une approche probabiliste !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 13 / 18
Théorème Centrale Limite
Outline
1 Loi des grands nombres
2 Utiliser le hasard pour un sondage
3 Théorème Centrale Limite
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 14 / 18
Théorème Centrale Limite
Retour au jeu de pile ou face...
Ici, on fixe n. On sait que pour n “assez grand”, P(n) 0, 5 (le
pourcentage de “pile” observés sur n tirages est proche de 50%).
1 1
2
√
n
est en fait l’écart type attendu de P(n).
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18
Théorème Centrale Limite
Retour au jeu de pile ou face...
Ici, on fixe n. On sait que pour n “assez grand”, P(n) 0, 5 (le
pourcentage de “pile” observés sur n tirages est proche de 50%).
Comment se répartit P(n) autour de 0,5 si on effectue plusieurs séries
de n tirages ?
1 1
2
√
n
est en fait l’écart type attendu de P(n).
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18
Théorème Centrale Limite
Retour au jeu de pile ou face...
Ici, on fixe n. On sait que pour n “assez grand”, P(n) 0, 5 (le
pourcentage de “pile” observés sur n tirages est proche de 50%).
Comment se répartit P(n) autour de 0,5 si on effectue plusieurs séries
de n tirages ?
Simulons !
1 on génère m séries de n tirages chacune ;
2 pour chacune des séries, on calcule P(n) ;
3 on centre et on réduit P(n) en calculant pour chaque série :
P(n)−0,5
1/(2
√
n)
;1
4 on effectue l’histogramme des m valeurs ainsi trouvées.
1 1
2
√
n
est en fait l’écart type attendu de P(n).
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18
Théorème Centrale Limite
Conclusion des simulations
Résultat : Lorsque n devient grand et que le nombre de séries de tirages
devient grand aussi l’histogramme des
P(n)−0,5
σ(P(n))
densité gaussienne de
moyenne 0 et d’écart type 1.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 16 / 18
Théorème Centrale Limite
Extension pour une distribution générale
Le théorème Centrale Limite
La propriété précédente est vraie de manière très générale :
Xn−E(X)
σX
est
réparti autour de 0 comme une loi gaussienne de moyenne 0 et d’écart
type 1 lorsque n devient grand.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 17 / 18
Théorème Centrale Limite
Extension pour une distribution générale
Le théorème Centrale Limite
La propriété précédente est vraie de manière très générale :
Xn−E(X)
σX
est
réparti autour de 0 comme une loi gaussienne de moyenne 0 et d’écart
type 1 lorsque n devient grand.
95% des valeurs
Xn−E(X)
σX
sont entre −1, 96 et 1, 96 (très faible probabilité).
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 17 / 18
Théorème Centrale Limite
Application pour la recherche d’un intervalle de confiance
En sondage :
1 on calcule : moyenne de la variable étudiée sur l’échantillon X ;
2 si σX est connue, on en déduit un intervalle de confiance :
IC = X − 1, 96 × σX√
n
; X + 1, 96 × σX√
n
.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18
Théorème Centrale Limite
Application pour la recherche d’un intervalle de confiance
En sondage :
1 on calcule : moyenne de la variable étudiée sur l’échantillon X ;
2 si σX est connue, on en déduit un intervalle de confiance :
IC = X − 1, 96 × σX√
n
; X + 1, 96 × σX√
n
.
Interprétation : 95% des échantillons construits ainsi contiennent la
bonne valeur de l’espérance E(X).
Simulons !
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18
Théorème Centrale Limite
Application pour la recherche d’un intervalle de confiance
En sondage :
1 on calcule : moyenne de la variable étudiée sur l’échantillon X ;
2 si σX est connue, on en déduit un intervalle de confiance :
IC = X − 1, 96 × σX√
n
; X + 1, 96 × σX√
n
.
Interprétation : 95% des échantillons construits ainsi contiennent la
bonne valeur de l’espérance E(X).
Simulons !
En pratique, σX n’est pas connue, comme la moyenne, on l’estime à
partir de l’écart type sur l’échantillon.
Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18

Contenu connexe

Plus de tuxette

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathstuxette
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènestuxette
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquestuxette
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-Ctuxette
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?tuxette
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...tuxette
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquestuxette
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeantuxette
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...tuxette
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquestuxette
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...tuxette
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...tuxette
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation datatuxette
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?tuxette
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysistuxette
 
SOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricesSOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricestuxette
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Predictiontuxette
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelstuxette
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random foresttuxette
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICStuxette
 

Plus de tuxette (20)

Racines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en mathsRacines en haut et feuilles en bas : les arbres en maths
Racines en haut et feuilles en bas : les arbres en maths
 
Méthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènesMéthodes à noyaux pour l’intégration de données hétérogènes
Méthodes à noyaux pour l’intégration de données hétérogènes
 
Méthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiquesMéthodologies d'intégration de données omiques
Méthodologies d'intégration de données omiques
 
Projets autour de l'Hi-C
Projets autour de l'Hi-CProjets autour de l'Hi-C
Projets autour de l'Hi-C
 
Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?Can deep learning learn chromatin structure from sequence?
Can deep learning learn chromatin structure from sequence?
 
Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...Multi-omics data integration methods: kernel and other machine learning appro...
Multi-omics data integration methods: kernel and other machine learning appro...
 
ASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiquesASTERICS : une application pour intégrer des données omiques
ASTERICS : une application pour intégrer des données omiques
 
Autour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWeanAutour des projets Idefics et MetaboWean
Autour des projets Idefics et MetaboWean
 
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
Rserve, renv, flask, Vue.js dans un docker pour intégrer des données omiques ...
 
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiquesApprentissage pour la biologie moléculaire et l’analyse de données omiques
Apprentissage pour la biologie moléculaire et l’analyse de données omiques
 
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
Quelques résultats préliminaires de l'évaluation de méthodes d'inférence de r...
 
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
Intégration de données omiques multi-échelles : méthodes à noyau et autres ap...
 
Journal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation dataJournal club: Validation of cluster analysis results on validation data
Journal club: Validation of cluster analysis results on validation data
 
Overfitting or overparametrization?
Overfitting or overparametrization?Overfitting or overparametrization?
Overfitting or overparametrization?
 
Selective inference and single-cell differential analysis
Selective inference and single-cell differential analysisSelective inference and single-cell differential analysis
Selective inference and single-cell differential analysis
 
SOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatricesSOMbrero : un package R pour les cartes auto-organisatrices
SOMbrero : un package R pour les cartes auto-organisatrices
 
Graph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype PredictionGraph Neural Network for Phenotype Prediction
Graph Neural Network for Phenotype Prediction
 
A short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction modelsA short and naive introduction to using network in prediction models
A short and naive introduction to using network in prediction models
 
Explanable models for time series with random forest
Explanable models for time series with random forestExplanable models for time series with random forest
Explanable models for time series with random forest
 
Présentation du projet ASTERICS
Présentation du projet ASTERICSPrésentation du projet ASTERICS
Présentation du projet ASTERICS
 

Dernier

MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptxMalikaIdseaid1
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 

Dernier (16)

MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
presentation l'interactionnisme symbolique finale.pptx
presentation l'interactionnisme symbolique  finale.pptxpresentation l'interactionnisme symbolique  finale.pptx
presentation l'interactionnisme symbolique finale.pptx
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 

Slides Lycée Jules Fil 2014

  • 1. Méthodes de sondages, le pouvoir de l’alea Nathalie Villa-Vialaneix http://www.nathalievilla.org nathalie.villa@toulouse.inra.fr Chargée de recherche INRA, Statistique Lycée Jules Fil, Carcassonne - 27 Mars 2014 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 1 / 18
  • 2. Loi des grands nombres Outline 1 Loi des grands nombres 2 Utiliser le hasard pour un sondage 3 Théorème Centrale Limite Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 2 / 18
  • 3. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 4. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 5. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 6. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 2 0, 1 2 , 1 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 7. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 2 0, 1 2 , 1 3 0, 1 3 , 2 3 , 1 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 8. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 2 0, 1 2 , 1 3 0, 1 3 , 2 3 , 1 ... ... n 0, 1 n , 2 n , ..., 1 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 9. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 1 2 , 1 2 2 0, 1 2 , 1 3 0, 1 3 , 2 3 , 1 ... ... n 0, 1 n , 2 n , ..., 1 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 10. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 1 2 , 1 2 2 0, 1 2 , 1 1 4 , 1 2 , 1 4 3 0, 1 3 , 2 3 , 1 ... ... n 0, 1 n , 2 n , ..., 1 issues possibles : {pile, pile}, {pile, face}, {face, pile}, {face, face} Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 11. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 1 2 , 1 2 2 0, 1 2 , 1 1 4 , 1 2 , 1 4 3 0, 1 3 , 2 3 , 1 1 8 , 3 8 , 3 8 , 1 8 ... ... n 0, 1 n , 2 n , ..., 1 Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 12. Loi des grands nombres Jeu de pile ou face Issues possibles dans un jeu de pile ou face : {pile, face} n jeux de pile ou face ; on considère P = pile n (fréquences de “pile” parmi les lancers) n valeurs possibles pour P Probabilité d’avoir cette valeur 1 0, 1 1 2 , 1 2 2 0, 1 2 , 1 1 4 , 1 2 , 1 4 3 0, 1 3 , 2 3 , 1 1 8 , 3 8 , 3 8 , 1 8 ... ... ... n 0, 1 n , 2 n , ..., 1 1 2n , n 2n , n×(n−1) 2n+1 , ..., 1 2n Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 3 / 18
  • 13. Loi des grands nombres Répéter le jeu de pile ou face... longtemps ! Regardons comment P évolue : 1 lancer → P(1) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18
  • 14. Loi des grands nombres Répéter le jeu de pile ou face... longtemps ! Regardons comment P évolue : 1 lancer 2 lancers → → P(1) P(2) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18
  • 15. Loi des grands nombres Répéter le jeu de pile ou face... longtemps ! Regardons comment P évolue : 1 lancer 2 lancers 3 lancers ... n lancers → → → ... → P(1) P(2) P(3) ... P(n) tracer le graphique de P(n) en fonction de n... Simulons ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 4 / 18
  • 16. Loi des grands nombres Conclusion Quand n devient très grand, P(n) = pile n se rapproche de 1 2 , càd, de la probabilité d’obtenir “pile” en lançant une pièce ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 5 / 18
  • 17. Loi des grands nombres Conclusion Quand n devient très grand, P(n) = pile n se rapproche de 1 2 , càd, de la probabilité d’obtenir “pile” en lançant une pièce ! Loi des grands nombres fréquence observée d’un événement sur un grand nombre d’essais ↓ probabilité (théorique) d’obtenir cet événement sur un essai Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 5 / 18
  • 18. Loi des grands nombres Perspective historique “Ars Conjectandi” (1713) de Jacques Bernoulli est le premier ouvrage contenant une démonstration de la loi des grands nombres dans le cas de la fréquence de succès d’un événement (comme le jeu de “pile ou face”). Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 6 / 18
  • 19. Loi des grands nombres Perspective historique “Ars Conjectandi” (1713) de Jacques Bernoulli est le premier ouvrage contenant une démonstration de la loi des grands nombres dans le cas de la fréquence de succès d’un événement (comme le jeu de “pile ou face”). La démonstration lui prit 20 ans et fût publiée par son neveu huit ans après sa mort. On appelle loi de Bernoulli une loi qui donne la probabilité du succès d’un événement : “avoir un pile au jeu de pile ou face” (1/2), “avoir un 6 au dé” (1/6), etc... Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 6 / 18
  • 20. Loi des grands nombres Extension au cas d’une loi quelconque Expérience : On tire au hasard des nombres selon une distribution de probabilité donnée (ex : tirer au hasard un nombre entre 0 et 1) x1, x2, x3... Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18
  • 21. Loi des grands nombres Extension au cas d’une loi quelconque Expérience : On tire au hasard des nombres selon une distribution de probabilité donnée (ex : tirer au hasard un nombre entre 0 et 1) x1, x2, x3... Densité de la distribution de probabilité, fX : exemple de la densité de la loi Gaussienne Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18
  • 22. Loi des grands nombres Extension au cas d’une loi quelconque Expérience : On tire au hasard des nombres selon une distribution de probabilité donnée (ex : tirer au hasard un nombre entre 0 et 1) x1, x2, x3... Densité de la distribution de probabilité, fX : exemple de la densité de la loi Gaussienne Espérance : E(X) = xfX (x)dx (exemple : pour la loi Gaussienne, E(X) = 0 ; pour un nombre tiré au hasard entre 0 et 1 : E(X) = 0, 5) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 7 / 18
  • 23. Loi des grands nombres Convergence vers l’espérance On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xn n Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18
  • 24. Loi des grands nombres Convergence vers l’espérance On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xn n tracer le graphique de Xn en fonction de n... Simulons ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18
  • 25. Loi des grands nombres Convergence vers l’espérance On définit la moyenne des n premiers nombres tirés : Xn = x1+...+xn n tracer le graphique de Xn en fonction de n... Simulons ! Loi des grands nombres Xn se rapproche de E(X) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 8 / 18
  • 26. Utiliser le hasard pour un sondage Outline 1 Loi des grands nombres 2 Utiliser le hasard pour un sondage 3 Théorème Centrale Limite Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 9 / 18
  • 27. Utiliser le hasard pour un sondage Exemple introductif On cherche à savoir le pourcentage de personnes en France qui aiment la pizza (noté P et inconnu) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
  • 28. Utiliser le hasard pour un sondage Exemple introductif On cherche à savoir le pourcentage de personnes en France qui aiment la pizza (noté P et inconnu) 1 Solution 1 : interroger tous les habitants de France et leur demander si ils aiment la pizza : c’est long !!!!!!! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
  • 29. Utiliser le hasard pour un sondage Exemple introductif On cherche à savoir le pourcentage de personnes en France qui aiment la pizza (noté P et inconnu) 1 Solution 1 : interroger tous les habitants de France et leur demander si ils aiment la pizza : c’est long !!!!!!! 2 Solution 2 (sondage aléatoire) : interroger au hasard n personnes dans la population et calculer ˆP(n) le pourcentage de personnes qui aiment la pizza Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
  • 30. Utiliser le hasard pour un sondage Exemple introductif On cherche à savoir le pourcentage de personnes en France qui aiment la pizza (noté P et inconnu) 1 Solution 1 : interroger tous les habitants de France et leur demander si ils aiment la pizza : c’est long !!!!!!! 2 Solution 2 (sondage aléatoire) : interroger au hasard n personnes dans la population et calculer ˆP(n) le pourcentage de personnes qui aiment la pizza la probabilité qu’une personne prise au hasard aime la pizza est P (inconnue) donc ˆP(n) P si n est assez grand Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 10 / 18
  • 31. Utiliser le hasard pour un sondage Perspective historique • le principe du sondage est pratiqué depuis le Moyen-Âge mais sans contrôle probabiliste ; • au XVIIIe, Pierre-Simon de Laplace : premières estimations pour évaluer la population française à partir des naissances (choix raisonné d’échantillonnage, notion d’“erreur à craindre”) ; Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18
  • 32. Utiliser le hasard pour un sondage Perspective historique • le principe du sondage est pratiqué depuis le Moyen-Âge mais sans contrôle probabiliste ; • au XVIIIe, Pierre-Simon de Laplace : premières estimations pour évaluer la population française à partir des naissances (choix raisonné d’échantillonnage, notion d’“erreur à craindre”) ; • Arthur Bowley (∼ 1900) : premiers sondages aléatoires (notion d’intervalle de confiance) ; Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18
  • 33. Utiliser le hasard pour un sondage Perspective historique • le principe du sondage est pratiqué depuis le Moyen-Âge mais sans contrôle probabiliste ; • au XVIIIe, Pierre-Simon de Laplace : premières estimations pour évaluer la population française à partir des naissances (choix raisonné d’échantillonnage, notion d’“erreur à craindre”) ; • Arthur Bowley (∼ 1900) : premiers sondages aléatoires (notion d’intervalle de confiance) ; • approche reconnue au congrès de l’IIS en 1925 (Rome) et qui se généralise dans les instituts de sondage nationaux. Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 11 / 18
  • 34. Utiliser le hasard pour un sondage Méthodes de sondage aléatoires Sondage simple On choisit au hasard n personnes dans la population. Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
  • 35. Utiliser le hasard pour un sondage Méthodes de sondage aléatoires Sondage simple On choisit au hasard n personnes dans la population. Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
  • 36. Utiliser le hasard pour un sondage Méthodes de sondage aléatoires Sondage par grappes La population est divisée en (beaucoup de) petites sous-populations (ex : les départements français) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
  • 37. Utiliser le hasard pour un sondage Méthodes de sondage aléatoires Sondage par grappes La population est divisée en (beaucoup de) petites sous-populations (ex : les départements français) ⇒ on choisit au hasard quelques sous-populations pour lesquelles on interroge tout le monde : c’est moins coûteux... ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
  • 38. Utiliser le hasard pour un sondage Méthodes de sondage aléatoires Sondage par strates La population est divisée en un petit nombre de sous-populations qui ont des valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
  • 39. Utiliser le hasard pour un sondage Méthodes de sondage aléatoires Sondage par strates Simulons ! La population est divisée en un petit nombre de sous-populations qui ont des valeurs différentes pour la variable d’intérêt (ex : 3 classes d’âges) ⇒ on choisit au hasard quelques personnes dans chaque sous-population : réduit la variabilité de l’estimation... ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 12 / 18
  • 40. Utiliser le hasard pour un sondage Le sondage en pratique : souvent, la méthode des quotas Actuellement, les instituts de sondage pratiquent souvent la méthode des quotas (construction d’un échantillon non aléatoire construit pour reproduire les caractéristiques d’âge, sexe, CSP, etc de la population) Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 13 / 18
  • 41. Utiliser le hasard pour un sondage Le sondage en pratique : souvent, la méthode des quotas Actuellement, les instituts de sondage pratiquent souvent la méthode des quotas (construction d’un échantillon non aléatoire construit pour reproduire les caractéristiques d’âge, sexe, CSP, etc de la population) Problème : Aucune possibilité de contrôler l’ampleur de l’erreur effectuée lors de l’estimation avec une approche probabiliste ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 13 / 18
  • 42. Théorème Centrale Limite Outline 1 Loi des grands nombres 2 Utiliser le hasard pour un sondage 3 Théorème Centrale Limite Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 14 / 18
  • 43. Théorème Centrale Limite Retour au jeu de pile ou face... Ici, on fixe n. On sait que pour n “assez grand”, P(n) 0, 5 (le pourcentage de “pile” observés sur n tirages est proche de 50%). 1 1 2 √ n est en fait l’écart type attendu de P(n). Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18
  • 44. Théorème Centrale Limite Retour au jeu de pile ou face... Ici, on fixe n. On sait que pour n “assez grand”, P(n) 0, 5 (le pourcentage de “pile” observés sur n tirages est proche de 50%). Comment se répartit P(n) autour de 0,5 si on effectue plusieurs séries de n tirages ? 1 1 2 √ n est en fait l’écart type attendu de P(n). Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18
  • 45. Théorème Centrale Limite Retour au jeu de pile ou face... Ici, on fixe n. On sait que pour n “assez grand”, P(n) 0, 5 (le pourcentage de “pile” observés sur n tirages est proche de 50%). Comment se répartit P(n) autour de 0,5 si on effectue plusieurs séries de n tirages ? Simulons ! 1 on génère m séries de n tirages chacune ; 2 pour chacune des séries, on calcule P(n) ; 3 on centre et on réduit P(n) en calculant pour chaque série : P(n)−0,5 1/(2 √ n) ;1 4 on effectue l’histogramme des m valeurs ainsi trouvées. 1 1 2 √ n est en fait l’écart type attendu de P(n). Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 15 / 18
  • 46. Théorème Centrale Limite Conclusion des simulations Résultat : Lorsque n devient grand et que le nombre de séries de tirages devient grand aussi l’histogramme des P(n)−0,5 σ(P(n)) densité gaussienne de moyenne 0 et d’écart type 1. Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 16 / 18
  • 47. Théorème Centrale Limite Extension pour une distribution générale Le théorème Centrale Limite La propriété précédente est vraie de manière très générale : Xn−E(X) σX est réparti autour de 0 comme une loi gaussienne de moyenne 0 et d’écart type 1 lorsque n devient grand. Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 17 / 18
  • 48. Théorème Centrale Limite Extension pour une distribution générale Le théorème Centrale Limite La propriété précédente est vraie de manière très générale : Xn−E(X) σX est réparti autour de 0 comme une loi gaussienne de moyenne 0 et d’écart type 1 lorsque n devient grand. 95% des valeurs Xn−E(X) σX sont entre −1, 96 et 1, 96 (très faible probabilité). Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 17 / 18
  • 49. Théorème Centrale Limite Application pour la recherche d’un intervalle de confiance En sondage : 1 on calcule : moyenne de la variable étudiée sur l’échantillon X ; 2 si σX est connue, on en déduit un intervalle de confiance : IC = X − 1, 96 × σX√ n ; X + 1, 96 × σX√ n . Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18
  • 50. Théorème Centrale Limite Application pour la recherche d’un intervalle de confiance En sondage : 1 on calcule : moyenne de la variable étudiée sur l’échantillon X ; 2 si σX est connue, on en déduit un intervalle de confiance : IC = X − 1, 96 × σX√ n ; X + 1, 96 × σX√ n . Interprétation : 95% des échantillons construits ainsi contiennent la bonne valeur de l’espérance E(X). Simulons ! Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18
  • 51. Théorème Centrale Limite Application pour la recherche d’un intervalle de confiance En sondage : 1 on calcule : moyenne de la variable étudiée sur l’échantillon X ; 2 si σX est connue, on en déduit un intervalle de confiance : IC = X − 1, 96 × σX√ n ; X + 1, 96 × σX√ n . Interprétation : 95% des échantillons construits ainsi contiennent la bonne valeur de l’espérance E(X). Simulons ! En pratique, σX n’est pas connue, comme la moyenne, on l’estime à partir de l’écart type sur l’échantillon. Sondage & alea (INRA, Unité MIA-T) Nathalie Villa-Vialaneix Carcassonne, 27 mars 2014 18 / 18