8.7 il teorema del limite centrale e la legge dei grandi numeri
1. Un ripasso di probabilità:
Il teorema del limite centrale
PaulKlee,GiardinodiTunisi,1919
Riccardo Rigon
2. R. Rigon
2
Perchè la distribuzione Normale
è così importante ?
-2 -1 1 2
0.2
0.4
0.6
0.8
1.0
3. R. Rigon
3
4 Simulazione 3
4 Simulazione 3
In un terzo esempio, considereremo la distribuzione campionaria della
media nel caso di una variabile continua.
1. Verr`a utilizzata una popolazione teorica distribuita normalmente con
media e varianza conosciute: N(125, 33).
2. Usando R, verranno estratti da questa popolazione 50000 campioni
causali di grandezza n = 10.
3. Verr`a calcolata la media di ciascuno di questi campioni di grandezza
n = 10;
4. Verranno calcolate la media e la varianza della distribuzione delle
medie dei 50000 campioni di grandezza n = 10.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 30
CorradoCaudek
4. R. Rigon
4
4 Simulazione 3
n <- 10
nSamples<- 50000
Mean <- 125
SD <- sqrt(33)
SampDistr <- rep(0,nSamples)
for (i in 1:nSamples){
samp <- rnorm(n, Mean, SD)
SampDistr[i] <- mean(samp)
}
MeanSampDistr <- mean(SampDistr)
VarSampDistr <- var(SampDistr)*(nSamples-1)/nSamples
Tecniche di Ricerca Psicologica e di Analisi dei Dati 31
CorradoCaudek
5. R. Rigon
5
4 Simulazione 3
Risultati della simulazione
> Mean
[1] 125
> Var
[1] 33
> MeanSampDistr
[1] 125.0029
> VarSampDistr
[1] 3.277463
> Var/n
[1] 3.300000
Tecniche di Ricerca Psicologica e di Analisi dei Dati 32
CorradoCaudek
6. R. Rigon
6
4 Simulazione 3
• Popolazione: µ = 125, 2
= 33.
• Distribuzione campionaria della media: µ¯x = 125, 2
¯x = 3.3.
• Risultati della simulazione: ˆµ¯x = 125.0029, ˆ2
¯x = 3.277463.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 33
CorradoCaudek
7. R. Rigon
7
4 Simulazione 3
110 120 130 140
0.00.20.40.6
Media di campioni di grandezza n = 2
Densità
110 120 130 1400.00.20.40.6
Media di campioni di grandezza n = 10
Densità
110 120 130 140
0.00.20.40.6
Media di campioni di grandezza n = 100
Densità
Tecniche di Ricerca Psicologica e di Analisi dei Dati 34
CorradoCaudek
8. R. Rigon
8
5 Simulazione 4
5 Simulazione 4
• Consideriamo ora una popolazione asimmetrica, ⇤2
=2.
• La distribuzione ⇤2
con parametro = 2 ha una media µ = e una
varianza uguale a ⇥2
= 2 .
• A di erenza della distribuzione normale, la distribuzione ⇤2
=2 `e
dotata di un’asimmetria positiva.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 35
CorradoCaudek
9. R. Rigon
9
5 Simulazione 4
• Usando R, verranno estratti da questa popolazione 10000 campioni
causali di grandezza n = 2, 5, 25, 100 e verr`a calcolata la media di
ciascuno di questi campioni di grandezza n.
• All’istogramma che rappresenta la distribuzione delle medie dei
campioni di grandezza n verr`a sovrapposta la distribuzione normale
con parametri µ = e ⇥2
= (2 )/n.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 36
CorradoCaudek
10. R. Rigon
10
5 Simulazione 4
0 1 2 3 4 5 6
0.10.20.30.40.5
Chi quadrato
Densità
Tecniche di Ricerca Psicologica e di Analisi dei Dati 37
CorradoCaudek
11. R. Rigon
11
5 Simulazione 4
0 1 2 3 4 5 6
0.00.51.01.52.0
Media di campioni di grandezza n = 2
Densità
0 1 2 3 4 5 6
0.00.51.01.52.0
Media di campioni di grandezza n = 5
Densità
0 1 2 3 4 5 6
0.00.51.01.52.0
Media di campioni di grandezza n = 25
Densità
0 1 2 3 4 5 6
0.00.51.01.52.0
Media di campioni di grandezza n = 100
Densità
Tecniche di Ricerca Psicologica e di Analisi dei Dati 38
CorradoCaudek
12. R. Rigon
12
6 Conclusioni
6 Conclusioni
• Da questi esempi possiamo concludere le seguenti regole generali.
Supponiamo che ¯x sia la media di un campione casuale estratto da
una popolazione avente media µ e varianza 2
.
– La media della distribuzione campionaria di ¯x `e uguale alla media
della popolazione: µ¯x = µ.
– La varianza della distribuzione campionaria di ¯x `e uguale a
2
¯x =
2
n .
Tecniche di Ricerca Psicologica e di Analisi dei Dati 39
CorradoCaudek
13. R. Rigon
13
6 Conclusioni
Legge dei grandi numeri
• Di conseguenza, al crescere della numerosit`a del campione, la media
del campione ¯x diventa via via pi`u simile alla media della
popolazione µ.
– In un campione molto grande, ¯x sar`a quasi certamente molto
simile a µ. Tale fatto `e chiamato legge dei grandi numeri.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 40
CorradoCaudek
14. R. Rigon
14
6 Conclusioni
Teorema del limite centrale
• Indipendentemente dalla forma della distribuzione della popolazione,
la distribuzione campionaria di ¯x `e approssimativamente normale e
quest’approssimazione `e tanto migliore quanto maggiori sono le
dimensioni del campione: ¯x N(µ, n
). Tale fatto `e chiamato
teorema del limite centrale.
– Quanto debba essere grande n a nch´e questa approssimazione
sia accettabile dipende dalla forma della distribuzione della
popolazione – in generale, comunque, n = 30 `e su ciente.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 41
CorradoCaudek
15. R. Rigon
15
6 Conclusioni
Distribuzione campionaria nel caso di una popolazione gaussiana
• Se la distribuzione della popolazione `e gaussiana allora la
distribuzione campionaria di ¯x sar`a normale, indipendentemente
dalla numerosit`a n del campione.
Tecniche di Ricerca Psicologica e di Analisi dei Dati 42
CorradoCaudek