1. Distribución muestral de
proporciones
Algunas secciones han sido tomadas de:
Apuntes de Estadística Inferencial
Instituto Tecnológico de Chiuhuahua
2. Tarea.
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de
valores 0, 2, 4 y 6. Encontrar:
μ , la media poblacional.
σ , la desviación estándar poblacional.
μ x, la media de la distribución muestral de medias.
σ x, la desviación estándar de la distribución muestral de medias.
Además, graficar las frecuencias para la población y para la distribución
muestral de medias.
Nota: Usar muestras ordenadas implica todas las combinaciones de valores,
por ejemplo, (4,0) y (0,4).
3. Solución:
0+2+4+6
La media poblacional es: μ= =3
4
La desviación estándar de la poblacional es:
(0 − 3) 2 + (2 − 3) 2 + (4 − 3) 2 + (6 − 3) 2
σ= = 2.236
4
5. La media de la distribución muestral de medias es:
μx =
∑ ( fx ) = (0)(1) + (1)(2) + (2)(3) + (3)(4) + (4)(3) + (5)(2) + (6)(1) = 48 = 3
∑f 16 16
La desviación estándar de la distribución muestral de medias es:
σx = ∑ f (x − μ x )2
=
1(0 − 3) 2 + 2(1 − 3) 2 + 3(2 − 3) 2 + 4(3 − 3) 2 + 3(4 − 3) 2 + 2(5 − 3) 2 + 1(6 − 3) 2
= 1.58
∑f 16
Notar que:
σ 2.236
σx = = = 1.58
n 1.414213
6. Distribución muestral de Proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investigar la proporción de artículos
defectuosos o la proporción de personas con teléfono, etc en la muestra.
La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones.
Esta distribución se genera de igual manera que la distribución muestral de
medias, a excepción de que al extraer las muestras de la población se
calcula el estadístico proporción (p=x/n en donde “x” es el número de
éxitos u observaciones de interés y “n” el tamaño de la muestra) en lugar
de la media de cada muestra que era lo que calculamos antes.
7. El siguiente diagrama sirve para explicar el concepto de distribución
muestral de proporciones.
8. La distribución muestral de proporciones está estrechamente relacionada
con la distribución binomial; una distribución binomial es una distribución
del total de éxitos en las muestras, mientras que una distribución de
proporciones es la distribución de un promedio (media) de los éxitos.
Como consecuencia de esta relación, las afirmaciones probabilísticas
referentes a la proporción muestral pueden
evaluarse usando la aproximación normal a la binomial, siempre que:
np ≥ 5 y n(1-p) ≥ 5
Como vimos, una distribución binomial es por ejemplo, si echamos una
moneda al aire y observamos el lado que cae. Está claro que sólo hay dos
posibilidades. Ahora bien, la probabilidad de que caiga la moneda de
cualquier lado es la misma siempre que ésta no esté cargada. Como cada
caso tiene igual probabilidad de ocurrir, y siendo la suma de probabilidades
siempre igual a 1, entonces la probabilidad de que caiga la moneda de
algún lado es 0.5.
Si realizamos el experimento n veces y queremos saber la probabilidad de
que salga águila o sol x veces, entonces usamos una distribución binomial.
9. Generación de la Distribución Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos
defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin
reemplazo. Vamos a generar la distribución muestral de proporciones para
el número de piezas defectuosas. Como se puede observar en este
ejercicio la proporción de artículos defectuosos de esta población es
P = 4/12=1/3.
Por lo que podemos decir que el 33% de las piezas de este lote están
defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de
12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente
manera:
10. Para calcular la media de la distribución muestral de proporciones se
tendría que hacer la sumatoria de la frecuencia por el valor de la
proporción muestral y dividirla entre el número total de muestras. Esto es:
(0.8 ⋅ 8) + (0.6 ⋅112) + (0.4 ⋅ 336) + (0.2 ⋅ 280) + (0 ⋅ 56) 1
μp = = = 0.333
792 3
Como podemos observar la media de la distribución muestral de
proporciones es igual a la proporción de la población.
μp = P
11. La desviación estándar de la distribución muestral de proporciones del
ejemplo se puede calcular directamente con los datos:
(0.8 − 0.33) 2 ⋅ 8 + (0.6 − 0.33) 2 ⋅112 + (0.4 − 0.33) 2 ⋅ 336 + (0.2 − 0.33) 2 ⋅ 280 + (0 − 0.33) 2 ⋅ 56
σp = = 0.168
792
Sin embargo, podemos usar la distribución binomial lo cual nos da la
siguiente fórmula para la desviación estándar de la distribución muestral de
proporciones:
P (1 − P )
σp =
n
Notar que P es la
proporción de la población
pero n es el tamaño de la
muestra
12. Cuando, como vimos antes, si contamos con una población finita y un
muestreo sin reemplazo, para calcular la desviación estándar usamos la
corrección (Como regla aproximada, si el muestreo se hace sin reemplazo
y el tamaño de la población es al menos 20 veces el tamaño de la muestra,
entonces se puede usar la fórmula).
:
P (1 − P ) N − n
σp =
n N −1
Para el ejemplo anterior tendríamos la siguiente distribución de
probabilidades:
13. La fórmula que se utilizará para el cálculo de probabilidad en una
distribución muestral de proporciones está basada en la aproximación de la
distribución binomial a la normal . Esta fórmula nos servirá para calcular la
probabilidad del comportamiento de la proporción en la muestra.
p− P
z=
P (1 − P )
n
A la fórmula anterior se le puede agregar el factor de corrección (en el
denominador):
p− P
z=
P (1 − P ) N − n
n N −1
si se cumplen con las condiciones mencionadas anteriormente de que sea
una población finita y sin reemplazo.
14. Ejemplo:
Se ha determinado que 85.1% de los estudiantes de una universidad
fuman cigarrillos. Se toma una muestra aleatoria de 200 estudiantes.
Calcular la probabilidad de que no más de 80% de alumnos de la muestra
fume.
Solución:
La media o valor esperado de la proporción muestral es de P=0.851, por lo
que:
p− P 0.800 − 0.851
z= = = −2.0255
P (1 − P ) 0.851(1 − 0.851)
n 200
15. Usando las tablas de valor z, para z = -2.02 encontramos que la
probabilidad de que no más de 80% de los alumnos de la muestra fumen
es de 0.0214 o sea 2.14%
0.0214
16. Actividad 1.
Suponer que de la gente que solicita ingresar a una compañía, 40%
pueden aprobar un examen de artimética para obtener el trabajo. Si se
tomara una muestra de 20 solicitantes, ¿Cuál sería la probabilidad de que
50% o más de ellos aprobaran?
Datos:
P = 0.40, n = 20, p = 0.50
p− P 0.50 − 0.40
z= = = 0.9129
P (1 − P ) 0.40(1 − 0.40)
n 20
17. Usando tablas de valor o calificación z, o un programa para distribución
normal estándar (como Minitab, etc.), encontramos que el área bajo la
curva hasta un valor de z = 0.9129 es de 0.81935, o sea que
(1- 0.81935) = 0.1806,
por lo que la probabilidad de que 50% o más aprobaran es de 18.06% .
El área desde - ∞ hasta z= 0.9129
es de 0.81935
18. Cómo calcular probabilidades normales usando MINITAB (versión en
inglés):
• En el menú superior: Calc > Probability Distributions > Normal
• Tenemos 3 opciones:
– Probability density – Esta nos da el valor de la función de densidad, f(x)
para un valor específico de x. Esto no nos es muy útil en esta clase.
– Cumulative Probability – Esta nos da el área bajo la curva hasta un
valor z específico. Usamos esto para encontrar probabilidades.
– Inverse Cumulative Probability – Esto nos da el valor z para una área
específica bajo la curva. Esto lo usamos para encontrar valores críticos.
• Hacer Click en la opción que queremos.
• Se introduce la media y la desviación estándar de la distribución
normal que estamos usando.
• En el caso de la estándar normal (Z) introducimos N(0,1).
• Hacemos Click en “input constant” e introducimos el valor de x (x-
value) para la opción 1, el valor z para la opción 2, o la probabilidad
para la opción 3.
19. Ejemplo: Cuál es la probabilidad de que tengamos un valor mayor a 60 si
tenemos datos con una distribución normal con media 55 y deviación
estándar de 4?
Esto es, encontrar P(x > 60).
20. Como puede verse en la figura, el resultado que se obtiene es que P(X < 60)
= 0.8964. Notar que nos da los valores de la probabilidad de que X sea menor
al valor dado, por lo que para nuestro problema:
P(X > 60) = 1 - 0.8964 = 0.1036
21. Si lo que queremos es el área para una calificación Z (normal estándar)
entonces, como se explicó, podemos introducir una media igual a 0 y una
desviación estándar de 1.0, e introducir el valor de Z para el cual queremos
encontrar la probabilidad.
Poner media = 0
Poner σ = 1.0
Poner z = valor de interés