Un intervalo de confianza para
una proporción de población
Dr. José Luis
Pérez Ramírez
DOCENTE:
ESTADÍSTICA EMPRESARIAL
UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN
UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN
FACULTAD DE INGENIERIA INDUSTRIAL,SISTEMAS E INFORMATICA
FACULTAD DE INGENIERIA INDUSTRIAL,SISTEMAS E INFORMATICA
ESCUELA PROFESIONAL DE INGENIERÍA INDUSTRIAL
ESCUELA PROFESIONAL DE INGENIERÍA INDUSTRIAL
Cuanto mayor sea la muestra,
menor será el intervalo estimado,
pero a medida que aumenta el
nivel de confianza o el porcentaje,
el intervalo estimado se vuelve
más amplio. Si desea conocer
exactamente la media poblacional
de una variable, debe considerar
toda la población, pero esto no
siempre es posible porque es
costoso obtener datos para toda
la población cuando la población
es muy grande.
INTRODUCCIÓN
INTRODUCCIÓN
Los intervalos de confianza se
pueden usar para estimar varios
parámetros de la población a
partir de una muestra aleatoria
de la población y determinar la
incertidumbre asociada con esa
estimación. Por ejemplo,
podríamos querer saber qué
porcentaje de la población
peruana apoya una determinada
ley. Para este tipo de problema,
necesitamos encontrar un
intervalo de confianza.
ESTIMACIÓN POR
ESTIMACIÓN POR
INTERVALO DE CONFIANZA
INTERVALO DE CONFIANZA
PARA LA PROPORCIÓN
PARA LA PROPORCIÓN
POBLACIONAL
POBLACIONAL
Para determinar la fórmula del margen de error,
se debe considerar la distribución muestral de p ̂.
Necesitamos saber la media, la desviación
estándar y la distribución particular que estamos
usando. La distribución de muestreo p ̂ es una
distribución binomial con probabilidad de éxito p
y n intentos. La media p y la desviación estándar (
p (1 - p )/n ) de este tipo de variable aleatoria es
0,5.
LA PROPORCIÓN DE LA
LA PROPORCIÓN DE LA
POBLACIONAL
POBLACIONAL
El intervalo de confianza para la proporción poblacional se puede
calcular mediante la siguiente fórmula:
Intervalo de confianza = Estimación puntual ± Z* (Error estándar)
El error estándar se calcula como la desviación estándar
muestral dividida por la raíz cuadrada del tamaño muestral. Es
decir,
FÓRMULA DEL INTERVALO DE
FÓRMULA DEL INTERVALO DE
CONFIANZA DE LA PROPORCIÓN DE LA
CONFIANZA DE LA PROPORCIÓN DE LA
POBLACIONAL
POBLACIONAL
FÓRMULA DEL INTERVALO DE
FÓRMULA DEL INTERVALO DE
CONFIANZA DE LA PROPORCIÓN DE
CONFIANZA DE LA PROPORCIÓN DE
LA POBLACIONAL
LA POBLACIONAL
Por lo tanto, el intervalo de confianza para la
proporción poblacional se puede expresar como:
Tenemos una muestra aleatoria simple de tamaño n de una población
grande
Nuestras personas son seleccionadas independientemente unas de
otras.
Al menos 15 éxitos y 15 fracasos en nuestra muestra.
Antes de realizar una prueba o un procedimiento estadístico, es importante
asegurarse de que se cumplen todas las condiciones. Para determinar un
intervalo de confianza para una proporción poblacional, debemos
asegurarnos de que se cumplan las siguientes condiciones:
CONDICIONES PARA USAR EL
CONDICIONES PARA USAR EL
INTERVALO DE CONFIANZA DE LA
INTERVALO DE CONFIANZA DE LA
PROPORCIÓN DE LA POBLACIONAL
PROPORCIÓN DE LA POBLACIONAL
Use la siguiente
información para
responder los dos
próximos
ejercicios:
Compañías de mercadeo
están interesadas en
conocer el porcentaje
de población femenina
que toma la mayoría de
las decisiones de
compra en el hogar.
01. Al diseñar un estudio para determinar esta proporción de población,
¿cuál es el número mínimo que necesitaría encuestar para tener el 90
% de confianza en que la proporción de población se estima con un
margen del 0,05?
Para calcular el número mínimo de encuestas que se necesitan
para un estudio con un 90 % de confianza y un margen de 0,05,
se debe usar el cálculo de muestreo estadístico. Este cálculo
requiere que se conozca el tamaño de la población objetivo, el
porcentaje de respuesta esperado y la confianza deseada. Se
estima que el número mínimo de encuestas necesarias sería de
aproximadamente 492. Sin embargo, para obtener un resultado
más preciso, se recomienda aumentar el número de encuestas
para reducir el margen de error.
02. Si más adelante se determinara que es importante tener más de un
90 % de confianza y se encargara una nueva encuesta, ¿cómo afectaría
al número mínimo que hay que encuestar? ¿Por qué?
03. Identifique lo siguiente:
a. 𝑥̅=_______
b. n =_______
c. p´ =_______
a) El valor de 𝑥̅= 120
b) n es el tamaño de la muestra, que en este caso es
200.
c) p es la proporción de la muestra en la que el
resultado se observa, que en este caso es 0.6.
04. Defina las variables aleatorias X y P′ con palabras.
X es el número de “aciertos” en los que la
mujer toma la mayoría de las decisiones de
compra del hogar. P′ es el porcentaje de
hogares de la muestra en los que la mujer toma
la mayoría de las decisiones de compra del
hogar.
05. ¿Qué distribución debería utilizar para este problema?
Para este problema, se debe utilizar una distribución
binomial. Esta distribución se usa para calcular la
probabilidad de un número específico de éxitos (en este caso,
las mujeres toman la mayoría de las decisiones de compra) en
un número específico de intentos (en este caso, los 200
hogares). La distribución binomial puede calcular la
probabilidad de que una determinada cantidad de hogares tengan
una mujer tomando la mayoría de las decisiones de compra.
06. Construya un intervalo de confianza del 95 % para la proporción de hogares en
los que las mujeres toman la mayoría de las decisiones de compra. Indique el
intervalo de confianza, dibuje el gráfico y calcule el límite de error.
CI: (0,5321, 0,6679)
EBM: 0,0679
Primero, los destinatarios pueden optar por no responder la encuesta, lo que puede provocar un sesgo
en los resultados.
Segundo, el correo electrónico puede ser enviado a direcciones de correo electrónico incorrectas o no
existentes, lo que también afectaría los resultados.
La falta de control sobre el orden en el que los participantes responden a la encuesta. Debido a que los
correos electrónicos se envían de forma asíncrona, no hay ninguna forma de controlar el orden en el que
llegan las respuestas. Esto puede afectar la fiabilidad de los resultados.
El tiempo de respuesta puede ser impredecible. Debido a que los correos electrónicos se envían de
manera asíncrona, los participantes pueden tardar más o menos tiempo en responder a la encuesta. Esto
significa que los resultados pueden ser sesgados si algunos participantes demoran más tiempo en
responder.
Al realizar una encuesta por correo electrónico, hay cuatro principales dificultades para obtener
resultados aleatorios :
07. Enumere dos dificultades que podría tener la compañía para obtener
resultados aleatorios, si esta encuesta se realizara por correo electrónico.
Use la siguiente
información para
responder los
próximos cinco
ejercicios:
De 1.050 adultos seleccionados al
azar, 360 se identificaron como
trabajadores manuales, 280 se
identificaron como asalariados no
manuales, 250 se identificaron como
gerentes de nivel medio y 160 se
identificaron como ejecutivos. En la
encuesta, el 82 % de los
trabajadores manuales prefieren
camiones, así como el 62 % de los
asalariados no manuales, el 54 % de
los gerentes de nivel medio y el 26
% de los ejecutivos.
08. Nos interesa hallar el intervalo de confianza del 95 % para el
porcentaje de ejecutivos que prefieren camiones. Defina las variables
aleatorias X y P′ en palabras.
La variable aleatoria X representa el número de ejecutivos que
prefieren camiones en una muestra de tamaño n. La variable
aleatoria P' representa el porcentaje de ejecutivos que
prefieren camiones en la población total que es un valor
desconocido. El intervalo de confianza del 95 % para el
porcentaje de ejecutivos que prefieren camiones se puede
encontrar usando la siguiente fórmula: P' ± z1/2 * √(P' * (1-
P') / n), donde z1/2 es el punto crítico de la variable
aleatoria Normal estandarizada y n es el tamaño de la muestra
09. ¿Qué distribución debería utilizar para este problema?
Para este problema, se recomienda usar una
distribución de frecuencias relativas, que muestra el
porcentaje de personas que prefieren camiones para
cada grupo de trabajadores. Esto ayudará a mostrar la
distribución de preferencias entre los diferentes
grupos de trabajadores. Esta distribución se muestra a
continuación:
10. Construya un intervalo de confianza del 95 %. Indique el
intervalo de confianza, dibuje el gráfico y calcule el límite de
error
EBM: 0,0679
11. Supongamos que queremos reducir el error de muestreo.
¿Cuál es una forma de lograrlo?
Una forma de reducir el error de muestreo en esta encuesta
es aumentar el tamaño de la muestra. Cuanto mayor sea la
muestra, menor será el error de muestreo. También se pueden
aplicar otros métodos para reducir el error de muestreo,
como el muestreo estratificado. Esto implica dividir la
población en grupos o estratos homogéneos, y luego
seleccionar la misma cantidad de personas de cada estrato.
De esta manera, se reduce la variación entre los grupos y se
mejora la precisión de los resultados.
12. El error de muestreo indicado en la encuesta es de ±2
%. Explique qué significa el ±2 %.
15. ¿Qué distribución debería utilizar para este problema?
Para este problema, se debería utilizar una distribución
binomial, ya que se está preguntando acerca de la proporción
de población de los votantes que consideran que la economía
es lo más importante. La distribución binomial se utiliza
para calcular la probabilidad de obtener un resultado
específico al realizar una prueba con dos resultados posibles
(en este caso, los votantes consideran que la economía es lo
más importante o no). La distribución binomial se caracteriza
por dos parámetros: el número de ensayos (en este caso, el
número de votantes) y la probabilidad de éxito (en este caso,
la proporción de votantes que consideran que la economía es
lo más importante).
16. Construya un intervalo de confianza del 90 %, e indique el
intervalo de
confianza y el límite de error.
CI: (0,62735, 0,67265) EBM: 0,02265
17. ¿Qué ocurriría con el intervalo de confianza si el nivel de confianza fuera
del 95 %?
Si el nivel de confianza es 95% significa que dentro
del rango dado se encuentra el valor real de un
parámetro con 95% de certeza.
18. Nos interesa hallar el intervalo de confianza del 95 % para el porcentaje
de ejecutivos que prefieren camiones. Defina las variables aleatorias X y P′
en palabras.
X es el número de “aciertos” en los que un
ejecutivo prefiere una camioneta.
P′ es el porcentaje de ejecutivos de la
muestra que prefieren una camioneta.
19. ¿Qué distribución debería utilizar para este problema?
Distribución uniforme: Se debería utilizar la
distribución uniforme ya que es una familia de
funciones de probabilidad donde cada elemento,
dentro de cierto intervalo, tiene la misma
probabilidad de aparecer.
20. Construya un intervalo de confianza del 95 %. Indique el intervalo
de confianza, dibuje el gráfico y calcule el límite de error.
intervalo de confianza con un nivel de 95%
21. Supongamos que queremos reducir el error de
muestreo. ¿Cuál es una forma de lograrlo?
Una forma de reducir el error de muestreo es aumentar el tamaño de la
muestra. Cuanto mayor sea el tamaño de la muestra, menor será el error
de muestreo. También puede utilizar un muestreo especializado como el
muestreo estratificado o el muestreo por conglomerados para reducir el
error de muestreo. Otra forma de reducir el error de muestreo es
aumentar la confianza. Esto se puede lograr aumentando el nivel de
confianza al tomar la muestra. Por último, también puede aumentar la
precisión al reducir la variabilidad de la muestra.
22. El error de muestreo indicado en la encuesta es de ±2
%. Explique qué significa el ±2 %.
Esto significa que hay un 95 % de confianza de que los
resultados de la encuesta estén dentro del rango del ±2 %.
Esto se conoce como intervalo de confianza, y es una medida
de la precisión de la encuesta. Esto significa que, si se
realiza una segunda encuesta utilizando los mismos métodos,
hay un 95 % de probabilidades de que los resultados estén
dentro del rango del ±2 %.
Use la siguiente
información para
responder los
próximos 16
ejercicios:
El Ice Park de Lima ofrece docenas de
clases de patinaje sobre hielo para
principiantes. Todos los nombres de las
clases se ponen en una cubeta. Se eligió la
clase de patinaje sobre hielo para
principiantes de 8 a 12 años a las 5 p. m.
del lunes. En esa clase había 64 niñas y 16
niños. Supongamos que estamos interesados
en la proporción real de niñas, de 8 a 12
años, en todas las clases de patinaje sobre
hielo para principiantes en el Ice Chalet.
Supongamos que los niños de la clase
seleccionada son una muestra aleatoria de
la población.
26. Construya un intervalo de confianza del 90 %, e
indique el intervalo de confianza y el límite de error.
El intervalo de confianza del 90% para la proporción
de población de los votantes que consideran que la
economía es lo más importante es de 0.62 a 0.68, con
un límite de error de ±0.05. Esto significa que, con
un 90% de confianza, el porcentaje real de población
de los votantes que consideran que la economía es lo
más importante se encuentra entre el 62% y el 68%.
28. ¿Qué se cuenta?
Se busca el número de niñas entre 8 y 12 años en la
clase de iniciación al patinaje sobre hielo de los
lunes a las 5 p. m. en el ice Park de Lima.
29. Defina la variable aleatoria X en palabras.
Una variable aleatoria es un
valor numérico que corresponde
a un resultado de un
experimento aleatorio. La
variable aleatoria X en este
caso sería la proporción de
niñas de 8 a 12 años
registradas en todas las clases
de patinaje sobre hielo para
principiantes en el Ice Chalet.
30. Calcule lo siguiente:
a) x = 64 (es el tamaño de muestra de niñas de 8 - 12 años)
b) n = 64+16 =80 (Es el total de la muestra de niños y niñas
en la clase de patinaje a las 5pm)
c) p′ = 64/80 = 0.8 (la muestra proporcional es X/n
31. Indique la distribución estimada de X. X~________ .
La distribución estimada de X es una distribución binomial, ya
que estamos tratando con una muestra aleatoria de una población
con dos posibles resultados: niña o niño. La media de la
distribución binomial se determina con la formula: μ = np, donde
n es el tamaño de la muestra (80), y p es la proporción de niñas
en la población (64/80 = 0.8). La media de X es entonces 64. La
varianza de X se determina con la formula: σ2 = np(1-p), donde n
es el tamaño de la muestra (80), y p es la proporción de niñas
en la población (64/80 = 0.8). La varianza de X es entonces
25.6. Por lo tanto, la distribución estimada de X es una
distribución binomial con media μ = 64 y varianza σ2 = 25.6.
32. Defina una nueva variable aleatoria P′. ¿Qué estima p′? .
La variable aleatoria P' está definida como la proporción
de niñas, de 8 a 12 años, en todas las clases de patinaje
sobre hielo para principiantes en el Ice Chalet. Esto se
puede estimar usando la muestra seleccionada para calcular
el estimador de proporción para la variable aleatoria P',
que se define como el cociente entre el número de niñas en
la muestra y el número total de niños y niñas en la
muestra. En este caso, el estimador de proporción para la
variable aleatoria P' sería 64/80, lo que equivale a 0,8.
33. Defina la variable aleatoria P′ en palabras. .
La variable aleatoria P' representa la
proporción de niñas en todas las clases de
patinaje sobre hielo para principiantes en
el Ice Park de Lima. Se calcula como el
número de niñas entre el total de niños y
niñas que asisten a dichas clases.
34. Indique la distribución estimada de P′. Construya un
intervalo de confianza del 92 % para la verdadera
proporción de niñas de 8 a 12 años que comienzan las
clases de patinaje sobre hielo en el Ice Chalet.
TABLA DEL NIVEL DE CONFIANZA
TABLA DEL NIVEL DE CONFIANZA
P = 0.8
N= 80
Z= 1.751
0.72171
0.87829
Limite de error = Li - Ls
= 0.72171 - 0.87829 =
0.157658
El intervalo de confianza
seria:
(0.72171,0.87829)
35. ¿Cuánta superficie hay en ambas colas (combinadas)?
La superficie total en ambas colas combinadas es de 0.5.
Esto se deriva del hecho de que la proporción de niñas
presentes en la clase de patinaje seleccionada es de 80%,
lo que significa que hay una proporción de 0.8 de niñas en
la población de patinaje sobre hielo para principiantes en
el Ice Chalet. El valor Z para esta proporción es 1.28, lo
que significa que la superficie en ambas colas es de 0.5.
37. Calcule lo siguiente:
a) límite inferior
b) límite superior
c) límite de error
Para calcular la proporción real de niñas de 8 a 12
años en todas las clases de patinaje sobre hielo para
principiantes en el Ice Chalet, primero necesitamos
calcular el límite inferior, el límite superior y el
límite de error. El límite inferior se calcula usando
la siguiente fórmula:
Límite inferior = (Cantidad de niñas / (Cantidad de
niñas + Cantidad de niños)) - Límite de error
Por lo tanto, en este caso, el límite inferior es:
Límite inferior = (64 / (64 + 16)) - Límite de error =
0.8 - Límite de error
El límite superior se calcula usando la siguiente fórmula:
Límite superior = (Cantidad de niñas / (Cantidad de niñas +
Cantidad de niños)) + Límite de error
Por lo tanto, en este caso, el límite superior es:
Límite superior = (64 / (64 + 16)) + Límite de error = 0.8 +
Límite de error
Finalmente, el límite de error se calcula usando la siguiente
fórmula:
Límite de error = (1.96 * √(P * (1 - P) / N))
Donde P es el porcentaje de éxito (en este caso, la proporción de
niñas) y N es el tamaño de la muestra (en este caso, el número
total de niños y niñas en la clase). Por lo tanto, en este caso,
el límite de error es:
Límite de error = (1.96 * √(0.8 * (1 - 0.8) / 80)) = 0.094
n= 1050
p= 0.384761905
q= 0.615238095
z= 1.96
p(1-p)/n= 0.000225448
I.C (+) = 0.414191146
I.C (-) = 0.355332664
Lím. De Error= 0.029429241
39. Rellene los espacios en blanco del gráfico con las
áreas, los límites superior e inferior del intervalo de
confianza y la proporción de la muestra.
39. Rellene los espacios en blanco del gráfico con las
áreas, los límites superior e inferior del intervalo de
confianza y la proporción de la muestra.
40 explique el significado del intervalo en una oración
completa
Con el 92 % de confianza
estimamos que la
proporción de niñas de 8
a 12 años que asisten a
una clase de patinaje
sobre hielo para
principiantes en el Ice
Chalet se sitúa entre el
72 % y el 88 %.
41. Utilizando la misma p′ y el mismo nivel de confianza, supongamos
que n se aumenta a 100. ¿El límite de error sería mayor o menor?
¿Cómo lo sabe?
42. Utilizando la misma p′ y n = 80, ¿cómo cambiaría el límite de
error si el nivel de confianza se incrementara al 98 %? ¿Por
qué?
43. Si se disminuye el límite de error permitido, ¿por qué
aumentaría el tamaño mínimo de la muestra
(manteniendo el mismo nivel de confianza)
Si se disminuye el límite de error permitido, el tamaño
mínimo de la muestra aumentará para asegurar que se mantenga
el mismo nivel de confianza. Esto se debe a que cuanto mayor
sea el límite de error permitido, menor es la precisión de
los resultados de la muestra. Por lo tanto, para asegurar
que los resultados sean lo suficientemente precisos como
para confiar en su exactitud, el tamaño mínimo de la muestra
debe aumentar para reducir el límite de error permitido.