Criterios ESG: fundamentos, aplicaciones y beneficios
PRUEBA DE HIPOTESIS I 2019-2 (3).pptx
1. INFERENCIA ESTADISTICA
PRUEBA DE HIPOTESIS
Profesor: Kennedy Hurtado Ibarra.
Licenciado en Matemática y Física
Especialista en Estadística Aplicada
Magister en Estadística Aplicada
Doctor en Ciencias de la Educación
Celular: 3002426058
Kennedyhurtado@dcc.uniatlantico.edu.co
Referencia: Llinas Humberto, Estadística Inferencial.
Canavo George, Probabilidad y Estadística Aplicaciones y Métodos.
Montgomery Douglas. Probabilidad y Estadística para Ingeniería.
2. PRUEBA DE HIPOTESIS.
• Introducción
• Concepto de prueba de hipótesis
• Error de tipo I y II
• Prueba de hipótesis para la media.
• Prueba de hipótesis para una proporción
muestral.
• Prueba de hipótesis de diferencia de dos
proporciones muestrales.
• Prueba de hipótesis de diferencia de medias.
• Prueba de hipotesis para la varianza.
• Prueba de hipótesis para la razón de varianza
CONTENIDO PRUEBA DE
HIPOTESIS
3. Objetivos del capitulo
1. Explicar el lenguaje de una prueba de
hipótesis.
2. Estudiar los tipos de errores asociados con
una prueba de hipótesis.
3. Aprender cuándo usar pruebas de una cola
y cuándo pruebas de dos colas.
4. Realizar pruebas de hipótesis para la media,
proporción, diferencia de dos medias,
diferencia de dos proporciones, varianza y
razón de dos varianzas.
4. Conceptos de la prueba de hipótesis
En capítulos anteriores, hemos visto que la información obtenida a partir de
muestras aleatorias sirve para estimar los parámetros desconocidos de la
población mediante el cálculo de los estimadores puntuales o intervalos de
confinaza. Por otro lado, en este capítulo, veremos que la información muestral
también se puede utilizar para probar la validez de una afirmación, conjetura o
hipótesis acerca del valor del parámetro de la población.
Definición:
Una hipótesis estadística es una afirmación cuantitativa acerca de una o más
poblaciones, o mejor, como es más frecuente, afirmaciones sobre uno o más
parámetros de una o más poblaciones.
5.
6.
7. Hipótesis nula y Alternativa.
La hipótesis nula:
Que se simboliza por 𝐻0 y que es la hipótesis que se debe comprobar. Es una
afirmación en la que se dice que no hay diferencia alguna entre dos poblaciones,
entre dos parámetros poblacionales o entre el valor verdadero de algún parámetro
y su valor hipotético.
La hipótesis alternativa:
Simbolizada por 𝐻1, se establece como el “complemento” de la hipótesis nula y
representa la conclusión que se apoya si la hipótesis nula se rechaza.
8. Errores de tipo I y de tipo II
Generalmente se acostumbra discutir las decisiones con respecto a la
hipótesis nula. Hay dos posibles decisiones:
1. Aceptar la hipótesis nula (o rechazar la alternativa).
2. Rechazar la hipótesis nula (o aceptar la alternativa).
Definición: Error de Tipo I.
Si rechazamos la hipótesis nula cuando en realidad es verdadera, hemos
cometido un error; este evento lo llamamos un error de tipo I.
9. Definición: Error de Tipo II.
Si aceptamos la hipótesis nula cuando es falsa,
hemos cometido otro tipo de error; lo llamamos un
error de tipo II.
• P(error de tipo I) = P(rechazar 𝐻0/𝐻0 es
verdadera) = α.
• P(error de tipo II) = P(aceptar𝐻0/𝐻0 es falsa) = β.
La probabilidad α se llama nivel de significancia, 1−α
es el llamado grado de confianza y la probabilidad
1−β se llama potencia de la prueba.
10. Ejemplo:
Suponga que un nuevo procedimiento y más caro para detectar el cáncer de mama
en las mujeres se está probando para ver si es superior al método usado
generalmente. Las hipótesis estadísticas son:
𝐻0: El nuevo método no es mejor que el comúnmente usado.
𝐻1: El nuevo método es mejor que el comúnmente usado.
Obsérvese que las consecuencias de cometer un error de tipo I incrementarían los
costos médicos. En cambio, las de cometer un error de tipo II serian una menor
eficacia de la prueba y, posiblemente, una mayor proporción de muertes por cáncer.
11. EJEMPLO:
Supongamos que un individuo es juzgado por cierto delito que supuestamente
ha cometido. En este caso, las hipótesis a tener en cuenta son:
𝐻0: El individuo es inocente.
𝐻1: El individuo es culpable.
Estadístico de prueba y región critica
Dos “elementos” importantes que se deben tener en cuanta para realizar una
prueba de hipótesis son el estadístico de prueba y la región crítica.
12. Definición:
Un estadístico de prueba es una función que sólo depende de la información
muestral que se utiliza para determinar si se rechaza, o no, la hipótesis nula. (es
un valor que determina si aceptar o rechazar una hipótesis nula)
La región crítica es el conjunto de todos los valores del estadístico de prueba
para los cuales la hipótesis nula será rechazada.
Entonces, la hipótesis nula será rechazada si y sólo si el valor observado o
calculado del estadístico de prueba se ubica en la región de rechazo.
El estadístico de prueba se determina teniendo en cuenta el parámetro sobre el
cual se hace la hipótesis y la naturaleza de la distribución muestral del estadístico
pertinente.
13. Ejemplo:
Supongamos que, de una población distribuida normalmente con varianza 𝜎2
, se
selecciona una muestra aleatoria simple de tamaño n, con media 𝑥 y varianza
𝑠2
. Además, supongamos que se quiere probar la hipótesis nula
𝐻0 : µ = µ0
, siendo µ0 un número real dado.
(a)Si σ es conocida, el estadístico de prueba que se usa para verificar una
hipótesis sobre la media poblacional es:
z =
𝑥−µ
σ
𝑛
el cual se distribuye como la distribución normal estándar.
(b) Si σ es desconocida, entonces, bajo ciertas condicones, el estadístico de
prueba que se usa para verificar una hipótesis sobre la media poblacional es:
t =
𝑥−µ
s
𝑛
El cual se distribuye como la distribución t de Student con n−1 grados de libertad.
14. PASOS PARA REALIZAR UN CONTRASTE DE HIPOTESIS
• Determinar las hipotesis
𝐻0 :µ =µ0
, 𝐻0: µ ≥µ0
, 𝐻0 :µ ≤ µ0
.
𝐻1 :µ≠ µ0
, 𝐻1: µ <µ0
, 𝐻1 :µ > µ0
.
15. • Determinar el estadístico de prueba.
z =
𝑥−µ
σ
𝑛
,
si la varianza poblacional σ2
es conocida
Si n es ≥ 30.
t =
𝑥−µ
s
𝑛
,
Si la varianza poblacional σ2es desconocida
Si n es <30.
Para la proporción el estadístico de prueba es:
Z =
𝑝−𝑝0
𝑝0(1−𝑝0)
𝑛
Si n es ≥ 30
Si np ≥ 5 y n(1-p) ≥ 5
17. Prueba para la media
Como se ha hecho anteriormente, nuevamente realizaremos el estudio de las
pruebas de hipótesis para la media poblacional teniendo en cuenta dos casos: el caso
de tener muestras grandes y el de tener muestras pequeñas.
El caso de muestras grandes
Cuando estemos considerando o bien una población normal (con cualquier tamaño
de muestra) o bien una población de forma desconocida con muestras grandes (n ≥
30) y bajo el supuesto de que la varianza poblacional es conocida o desconocida,
aunque sea por razones distintas, los resultados son los mismos. En estos casos, la
distribución muestral de la media muestral es la distribución normal.
Para cualquiera de los tres casos siguientes que podemos considerar para la
hipótesis nula :
𝐻0 :µ =µ0
, 𝐻0: µ ≥µ0
, 𝐻0 :µ ≤ µ0
.
18. Reglas de decisión para la prueba de µ (caso de muestras grandes).
Tipo de hipótesis Regla de decisiones
H0 : µ = µ0 Si Z ≥ Zα/2 o si Z ≤ -Zα/2; entonces, se
H1 : µ ≠ µ0 Rechaza H0; de lo contrario, se acepta H0
Dos colas (Prueba bilateral)
H0 : µ ≥ µ0 Si Z ≤ -Zα; entonces,
H1 : µ < µ0 se Rechaza H0; de lo contrario, se acepta H0
Cola a la izquierda (Prueba unilateral)
H0 : µ ≤ µ0 Si Z ≥ Zα; entonces,
H1 : µ > µ0 se Rechaza H0; de lo contrario, se acepta H0
Cola a la derecha (Prueba Unilateral)
19. Teorema:
Sea 𝑥 la media de una muestra aleatoria de tamaño n tomada de una población con
media µ y varianza σ2
> 0. Supongamos que se cumple alguna de las siguientes
condiciones:
(a)La población es normal y σ2 es conocida (no importa el tamaño de n).
(b) La población es normal, σ2
es desconocida y n ≥ 30.
(c) La forma de la población es desconocida (o no normal), σ2 es conocida o
desconocida y n ≥ 30.
Entonces, una prueba de hipótesis con nivel de significancia α para la media µ es
como se presenta en la anterior.
siendo z =
𝑥−µ
σ
𝑛
el estadístico de prueba correspondiente y 𝑍α/2el valor de una
variable aleatoria a la derecha del cual se tiene un área de α/2 en la distribución
normal.
20. Si la población es finita de tamaño N y el muestreo se hace sin reemplazo, se
reemplaza
σ
𝑛
por
σ
𝑛
𝑁−𝑛
𝑁−1
.
Además, en los casos en que la varianza sea desconocida y
n ≥ 30, reemplazamos la desviación poblacional σ por la desviación muestral.
Ejemplo:
Como parte de un proceso de ensamblaje, se usa un taladro para hacer
agujeros en una lámina de metal. Cuando el taladro funciona
adecuadamente, los diámetros de estos agujeros tienen una distribución
normal con media de 2 centímetros y desviación típica de 0,06 centímetros.
Periódicamente, se miden los diámetros de una muestra aleatoria de
agujeros para controlar que el taladro funciona adecuadamente. Asumamos
que la desviación típica no varía. Una muestra aleatoria de nueve medidas da
un diámetro medio de 1,95 centímetros. Probar la hipótesis de que la media
poblacional es 2 centímetros frente a la alternativa de que no es así. Use un
nivel de significancia de 0,05
21. SOLUCION:
Sea µ el diámetro medio poblacional (en centímetros). Entonces, queremos
contrastar la hipótesis:
𝐻0: µ = 2
𝐻1: µ ≠ 2.
Tenemos que la población es normal con:
σ = 0,06 (conocida),
n = 9
𝑥= 1,95.
Obsérvese que se cumple el supuesto (a). En este caso, µ0 = 2 y el valor del
estadístico de prueba está dado por:
22. z=
𝑥−µ
σ
𝑛
= z =
1,95−2
0,06
9
= -2,50
Para una prueba al nivel del 5%, tenemos que α = 0,05 y 𝑧α/2 =𝑧0,025 = 1,96.
Entonces, como Z = −2,50 es menor que 𝑧α/2 = -1,96, se rechaza la hipótesis
nula al nivel de significancia del 5%.
23. Ejercicio:
Una muestra aleatoria de 100 muertes registradas en cierto país durante el año
pasado mostró una vida promedio de 71,8 años. Suponiendo una desviación
estándar poblacional de 8,9 años, ¿parecería esto indicar que la vida promedio hoy
en día es mayor que 70 años? Utilice un nivel de significancia del 5%.
24. Caso de muestra pequeñas
Reglas de decisión para la prueba de µ con muestras pequeñas:
Tipo de hipótesis Regla de decisiones
H0 : µ = µ0 Si t ≥ tα/2 o si t ≤ -tα/2; entonces, se
H1 : µ ≠ µ0 Rechaza H0; de lo contrario, se acepta H0
Dos colas (Prueba bilateral)
H0 : µ ≥ µ0 Si t ≤ -tα; entonces,
H1 : µ < µ0 se Rechaza H0; de lo contrario, se acepta H0
Cola a la izquierda (Prueba unilateral)
H0 : µ ≤ µ0 Si t ≥ tα; entonces,
H1 : µ > µ0 se Rechaza H0; de lo contrario, se acepta H0
Cola a la derecha (Prueba Unilateral)
25. Teorema:
Sea 𝑥 y 𝑠2 la media y la varianza de una muestra aleatoria de tamaño n < 30,
tomada de una población con media µ y varianza σ2 desconocida.
Entonces, una prueba de hipótesis con nivel de significancia α para la media µ es
como se presenta en la tabla anterior.
siendo t =
𝑥−µ
s
𝑛
el estadístico de prueba correspondiente y 𝑡α/2el valor de una
variable aleatoria a la derecha del cual se tiene un área de α/2 en la distribución . en
la distribución t de Student con n−1 grados de libertad.
Si la población es finita de tamaño N, se reemplaza
𝑠
𝑛
por
𝑠
𝑛
𝑁 −𝑛
𝑁−1
Es importar enfatizar que cuando la forma de la distribución de la población es
desconocida o es no normal, entonces, no hay ningún método general para
establecer una prueba de hipótesis para la media poblacional µ.
26. Ejemplo:
Los pesos en libras de una muestra aleatoria de bebés de seis meses son: 14.6, 12.5,
15.3, 16.1, 14.4, 12.9, 13.7 y 14.9.Haga una prueba con nivel de 5% de significancia para
determinar si el peso promedio de todos los bebés de seis meses es distinto a 14
libras, suponga que sus pesos se distribuyen normalmente.
Solución:
µ = 14 libras H0 : µ = µ0 , H1 : µ ≠ µ0
S = 1,21 libras siendo t =
𝑥−µ
s
𝑛
=
14,3−14
1,21
8
= 0,7012
𝑥 = 14,3 libras
n = 8
α = 0,05
Como -2,365 ≤ 0,7012 ≤ 2,365, por lo tanto no se rechaza 𝐻0 y se concluye con un
Nivel de significancia de 0,05 que el peso promedio de todos los bebés de seis meses
es de 14 libras.
27. VALOR – P
La elección del nivel de significación, tal y como se ha comentado anteriormente,
es en cierta forma arbitraria.
Sin embargo, una vez obtenida la muestra, se puede calcular una cantidad que
permite resumir el resultado del experimento de manera objetiva.
Definición.
El valor p es el nivel de significancia más pequeño posible que conduce al rechazo
de la hipótesis nula 𝐻0.
Definición de nivel de significancia.
El nivel de significación es el riesgo o la probabilidad que voluntariamente asume
el investigador de equivocarse al rechazar la hipótesis nula, cuando en realidad es
cierta. Este riesgo se establece normalmente en 0.10 (90%); 0.05 (95%) ó 0.01
(99%).
Si p < 0.05 se considera significativo, en cuyo caso se rechaza la hipótesis nula
Si p> 0.05 se considera no significativo en cuyo caso no se rechaza la hipótesis
nula.
28. Consideraciones:
• Se rechaza la hipótesis nula si el valor p asociado al resultado observado es igual o
menor que el nivel de significación establecido, convencionalmente 0,10; 0,05 ó 0,01.
• El valor p puede considerarse como el nivel de significancia α más pequeño para el
que los datos sean significativos.
Para las pruebas de distribuciones normales, es relativamente sencillo calcular el valor
p. Si z es el valor calculado del estadístico de prueba, entonces el valor p es:
1° 2 1 − ᶲ( 𝑧 ) para una prueba de dos cola
H0 : µ = µ0
H1 : µ ≠ µ0
2° 1- ᶲ(z) para una prueba de cola superior
H0 : µ ≤ µ0
H1 : µ > µ0
3° ᶲ(z) para una prueba de cola inferior
H0 : µ ≥ µ0
H1 : µ < µ0
29. EJEMPLO:
si el valor calculado de z = 3,25 y supongamos que el tipo de hipótesis es de dos cola , el valor p es:
Valor-P = 2 1 − ᶲ( 𝑧 ) = 2 1 − ᶲ(3,25) = 0,0012
Por tanto H0 : µ = µ0 se rechaza con cualquier nivel de significancia α ≥ p = 0,0012
Entonces la hipótesis nula 𝐻0 será rechazada si α = 0,01, pero no será rechazada si α = 0,001.
EJEMPLO:
El espesor objetivo de obleas de silicio utilizadas en cierto tipo de circuito integrado es de 245 m. De una
muestra de 50 obleas, cada una con un espesor determinado, se obtiene una media de espesor de 246.18
m y una desviación estándar de 3.60 m. ¿Sugieren estos datos que el espesor de oblea promedio
verdadero es algún otro diferente del valor objetivo.
H0 : µ = 245
H1 : µ ≠ 245
z =
𝑥−µ
σ
𝑛
=
246,18−245
3,60
50
=2,32
Determinación del valor P: Como la prueba es de dos colas, Valor P = 2(1 -ᶲ(2.32)) = 0.0204
CONCLUSION:
Con un nivel significativo de 0.01, 𝐻0 no sería rechazada puesto que 0.0204 > 0.01. A este nivel de
significación, existe suficiente evidencia para concluir que el espesor promedio
verdadero difiere del valor objetivo.
30. Pruebas para la proporción
En muchos problemas prácticos, queremos probar hipótesis sobre la proporción p de
elementos de una población que poseen cierto atributo.
Reglas de decisión para la prueba de p (caso de muestras grandes).
Tipo de hipótesis Regla de decisiones
H0 : p = p0 Si Z ≥ Zα/2 o si Z ≤ -Zα/2; entonces, se
H1 : p ≠ p0 Rechaza H0; de lo contrario, se acepta H0
Dos colas (Prueba bilateral)
H0 : p ≥ p0 Si Z ≤ -Zα; entonces,
H1 : p < p0 se Rechaza H0; de lo contrario, se acepta H0
Cola a la izquierda (Prueba unilateral)
H0 : p ≤ p0 Si Z ≥ Zα; entonces,
H1 : p > p0 se Rechaza H0; de lo contrario, se acepta H0
Cola a la derecha (Prueba Unilateral)
31. Teorema:
Sea 𝑝 la proporción de éxitos en una muestra aleatoria de tamaño n, procedente de
un población con proporción p éxitos. Supongamos que se cumple alguna de las
dos siguientes condiciones:
(a) n ≥ 30;
(b) np ≥ 5 y n(1−p) ≥ 5.
Entonces, una prueba de hipótesis con nivel de significancia α para la proporción p
es como se presenta en la tabla.
siendo Z =
𝑝−𝑝0
𝑝0(1−𝑝0)
𝑛
, el estadístico de prueba correspondiente y 𝑍α/2 el valor de una
variable aleatoria a la derecha del cual se tiene un área de α/2 en la distribución
normal.
Para el caso de una población finita de tamaño N, debemos reemplazar
𝑝0(1−𝑝0)
𝑛
por la cantidad
𝑝0(1−𝑝0)
𝑛
𝑁−𝑛
𝑁−1
32. Ejemplo:
De una muestra aleatoria de 802 clientes de supermercados, suponga que 378 pagaron
sus artículos con tarjetas de crédito. Contrastar el nivel del 10%, la hipótesis nula de que al
menos la mitad de los compradores pagan sus artículos con tarjetas de crédito frente a la
alternativa de que la proporción poblacional es menor de la mitad.
SOLUCION:
Sea 𝑃 la proporción poblacional de compradores que pagan sus artículos con tarjetas de
crédito. Queremos probar la hipótesis
𝐻0 : p ≥ 0,50 versus : 𝐻1: 𝑝 < 0,50
33. Obsérvese que puede aplicar el teorema, porque el supuesto (a) del teorema se cumple.
En este caso, el valor del estadístico de prueba esta´ dado por
𝑝=
378
802
= 0,471
Z =
𝑝−𝑝0
𝑝0(1−𝑝0)
𝑛
=
0,471−0,50
0,50 (0,50)
802
= -1,64
Para una prueba al nivel del 10%, tenemos que α = 0,10 y Zα = 𝑍0,10 = 1,28. Entonces, como
Z = −1,64 es menor que −Zα = −1,28, se rechaza la hipótesis nula al nivel de significancia del
10%.
34. Ejercicio:
Un doctor afirma que el 12% de todas las citas son canceladas, durante un periodo de
seis semanas, fueron canceladas 21 de las 200 citas del doctor. Haga una prueba con
un nivel de significancia del 5% para determinar si la verdadera proporción de todas las
citas que son canceladas es diferente del 12%.
35. Prueba para la diferencia de dos proporciones
Volvamos sobre el problema de comparación de dos proporciones poblacionales.
Teorema:
Sea 𝑃1 la proporción de éxitos observada en una muestra aleatoria de tamaño 𝑛1,
procedente de una población con proporción 𝑃1 de éxitos, y sea 𝑝2 la proporción de
éxitos observada en una muestra aleatoria independiente de tamaño 𝑛2, procedente
de una población con proporción de éxitos 𝑃2 . Supongamos que se cumple alguna de
las siguientes dos condiciones:
(a) 𝑛1 ≥ 30 y 𝑛2 ≥ 30;
(b) 𝑛1 𝑝1≥ 5, 𝑛1(1−𝑝1) ≥ 5, 𝑛2𝑝2 ≥ 5 y 𝑛2(1−𝑝2) ≥ 5.
Entonces, una prueba de hipótesis con nivel de significancia α para la diferencia de
proporciones 𝑝1 - 𝑝2 es como se presenta en la tabla, siendo: