Este documento proporciona información sobre pruebas de hipótesis. Explica que una prueba de hipótesis es un procedimiento estadístico para decidir si se rechaza o no una hipótesis nula sobre una población, asumiendo un riesgo de error. Detalla los pasos para realizar una prueba de hipótesis, incluida la definición de hipótesis nula y alterna, el cálculo de estadísticas de prueba y la toma de decisiones basada en el nivel de significancia. También
2. ÁREAS DE LA INFERENCIA ESTADÍSTICA
INFERENCIA
ESTADÍSTICA
Estimación de
parámetros
Prueba de
hipótesis
Por punto
Por intervalosCalcular un valor que
corresponde a una
característica de la población
De orden cuantitativo.
Establece conclusiones sobre
alguna afirmación o supuesto
(hipótesis)
3.
4. Prueba de hipótesis
Rama de la inferencia estadística, denominada
docimacia de hipótesis o contraste de hipótesis.
Una hipótesis estadística es un supuesto acerca de
algún parámetro poblacional o sobre alguna situación
existente en la población.
Existen dos tipos de hipótesis estadísticas:
H. Nula, Ho
H. Alterna, H1
5. Prueba de hipótesis
Una prueba de hipótesis es un procedimiento
estadístico en el que a partir de una o más muestras
aleatorias, tomamos la decisión de rechazar o no un
supuesto (hipótesis) acerca de la población,
asumiendo un riesgo (probabilidad de error) de
equivocarnos al tomar la decisión.
Para el proceso de prueba de hipótesis es necesario que
primero se considere de manera clara lo que se desea
probar y expresarlo de modo verbal, luego en términos de
medidas estadísticas de a variable bajo estudio.
Teach point
6. Tipos de hipótesis
Es la hipótesis que el procedimiento estadístico
somete a prueba, se formula como supuesto de no
diferencia o igualdad para el valor poblacional, o
como un supuesto de no asociación de dos variables
Sirve para contrastar la hipótesis nula, usualmente se
formula como un supuesto de diferencia. Es la hipótesis de
trabajo y la que se espera sea apoyada por los datos de la
muestra
1. Hipótesis nula
2. Hipótesis alterna
Se plantea esperando ser rechazada (que los datos de
la muestra no la apoyen) y es la que somete a
contrastación
7. Tipos de hipótesis
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es de 5%
Ho: P=0,05
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es menor al 5%
Ho: P<0,05
1. Hipótesis nula 2. Hipótesis alterna
El nivel promedio de glicemia en pacientes
con diabetes tipo II del distrito de Huancán es
210mg
Ho: μ= 210mg
El nivel promedio de glicemia en pacientes con
diabetes tipo II del distrito de Huancán es mayor
de 210mg
Ho: μ> 210mg
La prevalencia de parasitosis intestinal en los
niños preescolares del asentamiento humano
JPH es igual a la de los niños preescolares del
distrito de El Tambo
Ho: P1=P2
La prevalencia de parasitosis intestinal en los
niños preescolares del asentamiento humano
JPH es mayor a la de los niños preescolares
del distrito de El Tambo
Ho: P1>P2
8. Procedimiento a seguir para la realización de
una prueba de hipótesis
Defina con claridad los supuestos que se
plantean en la investigación
Identifique el tipo de variable en estudio
relacionada con las suposiciones
Identifique la o las poblaciones bajo
estudio
Elija la prueba estadística apropiada para
la prueba de hipótesis planteadas
Plantee las hipótesis nula y alterna
Calcule la estadística de la prueba con los
datos obtenidos para este fin
Pre-determine el nivel de significancia
para la región de rechazo
Tome la decisión comparando el nivel
crítico (p) con el nivel de significancia (α)
Obtenga el nivel crítico para el resultado
obtenido con la muestra
9. Al tomar la decisión respecto a la Ho, se puede correr el riesgo de cometer dos
distintos tipos de error:
DECISIÓN
Planteamiento (situación poblacional)
Ho CIERTA Ho Falsa
Rechazar Ho Error tipo I
Probabilidad = α (ρ)
«nivel de significación»
Decisión acertada
Probabilidad = (1-β)
«potencia»
No rechazar Ho Decisión acertada
Probabilidad = (1-α)
«nivel de confianza»
Error tipo II
Probabilidad = β
PRUEBA DE HIPÓTESIS
11. Las cuatro son probabilidades condicionales, así:
α = probabilidad de rechazar Ho, cuando Ho es cierta
1-α = probabilidad de no rechazar Ho, cuando Ho es cierta
β = probabilidad de no rechazar Ho, cuando Ho es falsa
1-β = probabilidad de rechazar Ho, cuando Ho es falsa
PRUEBA DE HIPÓTESIS
Alfa y Beta se relacionan de manera inversa: al
decrecer una aumenta la otra. Habitualmente α está
bajo nuestro control; pero β sólo está en forma
indirecta mediante su relación inversa que tiene con α.
12. En investigaciones biomédicas el nivel de confianza
más usado es 95%; es decir (1-α) = 0,95; luego el nivel
de significancia más usado es 5% (α=0,05). De la
misma forma la potencia más usada es 80% es decir
(1- β) = 0,80, entonces β= 0,20.
Existe una igualdad empírica entre los valores de α y β,
que ayuda a fijar el valor de β para un valor elegido de
α:
β = 4α
13. Comparación de dos medias de poblaciones
independientes y relacionadas
PRUEBA DE HIPÓTESIS
14. Diferencia (comparación) de dos medias de
poblaciones independientes
PRUEBA DE HIPÓTESIS
Se contrastará alguna de las hipótesis que sigue:
Ho: μ1 = μ2
H1: μ1 ≠ μ2
bilateral
Ho: μ1 ≥ μ2
H1: μ1 < μ2
unilateral
Ho: μ1 ≤ μ2
H1: μ1 > μ2
unilateral
16. Diferencia (comparación) de dos medias
de poblaciones independientes
EJEMPLO
Mediante un experimento se desea evaluar el efecto de las dietas A y B en la
ganancia de peso, usando dos grupos de animales experimentales. El grupo 1
recibirá la dieta A (enriquecida) y el grupo 2 la dieta B (convencional).
Los investigadores desean determinar si con la dieta A, los animales ganarán mayor
peso que con la B.
Después de 5 semanas de seguimiento se calculó el incremento de peso para cada
animal. Los resultados fueron:
Grupo 1: muestra 12, media de las
ganancias de peso: 27,2g con una
desviación estándar de 6,0g
Grupo 2: muestra 12, media de las
ganancias de peso: 21,2g con una
desviación estándar de 3,8g
17. Diferencia (comparación) de dos medias
de poblaciones independientes
SOLUCIÓN
En vista que no se conocen las varianzas
poblacionales se hará uso del contraste «t» .
Para el buen uso del contraste los datos deben
satisfacer los siguientes supuestos básicos:
1. Normalidad
2. Aleatoriedad
3. Homogeneidad de varianzas
Si los supuestos se cumplen entonces
el procedimiento es:
T es la distribución de
probabilidades para encontrar
el número de errores
estándar
19. Diferencia (comparación) de dos medias
de poblaciones independientes
SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de
peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de
peso: 21,2g con una desviación estándar de 3,8g
𝑆2 𝑝 =
𝑛1 −1 𝑆2
1
+ 𝑛2−1 𝑆2
2
𝑛1+𝑛2 −2
𝑆2 𝑝 =
12−1 62
1
+ 12−1 3.82
22
𝑆2 𝑝 = 25,22
Volviendo y reemplazando en la fórmula de contraste
20. Diferencia (comparación) de dos medias
de poblaciones independientes
SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de
peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de
peso: 21,2g con una desviación estándar de 3,8g
𝑡(𝑛1 + 𝑛2) − 2 =
(𝑋1 − 𝑋2)
√(
𝑆2 𝑝
𝑛1
+
𝑆2 𝑝
𝑛2
)
Contraste estadístico
𝑡22 =
(27,2 − 21,2)
√(
25,22
12
+
25,22
12
)
= 2,927
Ubicamos este valor en la tabla T
21. Diferencia (comparación) de dos medias
de poblaciones independientes
2,927Ubicamos el valor dentro
de la distribución T para determinar el
valor de p
P, se halla entre los
niveles de confianza
de 0,995 y 0,9995
Se
rechaza
Ho
Se
acepta
Ho
22. Diferencia (comparación) de dos medias
de poblaciones independientes
c. Valor de p
0,0005 < p < 0,005 (nivel de significancia)
Decisión
Siendo p<0,05 se rechaza la Ho.
Conclusión
La dieta A produjo mayor ganancia de peso que
la dieta B, con p <0,05.
d. Decisión y conclusión
24. Diferencia (comparación) de dos medias
de poblaciones relacionadas
EJEMPLO
Se tienen los niveles de colesterol total de una muestra de ocho pacientes antes y
después de participar en un programa dieta-ejercicio.
¿Puede concluirse que el programa tuvo efecto favorable?
Paciente Antes Después di
1 201 200 1
2 211 216 -5
3 205 200 5
4 220 193 27
5 208 204 4
6 217 196 21
7 216 186 30
8 215 175 40
25. Diferencia (comparación) de dos medias
de poblaciones relacionadas
SOLUCIÓN
a. Planteamiento de Hipótesis
Se expresarán del siguiente modo:
Ho: μd ≤ 0 (después del programa los
valores no disminuyen)
H1: μd > 0 (después del programa los
valores disminuyen)
unilateral
Donde
μd = Media poblacional de las
diferencias
26. Diferencia (comparación) de dos medias
de poblaciones relacionadas
𝑡(𝑛 − 1) =
(𝑑)
𝑆 𝑑/√𝑛)
b. Contraste estadístico
𝑑 media aritmética de las diferencias
𝑆 𝑑 desviación estándar de las diferencias
Si la muestra es
probabilística y las
diferencias (di) tienen
distribución normal
𝑡 7 =
15,375
16,2387
8
= 2,678
27. Diferencia (comparación) de dos medias
de poblaciones relacionadas
Hallando la desviación estándar de
las diferencias , a partir de la
varianza
𝑆2 =
𝑋𝑖2
−𝑛 𝑋2
𝑛−1
𝑆2 = 263,69
Volviendo y reemplazando en la fórmula de contraste
𝑆𝑑 = √𝑆2 = √263,69 = 16,2387
28. Diferencia (comparación) de dos medias
de poblaciones relacionadas
2,678Ubicamos el valor dentro
de la distribución T para determinar el
valor de p
P, se halla entre los
niveles de confianza
de 0,975 y 0,99
Se
rechaza
Ho
Se
acepta
Ho
29. Diferencia (comparación) de dos medias
de poblaciones relacionadas
c. Valor de p
0,010 < p < 0,025 (nivel de significancia)
Decisión
Siendo p<0,05 se rechaza la Ho.
Conclusión
Se concluye que después del programa los niveles
de colesteros son significativamente menores que
los obtenidos antes, con p <0,025.
d. Decisión y conclusión