Este documento presenta los conceptos clave de intervalos de confianza, contraste de hipótesis y significancia estadística que serán cubiertos en la clase de Epidemiología impartida por la profesora Carmen Marín. Explica cómo calcular e interpretar intervalos de confianza para proporciones y promedios, y los pasos para realizar pruebas de contraste de hipótesis, incluyendo el establecimiento de hipótesis nula y alternativa, y la interpretación de valores p y errores tipo I y tipo II.
Epidemiología - Intervalos de confianza, contraste de hipótesis y significancia estadística
1. UNIVERSIDAD DE COSTA RICA
Sistema de Estudios de Posgrado
Escuela de Salud Pública
I Ciclo lectivo 2003
Epidemiología – (SP – 2216)
Profesora: Carmen Marín
4. Intervalo de confianza
Es el rango de valores entre los cuales se
encuentra el parámetro con una determinada
precisión
Un intervalo de confianza del 95% entre “x” y
“y” quiere decir que si se repite el procedimiento
de selección de muestra y de medición 100 veces,
en 95 oportunidades el verdadero valor se
encontrará entre las cantidades “x” y “y”.
5. Intervalos de confianza de una
proporción
La prevalencia y la incidencia acumulada
son proporciones, por tanto sus IC se
=
calculan como tales
IC = proporción ± p ∗ q / n
6. Ejemplo para una proporción
En una muestra de 100 pacientes sometidos a un
cierto tratamiento se obtienen 80 curaciones.
Calcular el intervalo de confianza al 95% de la
eficacia del tratamiento.
¿Qué significa? La verdadera proporción de
curaciones está comprendida entre 72% y 88%
con un 95% de confianza.
¿Es suficientemente preciso? Habrá que juzgarlo
con criterios clínicos
7. Ejemplo:
En una muestra aleatoria de 500 personas de
un área, hay 5 diabéticos. La prevalencia
estimada es
5
p=
ˆ
500
0,01 = 1%
8. Y el intervalo de confianza
0,01 ± 1,96 0,01 ∗ 0,99 / 500
= 0,001 a 0,019
¿Qué significa? La verdadera prevalencia de
diabetes está comprendida entre 0,1% y 0,19%
con un 95% de confianza.
¿Es suficientemente preciso? Habrá que
juzgarlo con criterios clínicos
9. Intervalos de confianza de un
promedio
Para la media o promedio,
S
= IC = promedio ±
n
Donde:
n= tamaño de muestra
S=varianza de la población
10. Ejemplo: Intervalo de confianza
para un promedio
Para una muestra de 81 habitantes de cierta población se obtuvo una
estatura media de 167 cm. Por estudios anteriores se sabe que la
desviación típica de la altura de la población es de 8 cm.
El intervalo de confianza para la estatura media de la población al 95% es
8
IC = 167 ±
81
IC = 167 ± 0.9
Límite inferior: 167 - 0.9 = 166.1
Límite superior: 167 – 0.9 = 167.9
12. Contraste de hipótesis
Hipótesis nula H0 : es la hipótesis estadística
planteada para ser contrastada;
Hipótesis Alternativa H1 : es la hipótesis
complementaria de la anterior.
Ambas hipótesis cubren todos los casos posibles.
Cuando una hipótesis no es aceptada: se ha
encontrado evidencia científica para rechazar la
hipótesis. Es decir, se valida el rechazo, pero
no la aceptación.
13. Pasos para un contraste
Establecer la hipótesis nula
Establecer la hipótesis alternativa
Elegir un nivel de significación: nivel crítico para
alfa
Elegir un estadístico de contraste
Calcular el estadístico para una muestra aleatoria
y compararlo con la región crítica, o, calcular el
"valor p" (probabilidad de obtener ese valor, u
otro más alejado de la H0, si H0 fuera cierta) y
compararlo con alfa.
16. Error tipo Alfa y tipo Beta
Error tipo Alfa: o tipo I, es rechazar una
hipótesis nula verdadera.
Error tipo Beta: o tipo II, es aceptar una
hipótesis nula falsa
17. Significancia estadística: valor p
es la probabilidad de error al comparar dos o más
muestras o grupos cuando aseguramos que ambos
son diferentes.
es la probabilidad en el sentido de la
significación estadística.
< 0.05 significa que tenemos un 5% de
probabilidades de error en las conclusiones, por
lo cual la probabilidad de equivocarnos es baja.
18. Reporte de la significancia estadística
Cuando se rechaza una hipótesis usando un nivel de significación α =
0,05, para un nivel de confianza del 95 %, se dice en el informe que
los resultados fueron significativos.
En Medicina, la recomendación actual es poner todo, en especial el
intervalo de confianza (CI), junto con el valor del estadígrafo. Son
ejemplos de estos modos:
- ... se obtuvieron resultados significativos (p < 0,05)
- ... esta hipótesis no es aceptable Zx = 2,07 (p = 0,0468)
- ... se rechazó la hipótesis planteada (Z = 2,07) al 95% de confianza.
- ... se rechazó la hipótesis planteada (Z = 2,07*)
- ... se rechaza pues Z = 2,07 cae fuera de 95% CI ( -1,6 ; + 1,6)
Notes de l'éditeur
Elegir un estadístico de contraste : estadístico cuya distribución muestral se conozca en H 0 y que esté relacionado con y establecer, en base a dicha distribución, la región crítica : región en la que el estadístico tiene una probabilidad menor que si H 0 fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H 0 . Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H 0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H 0 , por eso es necesario que tenga la igualdad. 5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el &quot;valor p&quot; del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H 0 , si H 0 fuera cierta) y compararlo con . Ejemplo: Estamos estudiando el efecto del estrés sobre la presión arterial. Nuestra hipótesis es que la presión sistólica media en varones jóvenes estresados es mayor que 18 cm de Hg. Estudiamos una muestra de 36 sujetos y encontramos 1 . Se trata de un contraste sobre medias. La hipótesis nula (lo que queremos rechazar) es: 2. la hipótesis alternativa es un contraste lateral derecho. 3 . Fijamos &quot;a priori&quot; el nivel de significación en 0,05 (el habitual en Biología). 4. El estadístico para el contraste es y la región crítica T>t Si el contraste hubiera sido lateral izquierdo, la región crítica sería T<t 1- y si hubiera sido bilateral T<t 1- /2 o T>t /2 En este ejemplo t (35)0,05 =1,69. 5 . Calculamos el valor de t en la muestra no está en la región crítica (no es mayor que 1,69), por tanto no rechazamos H 0 . Otra manera equivalente de hacer lo mismo (lo que hacen los paquetes estadísticos) es buscar en las tablas el &quot;valor p&quot; que corresponde a T=0,833, que para 35 g.l. es aproximadamente 0,20. Es decir, si H 0 fuera cierta, la probabilidad de encontrar un valor de T como el que hemos encontrado o mayor (¿por qué mayor? Porque la H 1 es que es mayor , lo que produciría una media muestral mayor y por tanto mayor valor de t) es 0,20, dicho de otra manera la probabilidad de equivocarnos si rechazamos H 0 es 0,20, como la frontera se establece en 0,05 no la rechazamos. Este valor crítico de 0,05 es arbitrario pero es la convención habitual. ¿Cuán razonable es? Problema al respecto : en la hipótesis de que un mazo de cartas esté bien barajado, la probabilidad de que al sacar dos cartas sean, p.e.:1 el as de oros y 2 el rey de bastos es 1/40 x 1/39=0,000833. Si hacemos la experiencia y obtenemos ese resultado ¿rechazaríamos la hipótesis de que el mazo está bien barajado? ¿Cuánto se parece esto a la lógica del contraste de hipótesis? Volvamos al problema del estrés. Como no se rechaza H 0 , se puede cometer un error tipo II. ¿Cuál es ?. De hecho, sería la información relevante a comunicar en este estudio (la probabilidad del error que se pude cometer en él). Habitualmente, sin embargo, no se da porque los paquetes estadísticos no la calculan. Para calcularla se debe concretar H 1 , p.e. = 20 (el criterio para este valor no es estadístico)