1. Prueba T
Usos
Entre los usos más frecuentes de las pruebas t se encuentran:
El test de locación de muestra única por el cual se comprueba si la
media de una población distribuida normalmente tiene un valor
especificado en una hipótesis nula.
El test de locación para dos muestras, por el cual se comprueba si
las medias de dos poblaciones distribuidas en forma normal son
iguales. Todos estos test son usualmente llamados test t de Student,
a pesar de que estrictamente hablando, tal nombre sólo debería ser
utilizado si las varianzas de las dos poblaciones estudiadas pueden
ser asumidas como iguales; la forma de los ensayos que se utilizan
cuando esta asunción se deja de lado suelen ser llamados a veces
como Prueba t de Welch. Estas pruebas suelen ser comúnmente
nombradas como pruebas t desapareadas o de muestras
independientes, debido a que tienen su aplicación mas típica cuando
las unidades estadísticas que definen a ambas muestras que están
siendo comparadas no se superponen.5
El test de hipótesis nula por el cual se demuestra que la diferencia
entre dos respuestas medidas en las mismas unidades estadísticas es
cero. Por ejemplo, supóngase que se mide el tamaño del tumor de un
paciente con cáncer. Si el tratamiento resulta efectivo, lo esperable
seria que el tumor de muchos pacientes disminuyera de tamaño luego
de seguir el tratamiento. Esto con frecuencia es referido como
prueba t de mediciones apareadas o repetidas.5 6
El test para comprobar si la pendiente de una regresión lineal difiere
estadísticamente de cero.
2. Estadísticos T y Z
La mayor parte de las pruebas estadísticas t tienen la forma ,
donde Z y s son funciones de los datos estudiados. Típicamente, Zse
diseña de forma tal que resulte sensible a la hipótesis alternativa (p.ej.
que su magnitud tienda a ser mayor cuando la hipótesis alternativa es
verdadera), mientras que s es un parámetro de escala que permite que la
distribución de T pueda ser determinada.
Por ejemplo, en una prueba t de muestra única, , donde es la
media muestral de los datos, n es el tamaño muestral, y σ es
ladesviación estándar de la población de datos; s en una prueba de
muestra única es , donde es la desviación estándar muestral.
Las asunciones subyacentes en una prueba t son:
Que Z sigue una distribución normal bajo la hipótesis nula.
ps2
sigue una distribución χ2
con p grados de libertad bajo la hipótesis
nula, y donde p es una constante positiva.
Z y s son estadísticamente independientes.
En una prueba t específica, estas condiciones son consecuencias de la
población que está siendo estudiada, y de la forma en que los datos han
sido muestreados. Por ejemplo, en la prueba t de comparación de
medias de dos muestras independientes, deberíamos realizar las
siguientes asunciones:
Cada una de las dos poblaciones que están siendo comparadas sigue
una distribución normal. Esto puede ser demostrado utilizando una
prueba de normalidad, tales como una prueba Shapiro-
Wilk o Kolmogórov-Smirnov, o puede ser determinado gráficamente
por medio de un gráfico de cuantiles normales Q-Q plot.
3. Si se está utilizando la definición original de Student sobre su
prueba t, las dos poblaciones a ser comparadas deben poseer las
mismas varianzas, (esto se puede comprobar utilizando una prueba F
de igualdad de varianzas, una prueba de Levene, una prueba de
Bartlett, o una prueba de Brown-Forsythe, o estimarla gráficamente
por medio de un gráfico Q-Q plot). Si los tamaños muestrales de los
dos grupos comparados son iguales, la prueba original de Student es
altamente resistente a la presencia de varianzas
desiguales.7
la Prueba de Welch es insensible a la igualdad de las
varianzas, independientemente de si los tamaños de muestra son
similares.
Los datos usados para llevar a cabo la prueba deben ser muestreados
independientemente para cada una de las dos poblaciones que se
comparan. Esto en general no es posible determinarlo a partir de los
datos, pero si se conoce que los datos han sido muestreados de
manera dependiente (por ejemplo si fueron muestreados por grupos),
entonces la prueba t clásica que aquí se analiza, puede conducir a
resultados erróneos.