3. Porqué usamos pruebas no
paramétricas?:
Porque no siempre se cumplen todos los
supuestos requeridos por las pruebas de
hipótesis tradicionales (paramétricas):
Distribución normal
Tamaño de muestra “grande”
Varianzas iguales (?)
Si la distribucion de la poblacion es sesgada
(Por lo que la media no es buen indicador de
tendencia central)
Bioestadística
4. Cómo se aplican estas pruebas:
Aplicar una transformación a los datos originales,
convertiéndolos en rangos, valores positivo o
negativo, etc.
Con los datos transformados, calcular un
estadístico en base a los datos (a veces también
se calcula su promedio y error estándar)
Con el estadístico y los parámetros calculados,
realizar una prueba de hipótesis de acuerdo a
una cierta distribución paramétrica (Normal, Jicuadrado, Binomial, etc.)
Bioestadística
5. Transformaciones de datos
Si los datos tienen una distribución
sesgada, en ocasiones pueden
transformarse para eliminar los sesgos
En algunos casos se puede emplear un
test paramétrico después de la
transformación
Bioestadística
6. Ejemplo:
Si trabajamos con parasitemia, con
frecuencia tendremos que aplicar una
transformación
Log
Bioestadística
8. Análisis con variables numéricas:
Análisis
Paramétrico
No paramétrico
Describir un grupo
µ, σ2
Mediana, rango
intercuartil
Comparar un grupo T Student de una
a un valor
muestra
Prueba Wilcoxon
Comparar medias
en 2 grupos
T Student de dos
muestras
Mann-Whitney
Comparar medias
en 2 grupos
apareados
T Student
apareada
Prueba Wilcoxon
Comparar medias
en 3 o mas grupos
ANOVA
Kruskal-Wallis
Correlación entre
dos variables
Pearson (lineal)
Spearman
(monotónica)
Bioestadística
9. Comparación de una muestra
contra una constante
Se piensa que la edad de inicio del consumo
de cigarrillos es la adolescencia
Puntualmente se plantea que el consumo se
inicia a los 15 años
Si la distribución es sesgada o la muestra es
pequeña, una prueba paramétrica sobre la
media puede ser poco relevante
Bioestadística
12. Aunque no es necesario,
hagamos la prueba no
paramétrica:
Bioestadística
13. Prueba signrank (Wilcoxon):
Ho: Mediana de la diferencia = 0
p59 – 15 = 0
ó
p59 = 0
Asume una distribución uniforme
alrededor de cero
Compara puntajes esperados con
observados
Bioestadística
14. Comparación entre dos muestras
independientes
Se piensa que la edad de inicio del consumo
de cigarrillos varía entre varones y mujeres
Si la distribución es sesgada, una prueba
paramétrica sobre la media puede ser poco
relevante
Si los tamaños de muestra son pequeños (n
< 30), el TLC no se cumplirá y la prueba T
podría llevar a conclusiones erróneas
Bioestadística
16. Igualdad de varianzas:
La prueba T de Student de grupos
independientes difiere si las varianzas
difieren entre los grupos, debiendo
agregarse la opción “unequal”
Para evaluar si las varianzas son
comparables o no se utiliza el comando
sdtest
Bioestadística
19. Prueba de Mann-Whitney:
Equivalente no paramétrico a una prueba de
hipótesis de promedios para dos muestras
Determina si una variable tiene valores mas
altos en una población que en otra. NO
COMPARA LOS PROMEDIOS!!!
Util si el tamaño de muestra es pequeño o la
distribución es demasiado sesgada
Bioestadística
20. ¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?
0
20
40
60
Qué son los puntajes correlativos?
.5
1
Varones
Bioestadística
1.5
inf_sexo
2
Mujeres
2.5
22. Interpretación
Se están comparando “valores” o la
“distribución”, no los promedios
Si en un grupo los puntajes observados
son mayores a los esperados, ese
grupo tiene mayores “valores”
Bioestadística
23. Comparación de dos grupos
apareados
Es una sola muestra, en verdad, en la que se
han medido dos valores
Se puede calcular la diferencia entre los
valores y sería una prueba de una sola
muestra
Qué comienza primero, alcohol o tabaco?
Prueba no paramétrica útil si es muestra
pequeña o distribución muy sesgada
Bioestadística
26. Análisis de Varianza:
Prueba paramétrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o más
poblaciones (estratos sociales). Supuestos:
Distribución normal en todas las poblaciones (no
es necesario si el tamaño de muestra es
“grande”)
Varianzas comparables entre poblaciones
Observaciones (muestras) independientes
Bioestadística
27. Comparación de Varianzas:
Se usa en el ANOVA para determinar si hay
diferencias entre promedios de varias
muestras
También se usa ANOVA en el análisis de
regresión, siendo un caso particular del
ANOVA
Utiliza la prueba estadística F
Bioestadística
28. Las hipótesis:
Hipótesis nula, Ho:
X-inicioAlto = X-inicioMedio = X-inicioBajo
Hipótesis alternativa, Ha:
Existen diferencias en la edad de inicio
de fumar promedios de al menos dos
estratos sociales
Bioestadística
30. Prueba de Kruskal-Wallis:
Extensión de la prueba de Mann-Whitney a
mas de dos poblaciones
Equivalente no paramétrico del análisis de
varianza
TAMPOCO COMPARA PROMEDIOS:
determina si una población tiene valores
diferentes (mas altos o mas bajos) que las
otras poblaciones
Bioestadística
31. ¿qué edad tenía ud. cuando fumó cigarrillos por primera vez?
0
20
40
60
Los puntajes correlativos:
.5
1
Bioestadística
1.5
2
estrato social
2.5
3
3.5
34. Correlación r de Pearson
Mide el grado de asociación lineal entre dos
variables numéricas
-1 <= r <= 1, r = 0 indica independencia
Se calcula en stata con el comando “pwcorr”
Requiere muestras “grandes”, distribuciones
cruzadas no sesgadas
Bioestadística
38. Correlación de puntajes
(Spearman):
Equivalente no paramétrico a la prueba de
correlación lineal de Pearson. Se aplica cuando
la correlación no es lineal, la muestra es
pequeña o existen valores muy extremos
Determina si dos variables cuantitativa u
cualitativa-ordinal están correlacionadas positiva
(una crece y la otra también) o negativamente
(una crece y la otra disminuye)
Al igual que las pruebas de Mann-Whitney y
Kruskal-Wallis, también utiliza datos por rangos
Bioestadística
41. Que debemos llevar a casa hoy:
Alternativas disponibles cuando no se
cumplen las condiciones para usar
pruebas parámetricas
Como aplicar e interpretar las pruebas de
Wilcoxon, Mann-Whitney, Kruskal-Wallis y
Spearman
Limitaciones de las pruebas no
paramétricas
Bioestadística
Notes de l'éditeur
Definition of Epidemiology, its objectives and analytic procedures
Prevalence, Incidence, Odds
Mortality, Lethality, Proportionate Mortality, Cause-specific mortality
Rates and ratios, odds-ratios, risk-ratios or relative-risks
Reality, tests and gold standards: validity and reliability
Sensitivity and specificity; positive and negative predictive value
Concordance and the Kappa statistic
Case series and cross-sectional studies; case-control and cohort studies
Prospective and retrospective studies
Clinical trials, what are they?
Random and systematic error.
Selection and information biases
Confounding?