1. “INSTITUTO TECNOLÒGICO SUPERIOR DE
LA SIERRA NEGRA DE AJALPAN”
CARRERA: ING. ADMÒN DE EMPRESAS.
MATERIA: ESTADISTICA II
TRABAJO: RESUMEN DE LA UNIDAD V
TEMA: “ESTADÍSTICA NO PARAMÉTRICA.”
MAESTRO: ING.JOSÈ GUADALUPE
RODRIGUEZ RAMOS.
ELABORADO POR: FELIX CASTRO GARCÌA
FECHA DE ENTREGA: MAYO DE 2012
2. INDICE
UNIDAD 4
ESTADÍSTICA NO PARAMÉTRICA. 5.1 Escala de medición
5.2 Métodos estadísticos contra no
Paramétricos
5.3 Prueba de corridas para
aleatoriedad
5.4 Una muestra: prueba de signos
5.5 Una muestra: prueba de Wilcoxon
5.6 Dos muestras: prueba de Mann-
Whitney
5.7 Observaciones pareadas: prueba
de signos
5.8Observaciones pareadas prueba
de Wilcoxon
5.9Varias muestras independientes:
prueba de Krauskal-Wallis
3. INTRODUCCIÒN
La estadística no paramétrica es una rama de la estadística que estudia las pruebas
y modelos estadísticos cuya distribución subyacente no se ajusta a los llamados
criterios paramétricos. Su distribución no puede ser definida a priori (se utilizan para
distinguir entre dos tipos de conocimiento: el conocimiento a priori es aquel que, en
algún sentido importante, es independiente de la experiencia; mientras que el
conocimiento a posteriori es aquel que, en algún sentido importante, depende de la
experiencia.), pues son los datos observados los que la determinan. La utilización de
estos métodos se hace recomendable cuando no se puede asumir que los datos se
ajusten a una distribución conocida, cuando el nivel de medida empleado no sea,
como mínimo, de intervalo.
5.1 ESCALA DE MEDICIÓN
Existen diversas definiciones del término "medición", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificación y el proceso mismo de la construcción de una escala o instrumento de
medición. En general, se entiende por medición la asignación de números a
elementos u objetos para representar o cuantificar una propiedad. El problema
básico está dado por la asignación un numeral que represente la magnitud de la
característica que queremos medir y que dicho números pueden analizarse por
manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos
de nuestras percepciones se transforman en entidades conocidas y manejables
llamadas "números". Es evidente que el mundo resultaría caótico si no pudiéramos
medir nada. En este caso cabría preguntarse de que le serviría la físico saber que el
hierro tiene una alta temperatura de fusión.
4. Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y
consiste en la asignación, puramente arbitraria de números o símbolos a cada una
de las diferentes categorías en las cuales podemos dividir el carácter que
observamos, sin que puedan establecerse relaciones entre dichas categorías, a no
ser el de que cada elemento pueda pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la
misma sean equivalentes respecto del atributo o propiedad en estudio, después de lo
cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de
denominaciones, se le atribuyan números, puede ser una de las razones por las
cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR
Núcleo San Carlos de acuerdos a la carrera que cursan.
Carrera Número asignada a la categoría
Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única y
exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un
objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la
propiedad de "orden" de los números asignándolo a los objetos en estudio de modo
que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A
posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente
arbitraria, debe hacerse atendiendo al orden existente entre éstas.
5. Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas
de posición, como por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de
llegada, estamos llevando una escala ordinal, es decir que al primero en llegar
ordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así
sucesivamente, de esta forma, cada número representará una categoría en general,
con un solo elemento y se puede establecer relaciones entre ellas, ya que los
números asignados guardan la misma relación que el orden de llegada a la consulta.
Escalas de intervalos iguales:
La escala de intervalos iguales, está caracterizada por una unidad de medida común
y constante que asigna un número igual al número de unidades equivalentes a la de
la magnitud que posea el elemento observado. Es importante destacar que el punto
cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún
momento ausencia de la magnitud que estamos midiendo. Esta escala, además de
poseer las características de la escala ordinal, encontramos que la asignación de los
números a los elemento es tan precisa que podemos determinar la magnitud de los
intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas,
podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden
calculársele todas las medidas estadísticas a excepción del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las
escalas de intervalos iguales únicamente por poseer un punto cero propio como
6. origen; es decir que el valor cero de esta escala significa ausencia de la magnitud
que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de
una unidad de medida para el efecto. A iguales diferencias entre los números
asignados corresponden iguales diferencias en el grado de atributo presente en el
objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor
absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la
propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias
que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que
aquellas que tienen 3 hijos.
5.2 MÉTODOS ESTADÍSTICOS CONTRA NO PARAMÉTRICOS
Es una rama de la estadística que estudia las pruebas y modelos estadísticos cuya
distribución subyacente no se ajusta a los llamados criterios paramétricos. Su
distribución no puede ser definida a priori, pues son los datos observados los que la
determinan. La utilización de estos métodos se hace recomendable cuando no se
puede asumir que los datos se ajusten a una distribución conocida, cuando el nivel
de medida empleado no sea, como mínimo, de intervalo.
Las principales pruebas no paramétricas son las siguientes:
Prueba χ² de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogórov-Smirnov
Prueba de Kruskal-Wallis
Prueba de Kuiper
7. Prueba de Mann-Whitney o prueba de Wilcoxon
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Coeficiente de correlación de Spearman
Tablas de contingencia
Prueba de Wald-Wolfowitz
Prueba de los signos de Wilcoxon
La mayoría de estos test estadísticos están programados en los paquetes
estadísticos más frecuentes, quedando para el investigador, simplemente, la tarea de
decidir por cuál de todos ellos guiarse o que hacer en caso de que dos test nos den
resultados opuestos. Hay que decir que, para poder aplicar cada uno existen
diversas hipótesis nulas que deben cumplir nuestros datos para que los resultados
de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y quedarse
con el que mejor convenga para la investigación sin verificar si se cumplen las
hipótesis necesarias. La violación de las hipótesis necesarias para un test invalida
cualquier resultado posterior y son una de las causas más frecuentes de que un
estudio sea estadísticamente incorrecto. Esto ocurre sobre todo cuando el
investigador desconoce la naturaleza interna de los test y se limita a aplicarlos
sistemáticamente.
5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD
Una corrida es una serie de observaciones similares. La prueba de corridas se usa para
probar la aleatoriedad de una serie de observaciones cuando cada observación puede
ser asignada a una de dos categorías.
Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos que
cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F, F,
F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.
Respecto de datos numéricos, un medio para obtener el esquema requerido de dos
categorías es clasificar cada observación según si es superior o inferior a la mediana del
grupo. En general, mucho menos corridas o mucho más corridas que las que serían de
esperar al azar resultarían en el rechazo de la hipótesis nula de que la secuencia de
observaciones es una secuencia aleatoria.
8. El número de corridas de elementos semejantes se determina de acuerdo con los datos
muéstrales, con el uso del símbolo R para designar el número de corridas observadas. Si
n1 equivale al número de elementos muestreados de un tipo y n2 al número de
elementos muestreados del segundo tipo, la media y el error estándar asociados con la
distribución de muestreo de la estadística de prueba R cuando la secuencia es aleatoria
son
Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución normal.
Por lo tanto, en estas circunstancias la estadística R puede convertirse a la estadística
de prueba z.
5.4 UNA MUESTRA: PRUEBA DE SIGNOS
La prueba de los signos puede utilizarse para probar una hipótesis nula referente al
valor de la medida de la población. En consecuencia, es el equivalente no
paramétrico a la prueba de una hipótesis referente al valor de la medida de la
población. Es necesario que los valores de la muestra aleatoria se encuentren al
menos en la escala ordinal, aunque no se requiere de supuestos acerca de la forma
de la distribución de la población.
Las hipótesis nula y alternativa pueden aludir ya sea a una prueba bilateral o
unilateral. Si Med denota la mediana de la población y Med0 designa al valor
hipotético, las hipótesis nulas y alternativa para una prueba de dos extremos son:
H0: Med=Med0
H1: Med≠Med0
Se aplica un signo de más a cada valor muestra observada mayor que el valor
hipotético de la mediana y un signo de menos a cada valor menor que el valor
hipotético de la mediana. Si un valor maestral es exactamente igual a la mediana
hipotética, no se le aplica ningún signo, con lo que el tamaño de muestra efectivo se
reduce. Si la hipótesis nula sobre el valor de la mediana es cierta, el número de
signos de más debería ser aproximadamente igual al número de signos de menos.
O, para decirlo de otra manera, la proporción de signos de mas debe ser de
alrededor de 0.50. Por consiguiente, la hipótesis nula que se prueba en una prueba
bilaterales H0: π=0.50, donde π es la proporción de la población de los signos de
mas o de menos. Así, una hipótesis referente al valor de la mediana se prueba en
realidad como una hipótesis sobre π. Si la muestra es grande, se puede hacer uso
de la distribución normal.
9. 5.5 UNA MUESTRA: PRUEBA DE WILCOXON
La prueba de Wilcoxon puede usarse para probar una hipótesis nula referente al
valor de la medida de la población. Pero dado que la prueba Wilcoxon considera la
magnitud de la diferencia entre cada valor muestral y el valor hipotético de la
mediana, es una prueba más sensible que la prueba de los signos.
Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la
mediana de dicha variable en la población, por ejemplo, M=M0. Extraigamos una
muestra de tamaño m y averigüemos las diferencias Di = X - M0. Consideremos
únicamente la n diferencias no nulas (n “m). Atribuyamos un rango u orden (0i) a
cada diferencia según su magnitud sin tener en cuenta el signo. Sumemos por un
lado los 0+i, rangos correspondientes a diferencias positivas y por otro lado los 0-i,
rangos correspondientes a diferencias negativas. La suma de los órdenes de
diferencias positivas sería igual a la suma de los órdenes de diferencias negativas,
caso que la mediana fuera el valor propuesto M0. En las muestras, siendo M0 el
valor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si la
suma de los rangos de un ciclo es considerablemente mayor que la suma de los
rangos de otro signo, nos hará concebir serias dudas sobre la veracidad de M0. La
prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoria
procede de una población con mediana M0. Además, bajo el supuesto de simetría
este contraste se puede referir a la media, E(X). Esta prueba es mucho más sensible
y poderosa que la prueba de los signos; como se puede apreciar utiliza más
información, pues no solo tiene en cuenta si las diferencias son positivas o negativas,
sino también su magnitud. El contraste de Wilcoxon puede ser utilizado para
comparar datos por parejas. Supongamos que la distribución de las diferencias es
simétrica, y nuestro propósito es contrastar la hipótesis nula de que dicha distribución
está centrada en 0. Eliminando aquellos pares para los cuales la diferencia es 0 se
calculan los rangos en orden creciente de magnitud de los valores absolutos de las
restantes diferencias. Se calculan las sumas de los rangos positivos y negativos, y la
menor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula será
rechazada si T es menor o igual que el valor correspondiente. Cuando n≥25 y la
hipótesis nula es cierta, la estadística t tiene una distribución aproximadamente
normal. La media y el error estándar asociados con esta distribución de muestreo
son, respectivamente: µ_T=(N(N+1))/4 σ_T=√ ((N(N+1) (2N+1))/24) En el caso de
una muestra relativamente grande la prueba puede realizarse usando la distribución
normal de probabilidad y calculando la estadística de prueba z, de la siguiente
manera: Z= (T-µ_R)/σ_T
10. 5.6 DOS MUESTRAS: PRUEBA DE MANN-WHITNEY
La prueba de Mann-Whitney se emplea en aquellos casos en los que deseamos
contrastar si existen diferencias entre las poblaciones de donde se extraen dos
muestras, que han de ser aleatorias e independientes. La utilidad de esta prueba es
la misma que la de la prueba t, pero no parte de supuestos y puede ser aplicada a
datos medidos en escala ordinal.
El procedimiento es el siguiente:
1. Hipótesis:
Hipótesis nula: No existen diferencias entre los dos grupos.
Hipótesis alternativa: Hay diferencias entre los dos grupos.
2. Estadístico de contraste:
En este caso, el estadístico a emplear se denomina U de Mann-Whitney, que se
calcula siguiendo estos pasos:
a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran una
sola.
b) A cada una de ellas se le asigna un rango.
c) Se calcula el estadístico T, a partir de la suma de los rangos de la muestra de
menor tamaño.
d) Teniendo T, se calcula U:
Donde U = n1n2 + n1 (n1 + 1)/2 - T
Donde n1 es el número de sujetos de la muestra de menor tamaño, y n 2 el de la
muestra mayor.
3. Como en el caso anterior, el valor observado es comparado con valores tabulados.
En dicha tabla encontramos la probabilidad asociada a cada valor del estadístico
para una prueba unilateral. Si nuestro contraste es bilateral, sólo tendremos que
multiplicar por dos el valor tabular correspondiente a una cola.
11. 5.7 OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS
También se puede utilizar la prueba de signo para probar la hipótesis nula
para observaciones pareadas. Aquí se reemplaza cada diferencia,
di, con un signo más o menos dependiendo si la diferencia ajustada, d i-d0, es positiva
o negativa. A lo largo de esta sección suponemos que las poblaciones son
simétricas. Sin embargo, aun si las poblaciones son asimétricas se puede llevar a
cabo el mismo procedimiento de prueba, pero las hipótesis se refieren a las
medianas poblacionales en lugar de las medias.
Ejemplo:
1. Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de
llantas regulares con cinturón mejora la economía de combustible. Se equipan
16 automóviles con llantas radiales y se manejan por un recorrido de prueba
establecido. Sin cambiar de conductores, se equipan los mismos autos con
llantas regulares con cinturón y se manejan una vez más por el recorrido de
prueba. Se registra el consumo de gasolina, en kilómetros por litro, de la
siguiente manera:
Llantas con
Automóvil Llantas radiales
cinturón
1 4.2 4.1
2 4.7 4.9
3 6.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
11 6.1 6.0
12 5.2 4.9
12. 13 5.7 5.3
14 6.9 6.5
15 6.8 7.1
16 4.9 4.8
¿Se puede concluir en el nivel de significancia de 0.05 que los autos
equipados con llantas radiales obtienen mejores economías de
combustible que los equipados con llantas regulares con cinturón?
Solución:
Regla de decisión:
Si zR 1.645 no se rechaza Ho.
Si zR> 1.645 se rechaza Ho.
Se procede ha realizar las diferencias entre de los kilómetros por litro entre llantas
radiales y con cinturón:
Llantas con d
Automóvil Llantas radiales
cinturón
1 4.2 4.1 +
2 4.7 4.9 -
3 6.6 6.2 +
13. 4 7.0 6.9 +
5 6.7 6.8 -
6 4.5 4.4 +
7 5.7 5.7 0
8 6.0 5.8 +
9 7.4 6.9 +
10 4.9 4.9 0
11 6.1 6.0 +
12 5.2 4.9 +
13 5.7 5.3 +
14 6.9 6.5 +
15 6.8 7.1 -
16 4.9 4.8 +
Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan los
valores de cero. Se tiene r+ = 11
Decisión y conclusión:
Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que las
llantas radiales mejoran la economía de combustible.
14. 5.8 OBSERVACIONES PAREADAS PRUEBA DE WILCOXON
PRUEBA DE RANGO CON SIGNO DE WILCOXON
Se puede notar que la prueba de signo utiliza sólo los signos más y menos de las
diferencias entre las observaciones y 0 en el caso de una muestra, o los signos
más y menos de las diferencias entre los pares de observaciones en el caso de la
muestra pareada, pero no toma en consideración la magnitud de estas diferencias.
Una prueba que utiliza dirección y magnitud, propuesta en 1945 por Frank Wilcoxon,
se llama ahora comúnmente prueba de rango con signo de Wilcoxon.
Esta prueba se aplica en el caso de una distribución continua simétrica. Bajo esta
condición se puede probar la hipótesis nula 0. Primero se resta de cada
valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un rango
de 1 a la diferencia absoluta más pequeña, un rango de 2 a la siguiente más
pequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias es
el mismo, se asigna a cada uno el promedio de los rangos que se asignarían si las
diferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son iguales
en valor absoluto, a cada una se le asignaría un rango de 5.5. Si la hipótesis 0
es verdadera, el total de los rangos que corresponden a las diferencias positivas
debe ser casi igual al total de los rangos que corresponden a las diferencias
negativas. Se representan esos totales como w+ y w-, respectivamente. Se designa el
menor de w+ y w- con w.
Al seleccionar muestras repetidas esperaríamos que variaran w+ y w-, y por tanto w.
De esta manera se puede considerar a w+ y w-, y w como valores de las
correspondientes variables aleatorias W +, W-, y W. La hipótesis nula 0 se
puede rechazar a favor de la alternativa 0 sólo si w+ es pequeña y w- es
grande. Del mismo modo, la alternativa 0 se puede aceptar sólo si w+ es
grande y w- es pequeña. Para una alternativa bilateral se puede rechazar H 0 a favor
de H1 si w+ o w- y por tanto w son suficientemente pequeñas. No importa cuál
hipótesis alternativa puede ser, rechazar la hipótesis nula cuando el valor de la
estadística apropiada W +, W -, o W es suficientemente pequeño.
Dos Muestras con Observaciones Pareadas
Para probar la hipótesis nula de que se muestrean dos poblaciones simétricas
continuas con para el caso de una muestra pareada, se clasifican las
diferencias de las observaciones paradas sin importar el signo y se procede como en
el caso de una muestra. Los diversos procedimientos de prueba para los casos de
una sola muestra y de una muestra pareada se resumen en la siguiente tabla:
15. No es difícil mostrar que siempre que n<5 y el nivel de significancia no exceda 0.05
para una prueba de una cola ó 0.10 para una prueba de dos colas, todos los valores
posibles de w+, w-, o w conducirán a la aceptación de la hipótesis nula. Sin embargo,
cuando 5 n 30, la tabla A.16 muestra valores críticos aproximados de W + y W -
para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba de una
cola, y valores críticos de W para niveles de significancia iguales a 0.02, 0.05 y 0.10
para una prueba de dos colas. La hipótesis nula se rechaza si el valor calculado w+,
w-, o w es menor o igual que el valor de tabla apropiado. Por ejemplo, cuando n=12
la tabla A.16 muestra que se requiere un valor de w+ 17 para que la alternativa
unilateral sea significativa en el nivel 0.05.
16. Ejemplos:
1. Los siguientes datos representan el número de horas que un compensador
opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0,
1.2 y 1.7. Utilice la prueba de rango con signo para probar la hipótesis en el
nivel de significancia de 0.05 que este compensador particular opera con una
media de 1.8 horas antes de requerir una recarga.
Solución:
H0;
H1;
Se procederá a efectuar las diferencias y a poner rango con signo a los datos.
1.
Dato di = dato - 1.8 Rangos
1.5 -0.3 5.5
2.2 0.4 7
0.9 -0.9 10
1.3 -0.5 8
2.0 0.2 3
1.6 -0.2 3
1.8 0 Se anula
1.5 -0.3 5.5
2.0 0.2 3
1.2 -0.6 9
1.7 -0.1 1
17. Regla de decisión:
Para una n = 10, después de descartar la medición que es igual a 1.8, la tabla
A.16 muestra que la región crítica es w 8.
Cálculos:
W+ = 7 + 3 + 3 = 13
w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42
Por lo que w = 13 (menor entre w+ y w-).
Decisión y Conclusión:
Como 13 no es menor que 8, no se rechaza H0 y se concluye con un =
0.05 que el tiempo promedio de operación no es significativamente diferente
de 1.8 horas.
1. Se afirma que un estudiante universitario de último año puede aumentar su
calificación en el área del campo de especialidad del examen de registro de
graduados en al menos 50 puntos si de antemano se le proporcionan problemas
de muestra. Para probar esta afirmación, se dividen 20 estudiantes del último año
en 10 pares de modo que cada par tenga casi el mismo promedio de puntos de
calidad general en sus primeros años en la universidad. Los problemas y
respuestas de muestra se proporcionan al azar a un miembro de cada par una
semana antes del examen. Se registran las siguientes calificaciones del examen:
Con problemas de Sin problemas de
Par
muestra muestra
1 531 509
2 621 540
3 663 688
4 579 502
5 451 424
18. 6 660 683
7 591 568
8 719 748
9 543 530
10 575 524
Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los problemas
aumentan las calificaciones en 50 puntos contra la hipótesis Alternativa de que el
aumento es menor a 50 puntos.
Solución: ajustadas sin importar el signo y se aplica el mismo procedimiento.
En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las
muestras y luego restarles el valor de 50. Se representara con y la
calificación media de todos los estudiantes que resuelven el examen en cuestión con
y sin problemas de muestra, respectivamente.
H0;
H1;
Regla de decisión:
Para n=10 la tabla muestra que la región crítica es w+ 11.
Cálculos:
La prueba de rango con signo también se puede utilizar para probar la hipótesis nula
d0. En este caso las poblaciones no necesitan ser simétricas. Como con la
prueba de signo, se resta d0 de cada diferencia, se clasifican las diferencias
Con Sin
di
problemas problemas
Par di – Rangos
de de
d0
muestra muestra
19. -
1 531 509 22 5
28
2 621 540 81 31 6
- -
3 663 688 9
25 75
4 579 502 77 27 3.5
-
5 451 424 27 2
23
- -
6 660 683 8
23 73
-
7 591 568 23 3.5
27
- -
8 719 748 10
29 79
-
9 543 530 13 7
37
10 575 524 51 1 1
W+ = 6 + 3.5 + 1 = 10.5
Decisión y Conclusión:
Como 10.5 es menor que 11 se rechaza H0 y se concluye con un = 0.05 que los
problemas de muestra, en promedio, no aumentan las calificaciones de registro de
graduados en 50 puntos.
20. 5.9 VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE
KRAUSKAL-WALLIS
Esta prueba estadística de análisis de varianza de entrada simple de Kruskal-Wallis
es una extensión de la prueba de U Mann-Whitney, en razón de que se usan rangos
para su aplicación; por otra parte, este procedimiento se emplea cuando el modelo
experimental contiene más de dos muestras independientes.
Dicha prueba se define matemáticamente de la forma siguiente:
Donde:
H = valor estadístico de la prueba de
Kruskal-Wallis.
N = tamaño total de la muestra.
2
Rc = sumatoria de los rangos elevados al
cuadrado.
ni = tamaño de la muestra de cada grupo.
L = ajuste dado por el ajuste de ligas o
empates de los rangos.
El ajuste L se calcula de la manera siguiente:
Donde:
Li = valor de número de empates de un rango.
N = tamaño total de la muestra.
Se utiliza cuando:
Cuando son diferentes tratamientos o condiciones.
Muestras pequeñas.
Se utiliza escala ordinal.
Si las muestras se seleccionaron de las diferentes poblaciones.
Contrastar hipótesis (direccional o no direccional).
21. Pasos:
1. Ordenar las observaciones en rangos de todos los grupos, del más pequeño al
mayor.
2. Asignar el rango para cada observación en función de cada grupo de
contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y
dividirlo entre el número de elementos que contiene (ni).
3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la
ecuación (L) para obtener el ajuste.
4. Aplicar la ecuación de Kruskal-Wallis y obtener el estadístico H.
5. Calcular los rangos de libertad (gl): gl = K grupos - 1.
6. Comparar el estadístico H, de acuerdo con los grados de libertad, en la tabla
de distribución de ji cuadrada en razón de distribuirse de forma similar.
7. Decidir si se acepta o rechaza la hipótesis.
Ejemplo:
Un investigador estudia el efecto benéfico de cuatro sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato -DFH-, diacepam y clonacepam), para proteger
contra la muerte producida por un convulsionante, la tiosemicarbazida, la cual se
manifiesta después de crisis clónica y tónica, respectivamente. El investigador elige
al azar a 24 ratones de la misma edad y peso y les inyecta anticonvulsionante
previamente a la tiosemicarbazida. A partir de este momento, inicia la cuenta en
tiempo, hasta que mueren los ratones; además mide las observaciones en horas de
tiempo transcurrido.
Elección de la prueba estadística.
Las mediciones se realizan en horas, por lo que la variable puede ser continua y, en
consecuencia, una escala de intervalo; sin embargo, algunos ratones no murieron y
el tiempo está calificado nominalmente como infinito. Este obstáculo impide
22. concederle la calificación de escala de intervalo, por lo cual se elige una escala de
tipo ordinal.
Planteamiento de la hipótesis.
Hipótesis alterna (Ha).
La protección de la muerte por drogas anticonvulsionante contra el fármaco
convulsionante tiosemicarbazida, se muestra diferente entre los cuatro grupos, y hay
mejor protección por el diacepam.
Hipótesis nula (Ho).
Las diferencias observadas en los cuatro grupos de fármacos anticonvulsionantes,
para evitar la muerte producida por la tiosemicarbazida, se deben al azar.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha
Tiempo en horas que tarda el fármaco en causar la muerte en ratones.
Aplicación de la prueba estadística.
De acuerdo con los pasos, se inicia con el ordenamiento de todas las observaciones
a partir del valor más pequeño hasta el mayor y la detección de las ligas o empates.
23. Arreglo de los datos para asignar rangos y detectar las ligas o empates.
Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen las
sumatorias de los rangos. Para facilitar esta tarea, elabórese una tabla en la que
sustituyan los datos.
Sustitución por rangos. Observaciones de la primera tabla.
Se calcula el valor de ajuste por ligas con la siguiente fórmula:
24. Con el ajuste de L, se procede a calcular el valor estadístico de la prueba de Kruskal-
Wallis.
Calculamos los grados de libertad.
gl = K grupos - 1 = 4 - 1 = 3
El estadístico H calculado de 15.4, se compara con los valores críticos de ji
cuadrada. En seguida se busca en esa hilera la cifra de grados de libertad (3) hasta
el nivel de significancia de 0.05 y se observa el valor 7.82, hasta los críticos 11.34 y
16.27, donde se encuentra el calculado. Esto quiere decir que la probabilidad de que
exista una diferencia se halla a una probabilidad de error entre 0.01 y 0.001.
Decisión.
Como el valor estadístico H tiene una probabilidad menor que 0.01 y éste es menor
que el nivel de significancia, se acepta Ha y se rechaza Ho.
Interpretación.
Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto a la
protección de muerte a los ratones cuando se les inyecta el fármaco
tiosemicarbazida. El diacepam se manifestó principalmente con los rangos más altos
y se muestra distinto de los demás anticonvulsionantes (véase la siguiente figura).
Sumatoria de rangos de las observaciones.
25. BIBLIOGRAFÍA
1. Sprent P. Applied nonparametric statistical methods. 2nd Ed., Chapman-
Hall, London, 1993:1-3.
2. Glantz SA. Primer of Biostatistics, 3th ed., McGraw Hill, New Yor, 1992
3.- Bloquear todos los resultados de es.wikipedia.org