SlideShare une entreprise Scribd logo
1  sur  168
DISEÑOS DE INVESTIGACIÓN Y
      ANÁLISIS DE DATOS


           TEMA 3
Análisis de datos paramétricos
 para diseños de dos grupos
Introducción
• En los diseños de una única muestra no existe
  grupo o muestra de comparación.
• Sin embargo, generalmente será conveniente,
  y en algunos casos necesario, utilizar más de
  una muestra.
Joke
• Dos señoras conversando en el bar:
• María: “bueno, y tu marido en la cama,
  ¿qué tal es?”
• ….
• Juana: “¿comparado con quién?”
• Es usual la utilización de dos muestras cuando:
  a) queremos comprobar si existen diferencias
  entre un grupo experimental y un grupo de
  control.
  B) si queremos comprobar la eficacia de un
  tratamiento mediremos la variable
  dependiente (v.d.) antes y después del
  tratamiento y comparamos ambas medias
  para comprobar si la terapia ha sido eficaz.
Muestras independientes
Sujeto      Grupo          v.d.
1           Experimental          X1
2           Experimental          X2
3           Experimental          X3
4           Experimental          X4
5           Experimental          X5
6           Control               X6
7           Control               X7
8           Control               X8
9           Control               X9
10          Control               X10
Muestras dependientes
Sujeto   v.d. antes del   v.d. después del
          tratamiento       tratamiento
  1           X1a               X1d

  2           X2a               X2d

  3           X3a               X3d

  4           X4a               X4d

  5           X5a               X5d
• En otras ocasiones el mismo problema que
  queremos investigar nos obliga a utilizar dos
  muestras, porque queremos estudiar diferencias
  entre dos poblaciones diferentes, como puede ser
  entre hombres y mujeres, entre ambiente rural y
  urbano, entre dos clases sociales, etc.
• Obsérvese que estas diferencias exigen un diseño
  inter-sujetos (muestras independientes)
MUESTRAS INDEPENDIENTES O
         RELACIONADAS
• En todas las técnicas estadísticas que vemos
  en este curso suponemos que las
  observaciones dentro de una muestra son
  independientes, es decir, que no existe
  relación entre ellas. Por lo tanto, dentro de un
  grupo el valor de una determinada puntuación
  no nos informa en absoluto del valor de otras
  puntuaciones dentro del mismo grupo.
MUESTRAS INDEPENDIENTES O
         RELACIONADAS
• En cualquier caso, para garantizar la
  independencia de los datos dentro de un
  grupo, lo mejor que puede hacerse es
  seleccionar a los elementos de la muestra de
  forma aleatoria.
• No obstante, obsérvese que la independencia
  intra-grupo es un SUPUESTO (y lo mejor que
  puede hacerse es ponerlo a prueba).
• Por tanto, cuando trabajamos con dos
  muestras (o más de dos), las muestras
  pueden ser independientes o relacionadas.
  Son independientes cuando no existe relación
  entre los sujetos (unidades de observación) de
  una y otra, lo que podremos garantizar si los
  sujetos son asignados aleatoriamente a cada
  una de las muestras.
• Tenemos muestras relacionadas cuando cada
  observación en una muestra tiene su pareja
  en la otra. El caso más evidente es cuando son
  los mismos sujetos los que pasan por
  diferentes condiciones experimentales.
• En otras ocasiones no son los mismos sujetos
  los que se repiten en las muestras, pero hay
  una relación sujeto a sujeto en ambas.
• Por ejemplo, si disponemos de 10 parejas de
  hermanos gemelos, podemos formar dos
  grupos de 5 personas donde cada dos
  hermanos son asignados, aleatoriamente, a
  grupos distintos. También podemos contar
  con padres e hijos, maridos y mujeres, etc.
• Por último, también podemos utilizar pares de
  sujetos que están equiparados en variables
  que pueden influir en el diseño de la
  investigación.
• Por ejemplo, supongamos que para probar la
  eficacia de dos métodos de enseñanza,
  queremos controlar la influencia del CI por lo
  que tomamos pares de sujetos con un CI
  semejante formando cada uno de ellos parte
  de muestras diferentes.
CONTRASTES DE HIPÓTESIS SOBRE DOS
   MEDIAS EN MUESTRAS INDEPENDIENTES
• En este apartado veremos tres contrastes de
  hipótesis sobre dos medias para muestras
  independientes en función de los supuestos
  que hagamos sobre las varianzas
  poblacionales.
  – Supuestas conocidas
  – Desconocidas pero suponiendo que son iguales
  – Desconocidas suponiendo que son diferentes.
• En todo contraste de hipótesis el proceso de
  inferencia estadística se realiza sobre una
  distribución teórica que denominamos
  distribución muestral (DM).
• Nos tenemos que preguntar cómo se
  compone la distribución muestral en el caso
  de dos medias con muestras independientes.
Distribución muestral de la diferencia de medias para
            dos muestras independientes

• Supongamos que tenemos dos poblaciones, y
  que cada una de ellas contiene 3
  observaciones.
• Denotaremos las puntuaciones mediante la
  letra latina Y. Presentamos las puntuaciones,
  la media y la varianza de dichas poblaciones.
Población                  Muestra          DM
Población 1   Población 2   Muestra 1   Muestra 2

 Y11= 2       Y21= 3.5
 Y12= 5        Y22= 5
 Y13= 8       Y23= 6.5
• El primer subíndice hace referencia a la
  población/muestra a la que pertenecen y el segundo
  al orden que cada puntuación ocupa en su muestra.
• Podemos calcular la media aritmética de todas las
  sub-muestras de tamaño, v.g., n = 2 con reposición
  para la Población 1, y que formarán la distribución
  muestral de la media para dicha población en
  muestras de tamaño n = 2.
• Ahora debemos plantearnos ¿cuál será la DM
  de las DIFERENCIAS entre las medias de cada
  par posible de muestras?
• Teóricamente podríamos plantearnos otra
  función de las medias muestrales (v.g., su
  suma, su producto, etc.) pero estaremos de
  acuerdo en que la diferencia entre las medias
  es la más sencilla además de que es
  congruente con la idea que subyace a H0: no
  existen diferencias entre ambas muestras, lo
  cual implica que su diferencia, por término
  medio, será cero.
• Otra fórmula para calcular la varianza de las
  diferencias, en términos de las varianzas de las
  poblaciones originales, es:
• En los contrastes que veremos a
  continuación vamos a suponer
  que las poblaciones de las que
  proceden las muestras que
  utilizaremos:
 – se distribuyen normalmente, o
 –n1 ≥ 30 y n2 ≥ 30.
Esto nos garantiza que las
 distribuciones muestrales de la
 media en ambos casos también se
 distribuyen normalmente y, si esto es
 así, también se distribuirá
 normalmente la distribución
 muestral de las diferencias entre
 medias.
Varianzas poblacionales conocidas
• Ejemplo 3.1. Un psicólogo escolar utiliza un
  test de comprensión verbal recientemente
  traducido del inglés, que proporciona
  puntuaciones en un nivel de medida de
  intervalo.
Varianzas poblacionales conocidas
• Ejemplo 3.1 Se sabe, por investigaciones
  anteriores, que las varianzas en la población
  son para niños y niñas




Respectivamente.
Varianzas poblacionales conocidas
• Ejemplo 3.1. Las investigaciones anteriores
  también indican que la media es la misma en
  ambos grupos, pero este último aspecto no ha
  sido comprobado con muestras españolas. El
  psicólogo considera que la traducción del test
  no es muy acertada y puede provocar
  diferencias que en realidad no se deben a la
  comprensión verbal.
Varianzas poblacionales conocidas
• Ejemplo 3.1. Por ello selecciona
  aleatoriamente una muestra de 100 niños y
  otra muestra de 200 niñas obteniendo una
  media igual a 20 para los niños e igual a 17’5
  para las niñas. Con un nivel de confianza del
  95%. ¿Podemos afirmar que la puntuación
  media en el test de comprensión verbal es la
  misma para niños y niñas?
Condiciones y supuestos
• Tenemos un diseño de dos muestras
  independientes (niños y niñas) en el que la
  variable dependiente (comprensión verbal)
  proporciona puntuaciones en una escala de
  intervalo. Aunque no sabemos si las
  poblaciones se distribuyen normalmente,
  trabajamos con muestras que son lo
  suficientemente grandes (n1 ≥ 30 y n2 ≥ 30).
• Finalmente, el psicólogo asume que las
  varianzas de las poblaciones de niños y niñas
  son las que reflejan las investigaciones
  anteriores. En definitiva se cumplen los
  siguientes supuestos:
• Variable dependiente con un nivel de medida
  de intervalo o razón.
• Dos poblaciones que se distribuyen
  normalmente, o bien n1 ≥ 30 y n2 ≥ 30.
• Varianzas poblacionales conocidas.
Formulamos las hipótesis
• En este caso el psicólogo piensa que pueden
  existir diferencias pero no tiene una hipótesis
  previa sobre la dirección de las mismas, por lo
  que planteamos un contraste de hipótesis
  bilateral:
Formulamos las hipótesis
• O equivalentemente:
Estadístico de contraste y su DM
• Conocemos las varianzas de las dos
  poblaciones y trabajamos con muestras
  grandes, lo que nos permite asumir la
  normalidad de la distribución muestral de las
  diferencias entre medias.
Dos muestras independientes
                                          DM de la
              Niños (1)       Niñas (2)   diferencia de
                                          medias
Variable X
=
Comprensión
verbal




                   MUESTRAS
POBLACIÓN
Dos muestras independientes
                                          DM de la
              Niños (1)       Niñas (2)   diferencia de
                                          medias
Variable X
=
Comprensión
verbal




                   MUESTRAS
POBLACIÓN
• Observamos que la fórmula del estadístico de
  contraste sigue el mismo esquema ya visto:
  cuantifica la discrepancia entre la diferencia
  de medias observada entre las dos muestras
  frente a una diferencia nula planteada en la
  hipótesis nula, todo ello medido en unidades
  de desviación típica.
• Por tanto, en el numerador tenemos la
  diferencia entre el valor del estadístico en la
  muestra



respecto del valor del parámetro que postula la
  hipótesis nula (que omitimos porque es cero)
  y en el denominador la desviación típica de la
  DM del estadístico.
• Calculamos el
  nivel p-crítico
  en la tabla de
  curva normal
  (probabilidad
  de obtener un
  valor como el
  observado o
  más extremo).
• Obtenemos
  0.9993
• Pero esta p (0.9993) es el área que deja por
  debajo de sí la curva en el punto 3.21. Como
  necesitamos conocer el área superior y
  sabemos que todo el área vale la unidad:
           1 – 0.9993 = 0.0007
  Además, como el contraste es bilateral,
  multiplicamos esta p por 2:
                 2 x 0.0007 = 0.0014
Nivel p-crítico=0.0007




                         Alpha/2=0.025
• En otras palabras, el estadístico de contraste
  (la discrepancia observada) supera el valor
  crítico.
• En general, en un contraste bilateral,
  mantendremos la hipótesis nula cuando el
  estadístico de contraste no alcance el valor
  crítico

  y la rechazaremos cuando:
• Si utilizamos el nivel p-crítico para concluir
  qué decisión tomar con respecto a H0,
  llegamos a la misma conclusión, puesto que
                  0’0014 < 0’05
  o en general:
• El comparar el nivel crítico (p) con el nivel de
  significación (alpha) nos proporciona más
  información que la comparación del
  estadístico de contraste con el valor crítico,
  puesto que vemos claramente que es muy
  improbable que siendo la hipótesis nula
  verdadera obtengamos dos muestras cuyas
  medias tengan una diferencia como la
  observada.
• El resultado sería significativo incluso a un
  nivel de confianza superior al 99%.
Interpretar el resultado
• Las sospechas del psicólogo parecen
  fundadas. Las diferencias significativas entre
  niños y niñas en fluidez verbal pueden
  deberse a una deficiente traducción del test.
Intervalo de confianza
• Si estuviéramos interesados en calcular el
  intervalo de confianza, lo haríamos mediante
  la expresión:
Intervalo de confianza




    (0.975, 4.024)
Varianzas poblacionales desconocidas
       pero supuestas iguales.
• Ejemplo 3.2. En un estudio sobre depresión
  en personas mayores llevado a cabo en un
  centro geriátrico, se quiere comprobar si las
  personas ingresadas que no reciben visitas de
  sus familiares tienen una puntuación media
  en depresión superior a aquellas personas
  cuyos familiares les visitan con frecuencia.
Varianzas poblacionales desconocidas
       pero supuestas iguales.
• Ejemplo 3.2. Para comprobar esta hipótesis,
  se seleccionaron aleatoriamente 41 personas
  que no reciben visitas obteniéndose una
  puntuación media de 20 puntos con una
  cuasivarianza igual a 100, mientras que en una
  muestra aleatoria de 31 personas que si
  reciben visitas con frecuencia la media fue
  igual a 15 con una cuasivarianza igual a 90.
Varianzas poblacionales desconocidas
       pero supuestas iguales.
• Ejemplo 3.2. Suponiendo que las varianzas en
  la población son iguales para ambos grupos, y
  con un nivel de confianza del 99% ¿podemos
  decir que los datos obtenidos avalan la
  hipótesis de partida?
Dos muestras independientes
                                               DM de la
              Ancianos que   Ancianos que      diferencia de
               no reciben    reciben visitas   medias
Variable X     visitas (1)         (2)
=
Depresión




                    MUESTRAS
POBLACIÓN
Condiciones y supuestos
• Los requisitos en este caso son iguales que en
  el caso anterior. La única diferencia es que no
  conocemos las varianzas poblacionales, si bien
  las suponemos iguales. Comprobamos pues
  que se cumplen los siguientes puntos:
• Variable dependiente con un nivel de medida
  de intervalo o razón. Suponemos que el test
  de depresión proporciona medidas en una
  escala de intervalo.
Condiciones y supuestos
• Supuestos:
• No sabemos cómo se distribuye la variable en
  población, pero salvamos este obstáculo
  utilizando dos muestras con 30 o más
  observaciones cada una.
• Varianzas poblacionales desconocidas y
  supuestas iguales.
Formulamos las hipótesis
• Partimos de la hipótesis de que la depresión
  media es superior en las personas que no
  reciben visitas de sus familiares (Grupo 1)
  respecto de las personas que reciben con
  frecuencia visitas de sus familiares (Grupo 2)
Formulamos las hipótesis
• En consecuencia, el contraste de hipótesis
  completo será unilateral derecho:
Formulamos las hipótesis
• Expresado en términos de desigualdades será:
Estadístico de contraste
• El estadístico de contraste en este caso se
  distribuye según t de Student con n1+n2-2
  grados de libertad (obsérvese la
  cuasivarianza):
Dos muestras independientes
                                               DM de la
              Ancianos que   Ancianos que      diferencia de
               no reciben    reciben visitas   medias
Variable X     visitas (1)         (2)
=
Depresión




                    MUESTRAS
POBLACIÓN
Estadístico de contraste
• El estadístico de contraste en este caso se
  distribuye según t de Student con n1+n2-2
  grados de libertad vale 2.14728.
Establecemos la regla de decisión
• Buscamos en las tablas de t de Student el
  valor crítico (contraste unilateral), que en este
  caso es igual a la puntuación que supera al
  99% de la distribución para 70 grados de
  libertad, que se corresponde con 2.381
Un valor de t=2.381 (el valor crítico) deja por
encima de sí el 0.01 del área de la distribución.
Mientras que el valor t = 2.15 deja por encima
de sí algo más del 0.01 del área (las tablas no
 nos permiten determinarlo exactamente)
• El nivel p-crítico es igual a p = 0’0175, pero no
  podemos calcularlo exactamente en las tablas del
  apéndice.
• No obstante, podemos utilizarlas para calcularlo de
  forma aproximada, observando que para 70 grados
  de libertad nuestro estadístico de contraste se
  encuentra entre las puntuaciones 1’994 y 2’381
  (1’994 < 2’15 < 2’381) que dejan por encima de si
  respectivamente las proporciones: 0’025 y 0’01,
  luego el nivel p-crítico se encontrará entre estos dos
  últimos valores (0’025 < p < 0’01).
Conclusión
• Como el valor del estadístico de contraste
  (Te=2.15) no supera al valor crítico (Tc=2.38)
  por lo que la diferencia encontrada no es
  significativa con un nivel de confianza del 99%.
• En general en un contraste unilateral derecho
  mantendremos la hipótesis nula cuando el
  estadístico de contraste no supere el valor
  crítico

• y la rechazaremos en caso contrario, es decir,
  cuando
• Si comparamos el nivel p-crítico con el nivel de
  significación:

            0’0175 < 0’01
  se llega a la misma conclusión.
Interpretación del resultado
• Al nivel de confianza del 99% los resultados no
  indican que la puntuación media en depresión
  sea mayor en el grupo de sujetos que no
  reciben visitas respecto de los que sí las
  reciben. Pero los resultados sí son
  significativos al nivel de confianza del 95%,
  como apreciamos al comparar el nivel de
  significación con el nivel crítico.
Interpretación del resultado
• Quizás fuera conveniente profundizar en la
  relación entre ser visitado o no por los
  familiares y puntuar más alto en depresión en
  las personas que permanecen ingresadas en
  centros geriátricos.
¿Experimentos chorras o de
      sentido común?
Intervalo de confianza




         (-18.2942, 28.2942)
• XXX
  Ejemplo 3.3. Un laboratorio desarrolla un
  fármaco con el que se pretende reducir la
  ansiedad. Para comprobarlo, se extrajeron dos
  muestras aleatorias de cinco observaciones
  cada una que suponemos procedentes de
  poblaciones que se distribuyen normalmente
  con distinta varianza.
• Ejemplo 3.3. A los sujetos de la primera
  muestra se les administró el fármaco y los de
  la segunda una sustancia placebo.
  Posteriormente se les midió la ansiedad a
  todos los sujetos mediante un test en el que
  cuanto más elevada es la puntuación mayor es
  la ansiedad.
• Ejemplo 3.3. Las resultados de ambas
  muestras fueron:

• Grupo 1 (con fármaco): {10; 20; 30; 20; 5}
• Grupo 2 (sin fármaco): {30; 50; 30; 60; 20}

Con un nivel de confianza del 95%, ¿podemos
  afirmar que el fármaco efectivamente reduce
  la ansiedad?
Condiciones y supuestos
• Necesitamos asumir que la variable
  dependiente esté medida a nivel de intervalo.
  En cuanto a las poblaciones de las que
  proceden las varianzas, necesitamos
  suponerlas normalmente distribuidas porque
  el tamaño de las muestras es pequeño. En
  este caso tampoco conocemos las varianzas
  poblacionales, aunque las suponemos
  distintas.
Dos muestras independientes
                                                  DM de la
                Sujetos que       Sujetos que     diferencia de
                 reciben el        reciben el     medias
Variable X      fármaco (1)       placebo (2)
=
Ansiedad
               X1 = 10, 20, 30, X = 30, 50, 30,
                                 2
                    20, 5           60, 20
Distribución
normal




                       MUESTRAS
POBLACIÓN
Formulamos las hipótesis
• De acuerdo con la hipótesis del laboratorio
  esperamos que la puntuación media sea
  inferior en el grupo 1 (nuestro fármaco reduce
  la ansiedad significativamente), por lo que
  hemos de plantear un contraste de hipótesis
  unilateral izquierdo.
• Luego la hipótesis completa será:
• Esta hipótesis se puede plantear también
  como:
Estadístico de contraste
Distribución muestral
• El estadístico T sigue una distribución muestral
  t de Student con los grados de libertad
  (redondeando al entero más próximo):
Dos muestras independientes
                                                  DM de la
                Sujetos que       Sujetos que     diferencia de
                 reciben el        reciben el     medias
Variable X      fármaco (1)       placebo (2)
=
Ansiedad
               X1 = 10, 20, 30, X = 30, 50, 30,
                                 2
                    20, 5           60, 20
Distribución
normal




                       MUESTRAS
POBLACIÓN
Dos muestras independientes
                                                  DM de la
                Sujetos que       Sujetos que     diferencia de
                 reciben el        reciben el     medias
Variable X      fármaco (1)       placebo (2)
=
Ansiedad
               X1 = 10, 20, 30, X = 30, 50, 30,
                                 2
                    20, 5           60, 20
Distribución
normal




                       MUESTRAS
POBLACIÓN
Dos muestras independientes
                                                  DM de la
                Sujetos que       Sujetos que     diferencia de
                 reciben el        reciben el     medias
Variable X      fármaco (1)       placebo (2)
=
Ansiedad
               X1 = 10, 20, 30, X = 30, 50, 30,
                                 2
                    20, 5           60, 20
Distribución
normal




                       MUESTRAS
POBLACIÓN
Dos muestras independientes
                                                  DM de la
                Sujetos que       Sujetos que     diferencia de
                 reciben el        reciben el     medias
Variable X      fármaco (1)       placebo (2)
=
Ansiedad
               X1 = 10, 20, 30, X = 30, 50, 30,
                                 2
                    20, 5           60, 20
Distribución
normal




                       MUESTRAS
POBLACIÓN
Dos muestras independientes
                                                  DM de la
                Sujetos que       Sujetos que     diferencia de
                 reciben el        reciben el     medias
Variable X      fármaco (1)       placebo (2)
=
Ansiedad
               X1 = 10, 20, 30, X = 30, 50, 30,
                                 2
                    20, 5           60, 20
Distribución
normal




                       MUESTRAS
POBLACIÓN
• Regla de decisión: buscamos en las tablas t de
  Student el valor t que deje por debajo de sí un
  área del 0.05 (y 1-0.05 = 0.95 por encima) con
  6 grados de libertad:
Valor t con 6 grados de libertad y que deja por encima
de sí el 0.05 del área (valor positivo, luego su negativo
              deja por debajo de sí el 0.05)
Valor p-crítico
• Conclusión: el valor del estadístico de
  contraste es una puntuación más extrema que
  el valor crítico que hemos buscado en la tabla
  t de Student (-2.46 < -1.94) por lo que
  rechazamos la hipótesis nula.
• Con la misma lógica que en todos los contrastes,
  en general en un contraste bilateral izquierdo
  mantendremos la hipótesis nula cuando se
  cumpla que



  y la rechazaremos si
• Para calcular aproximadamente el nivel p-
  crítico, en la tabla t de Student, para 6 grados
  de libertad, tenemos que se encuentra entre
               2.447 < 2.46 < 3.143
• por lo que deducimos que el nivel p-crítico
  estará comprendido entre las probabilidades
  de encontrar valores iguales o inferiores a
  estas dos puntuaciones
           1- 0.975 = 0.025
           1- 0.990 = 0.01
•       0.01 > p_crítico > 0.025
Interpretar el resultado
• A un nivel de confianza del 95% concluimos
  que la media en ansiedad es inferior para el
  grupo que tomó el fármaco, por lo que
  concluimos que, efectivamente, reduce la
  ansiedad.
Consideraciones sobre los contrastes de
  hipótesis en dos muestras independientes
• En el primer contraste de hipótesis incluíamos
  entre los supuestos el que las varianzas
  poblacionales son conocidas, lo que
  difícilmente podremos asumir en un caso
  práctico.
• Si no conocemos las medias de las
  poblaciones con las que trabajamos,
  difícilmente podremos considerar que sí
  conocemos sus varianzas.
• Lo más habitual, por lo tanto, será asumir que
  las varianzas poblacionales son desconocidas,
  y en este caso el contraste más utilizado es en
  el que suponemos varianzas poblacionales
  iguales.
• Este supuesto, al que denominaremos
  homocedasticidad, es muy común en otras
  técnicas estadísticas, como veremos en los
  temas en que compararemos las medias de
  más de dos grupos (Análisis de la Varianza) o
  en el Análisis de Regresión.
• La cuestión estriba en que podamos asumir la
  normalidad de la distribución muestral de las
  diferencias de las medias, lo que podremos
  garantizar si las muestras que utilizamos son
  grandes. Si la distribución muestral es normal
  y los tamaños de ambas muestras son iguales,
  podemos despreocuparnos de las varianzas
  poblacionales y suponer sin más que son
  iguales, sin que por ello peligre la validez del
  contraste de hipótesis que estamos
  realizando.
• Ahora bien, habrá casos en los que la opción
  más acertada será suponer varianzas
  poblacionales distintas, y por lo tanto
  tendremos que utilizar el estadístico de
  contraste apropiado.
• En la literatura científica sobre este tema se
  proponen diferentes procedimientos para
  ajustar los grados de libertad de la
  distribución muestral. Nosotros hemos
  utilizado la solución propuesta por Welch.
• El procedimiento de Welch nos ofrece un valor
  inferior para los grados de libertad en relación
  a si tomamos n1+n2-2. Recuérdese en el
  ejemplo anterior que
       n1+n2-2=5+5-2=8
  pero escogimos el valor dado por la fórmula
            gl = 6.
• El contraste por lo tanto es más conservador
  (para un mismo alpha), siendo más difícil
  rechazar la hipótesis nula.
• Muchos investigadores sugieren que ha de
  realizarse previamente un contraste de
  hipótesis sobre la igualdad las varianzas, de
  manera que si aceptamos la hipótesis nula



  las supondremos iguales y en caso contrario
  diferentes.
TEST DE MANN-WHITNEY-WILCOXON
• Cuando no podamos asumir los supuestos
  necesarios para realizar un contraste
  paramétrico sobre dos medias en muestras
  independientes, utilizaremos el test de Mann-
  Whitney-Wilcoxon (MWW), con el que
  pondremos a prueba la igualdad o
  desigualdad de las medianas de las
  poblaciones de las que proceden las muestras,
  pudiendo plantearse, al igual que en el caso
  de las medias, contrates unilaterales o
  bilaterales.
TEST DE MANN-WHITNEY-WILCOXON

• También podemos emplear el test MWW para
  reducir o eliminar el impacto de los valores
  atípicos (outliers) ya que utiliza los valores
  ordinales de los datos, no los propios datos.
Supuestos
• La variable dependiente empleada debe ser, al
  menos, de nivel ordinal.
• Las distribuciones subyacentes a partir de las
  que se han extraído las muestras deben tener
  la misma forma. Dicha forma no tiene porque
  ser normal, si bien, el supuesto de igualdad de
  forma conlleva el supuesto de
  homocedasticidad.
• Aunque se deba asumir la homocedasticidad,
  el test MWW no se muestra tan afectado por
  la violación del supuesto de homocedasticidad
  como lo es el test paramétrico
  correspondiente.
Ejemplo 3.4
• Un equipo de psicólogos evolutivos ha
  estudiado como adquieren los niños la
  capacidad de empatizar con otros. Para este
  fin han desarrollado un test para medir la
  empatía en niños pequeños. Los estudios
  preliminares han mostrado que los chicos son
  más lentos en desarrollar esta capacidad y,
  además, la desarrollan en menor cuantía que
  las chicas.
Ejemplo 3.4
• En uno de estos estudios se eligieron dos
  grupos al azar, uno de niños (Grupo 1) y otro
  de niñas (Grupo 2) y las puntuaciones
  obtenidas, en una escala de intervalo, fueron:
•      Grupo 1: 13; 13; 25; 13; 18; 8
•      Grupo 2: 27; 21; 15; 21; 23; 30; 16
• Determine si estos resultados apoyan la
  afirmación de que los niños tienen menor
  empatía que las chicas (α = 0’05).
Condiciones y supuestos
• Aunque la variable dependiente está medida a
  un nivel de intervalo, no sabemos cómo es la
  forma de las distribuciones de niños y niñas en
  la población (normal, t, …).
• Por otro lado, el tamaño de las muestras es
  pequeño (6 y 7 elementos, respectivamente ),
  y por lo tanto no podemos asumir que la
  distribución muestral de las diferencias es
  normal, por lo que realizamos un contraste no
  paramétrico aplicando el test MWW.
• En general necesitamos que se cumplan las
  siguientes condiciones:
  – Variable dependiente medida en una escala al
    menos ordinal.
  – Distribuciones poblacionales con la misma forma.
Formulamos las hipótesis
• Queremos contrastar si los niños (Grupo 1)
  tienen menor empatía que las niñas (Grupo
  2), por lo que el contraste es unilateral
  izquierdo. Las hipótesis planteadas hacen
  referencia a las medianas poblacionales.
Formulamos las hipótesis
• Luego la hipótesis completa es:
Estadístico de contraste
• Para calcular el estadístico del test MWW
  debemos combinar las dos muestras y
  transformar las observaciones directas en
  rangos, calculando la suma de los rangos
  pertenecientes a cada muestra por separado.
Estadístico de contraste
• La lógica del estadístico MWW consiste en que
  si la mediana de la población de la que se ha
  extraído la primera muestra es inferior a la
  mediana de la segunda población (de la que
  se ha extraído la segunda muestra)
  deberíamos esperar que la suma de los
  órdenes pertenecientes a la primera muestra
  fuese inferior a la suma de los órdenes
  pertenecientes a la segunda muestra.
Comenzamos asignando rangos a todas las puntuaciones
                 8, 13, 15, 16, 18, 21, 23, 25, 27, 30



                     Grupo 1                        Grupo 2

Sujeto      1    2   3    4    5   6   7   8    9     10 11 12 13

Empatía 13 13 25 13 18             8   27 21 15 21 23 30 16

Rango       3    3   11   3    7   1   12 8’5   5     8’5 10 13   6
• Observamos que hay empates.
• En el Grupo 1 hay tres puntuaciones iguales
  (sujetos 1, 2 y 4 con puntuaciones todas
  iguales a 13), a las que les corresponderían los
  rangos 2, 3, 4, y a las que asignamos el rango
  medio de estos tres valores:
• De igual forma, las puntuaciones de los
  sujetos 8 y 10 son igual a 21, y ocupan los
  lugares octavo y noveno, por lo que les
  asignamos el rango 8’5.
• A continuación calculamos las sumas de los rangos
  para cada una de las muestras y a los que
  llamaremos S1 para el primer grupo y S2 para el
  segundo:
   – Grupo 1: S1 = 3 + 3 + 11 + 3 + 7 + 1 = 28
   – Grupo 2: S2 = 12 + 8’5 + 5 + 8’5 + 10 + 13 + 6 = 63

                  Grupo 1                        Grupo 2
Sujeto    1   2   3    4    5   6   7   8    9     10 11 12    13
Empatía   13 13 25 13 18        8   27 21 15 21 23 30          16
Rango     3   3   11   3    7   1   12 8’5   5     8’5 10 13   6
• Obtenemos los estadísticos U1 y U2, restando a
  S1 y S2 el sumatorio de rangos total de cada
  sub-grupo:
• Si, v.g., tuviéramos un grupo con 2
  puntuaciones, tendríamos los rangos 1º y 2º,
  cuyo sumatorio da 3.
• Si, v.g., tuviéramos un grupo con 3
  puntuaciones, tendríamos los rangos 1º, 2º y
  3º, cuyo sumatorio da 6.
• Si, v.g., tuviéramos un grupo con 4
  puntuaciones, tendríamos los rangos 1º, 2º, 3º
  y 4º, cuyo sumatorio da 10.




• Y así sucesivamente.
• Luego la expresión




• Nos proporciona el sumatorio de los rangos
  totales de los elementos de ese grupo. La
  diferencia entre los valores Si obtenidos y este
  valor es un índice de discrepancia.
• Para el primer grupo




• El sumatorio de los 6 primeros rangos del
  grupo con 6 puntuaciones daría un total de 21
  (1/2 * 6 * 7) si consideramos el grupo por sí
  solo. En el grupo total se ha obtenido 28.
• Para el segundo grupo




• El sumatorio de los 7 primeros rangos del
  grupo con 7 puntuaciones daría un total de 28
  (1/2 * 7 * 8) si consideramos el grupo por sí
  solo. En el grupo total se ha obtenido 63.
• Las tablas están tabuladas en función del valor
  más pequeño de Ui. Luego escogemos el
  mínimo del conjunto
                  {7, 35}
  que resulta ser 7.
• Este valor es el estadístico de contraste
  obtenido.
Regla de decisión
• La Tabla U de Mann-Whitney-Wilcoxon
  expresa los valores críticos U en función del
  número de sujetos de cada grupo, del nivel de
  confianza y del tipo de contraste (bilateral o
  unilateral). Acudiendo a dicha tabla con
  α = 0’05; n1 = 6 y n2 = 7, obtenemos un valor
  crítico igual a 8.
Conclusión
• La significación (rechazo de H0) se alcanza si el
  estadístico de contraste (valor U obtenido en
  la muestra, en nuestro caso 7) es igual o
  menor que el valor crítico extraído de la tabla
  (en nuestro caso 8) al nivel de significación
  especificado.
• Como 7 < 8, rechazamos la hipótesis nula al
  nivel de confianza del 95%.
Interpretación del resultado
• Al nivel de confianza del 95%, los resultados
  apoyan la afirmación de que los niños tienen
  menor empatía que las niñas, resultado que
  está de acuerdo con los estudios preliminares
  llevados a cabo por el equipo de psicólogos
  evolutivos y que se citan en el enunciado.
Aproximación a la normal con
        muestras grandes
• Cuando n1 o n2 son superiores a 20 podemos
  utilizar el Teorema del Límite Central para
  demostrar que el estadístico




• se distribuye según una z:
• En donde el término




representa el valor medio esperado de U si H0 es
   cierta, es decir, si realmente los dos grupos
   tienen idéntica mediana.
El denominador de Z representa el error típico
   de la distribución muestral del estadístico Ui.
• Aunque con los datos del Ejemplo 3.4 no
  tenemos suficientes sujetos para utilizar la
  aproximación a la distribución normal, lo
  haremos para ilustrar su cálculo.
• Observamos que en el estadístico Z se ha
  puesto Ui, ya que podemos utilizar U1 o U2
  para realizar el contraste.
• Observamos que en el estadístico Z se ha
  puesto Ui, ya que podemos utilizar U1 o U2
  para realizar el contraste.
• Estos resultados nos informan que el valor U1
  (Grupo 1) es inferior al valor medio esperado
  si H0 es cierta (con un alpha = 0.05, el valor de
  la Z crítica es -1.64)
CONTRASTE DE HIPÓTESIS SOBRE
         DOS VARIANZAS EN MUESTRAS
                INDEPENDIENTES
• Ejemplo 3.5. Eysenck (1981) afirmaba que
  hombres y mujeres tienen la misma
  puntuación media en cociente intelectual (CI),
  pero que los hombres muestran mayor
  variabilidad en inteligencia. Para comprobar la
  hipótesis de Eysenck, seleccionamos
  aleatoriamente una muestra de 41 hombres y
  otra de 31 mujeres.
CONTRASTE DE HIPÓTESIS SOBRE DOS
 VARIANZAS EN MUESTRAS INDEPENDIENTES
• Ejemplo 3.5. Tras aplicar un test de
  inteligencia en ambas muestras, observamos
  que la cuasivarianza en el grupo de hombres
  es igual a 289, mientras que en el de mujeres
  vale 225. Con un nivel de confianza del 99%
  ¿avalan estos datos la hipótesis de Eysenck de
  que existen diferencias en la variabilidad del CI
  entre mujeres y hombres, siendo la de éstos
  mayor?
Dos muestras independientes
                                          DM de la
              Hombres (1)   Mujeres (2)   diferencia de
                                          varianzas
Variable X
=
CI




                    MUESTRAS
POBLACIÓN
CONDICIONES Y SUPUESTOS

• Asumimos que las puntuaciones que nos
  proporcionan los tests de inteligencia miden
  este constructo en una escala de intervalo, y
  que la variable medida se distribuye
  normalmente tanto en la población de
  hombres como en la de mujeres.
CONDICIONES Y SUPUESTOS

• En general, los supuestos necesarios son:

• Variable dependiente con un nivel de medida
  de intervalo o razón.
• Dos poblaciones con variables normalmente
  distribuidas, o bien n1 ≥ 30 y n2 ≥ 30.
Formulamos la hipótesis
• Plantearemos un contraste unilateral
  derecho, en el que la hipótesis alternativa
  corresponderá a la sugerida por Eysenck, e
  indicará que la variabilidad en inteligencia es
  superior en el grupo de hombres.
• En consecuencia, las hipótesis son:
• También podemos expresarlas como una
  razón:
• Y por consiguiente:
Estadístico de contraste
• El estadístico de contraste sigue una
  distribución muestral “F” de Fisher:
Dos muestras independientes
                                          DM de la
              Hombres (1)   Mujeres (2)   diferencia de
                                          varianzas
Variable X
=
CI




                    MUESTRAS


POBLACIÓN
Estadístico de contraste
• Los grados de libertad del numerador y
  denominador son, respectivamente:
Nivel p-crítico
•     El cálculo del nivel p-crítico mediante las
  tablas será aproximado.
• Observamos en dichas tablas que el primer
  valor que nos ofrecen para 40 y 30 grados de
  libertad es igual a 1’573, al que supera una
  proporción igual a 0’10, luego con las tablas
  tan sólo podemos saber que el nivel p-crítico
  es mayor que 0’10 (p > 0’10).
F empírica = 1.28
Nivel p-crítico
• Luego con las tablas tan sólo podemos saber
  que el nivel p-crítico es mayor que 0’10
  (p > 0’10).
  Con un programa informático adecuado
  concluiríamos que el valor exacto de p es
  0’2432.
• Regla de decisión: a un nivel de confianza del
  99% para 40 y 30 grados de libertad, el valor
  crítico es igual a 2’299.
Conclusión
• A la vista de los resultados mantenemos la
  hipótesis nula a un nivel de confianza del 99%,
  puesto que el valor del estadístico de
  contraste es inferior al valor crítico.
• Los resultados obtenidos están lejos de ser
  significativos para cualquier nivel de confianza
  razonable.
• Concluimos por lo tanto que la varianza de
  hombres y mujeres en inteligencia es la
  misma.
Interpretar el resultado
• Eysenck (1981) afirmaba que el hecho de que
  los hombres mostrasen mayor variabilidad en
  inteligencia implica que hay más hombres que
  mujeres con CI muy altos y con CI muy bajos.
  Si estos hubiesen sido los resultados de un
  estudio con todas las garantías, los resultados
  no apoyarían la hipótesis de Eysenck.
Propiedad recíproca de la
            distribución F
• Aunque en este contraste no ha sido necesario
  utilizarla, recordamos la propiedad recíproca
  de la distribución F que nos permite calcular
  probabilidades que no aparecen en la tabla:
THE TOP TEN REASONS TO BECOME A
          STATISTICIAN
Deviation is considered normal.
We feel complete and sufficient.
We are "mean" lovers.
Statisticians do it discretely and
continuously.
We are right 95% of the time.
THE TOP TEN REASONS TO BECOME A
          STATISTICIAN
  We can legally comment on someone's
  posterior distribution.
  We may not be normal but we are
  transformable.
  We never have to say we are certain.
  We are honestly significantly different
  (HSD).
  No one wants our jobs.

Contenu connexe

Tendances

Analisis de datos categoricos
Analisis de datos categoricosAnalisis de datos categoricos
Analisis de datos categoricosAsura Nephilim
 
ANALISIS DE VARIANZAS
ANALISIS DE VARIANZASANALISIS DE VARIANZAS
ANALISIS DE VARIANZASWilliam Leon
 
Distribuciones de Probabilidad
Distribuciones de ProbabilidadDistribuciones de Probabilidad
Distribuciones de ProbabilidadViri_TPerales
 
7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA) 7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA) Consuelo Valle
 
Prueba t varianzas combinadas
Prueba t varianzas combinadasPrueba t varianzas combinadas
Prueba t varianzas combinadasjagi100
 
Pruebas no paramétricas en SPSS
Pruebas no paramétricas en SPSSPruebas no paramétricas en SPSS
Pruebas no paramétricas en SPSSJairo Acosta Solano
 
CONCEPTOS BASICOS
CONCEPTOS BASICOS CONCEPTOS BASICOS
CONCEPTOS BASICOS yoselis123
 
AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)Diego
 
Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...
Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...
Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...Luz Hernández
 
Analisis de la_varianza_
Analisis de la_varianza_Analisis de la_varianza_
Analisis de la_varianza_J M
 

Tendances (18)

Analisis de datos categoricos
Analisis de datos categoricosAnalisis de datos categoricos
Analisis de datos categoricos
 
Estadistica
EstadisticaEstadistica
Estadistica
 
ANALISIS DE VARIANZAS
ANALISIS DE VARIANZASANALISIS DE VARIANZAS
ANALISIS DE VARIANZAS
 
Estadistica ad
Estadistica adEstadistica ad
Estadistica ad
 
ANOVA
ANOVAANOVA
ANOVA
 
Anova
AnovaAnova
Anova
 
Distribuciones de Probabilidad
Distribuciones de ProbabilidadDistribuciones de Probabilidad
Distribuciones de Probabilidad
 
Distribucion de la diferencia de medias
Distribucion de la diferencia de mediasDistribucion de la diferencia de medias
Distribucion de la diferencia de medias
 
7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA) 7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA)
 
Supuestos andeva
Supuestos andevaSupuestos andeva
Supuestos andeva
 
Prueba t varianzas combinadas
Prueba t varianzas combinadasPrueba t varianzas combinadas
Prueba t varianzas combinadas
 
Anova 3
Anova 3Anova 3
Anova 3
 
Pruebas no paramétricas en SPSS
Pruebas no paramétricas en SPSSPruebas no paramétricas en SPSS
Pruebas no paramétricas en SPSS
 
CONCEPTOS BASICOS
CONCEPTOS BASICOS CONCEPTOS BASICOS
CONCEPTOS BASICOS
 
AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)AnáLisis De Varianza (Anova)
AnáLisis De Varianza (Anova)
 
Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...
Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...
Muestreo por diferencias de medias aritmeticas y por diferencia de proporcion...
 
Analisis de la_varianza_
Analisis de la_varianza_Analisis de la_varianza_
Analisis de la_varianza_
 
Presentacion jose alejandro
Presentacion jose alejandroPresentacion jose alejandro
Presentacion jose alejandro
 

Similaire à Man4

Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)
Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)
Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)HOTELES2
 
MODULO DE ESTADISTICA
MODULO DE ESTADISTICAMODULO DE ESTADISTICA
MODULO DE ESTADISTICAverofernandez
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadisticahoteles1
 
Trabajo hipotesis
Trabajo hipotesisTrabajo hipotesis
Trabajo hipotesishoteles1
 
GRUPO 4 - Tstudent 1 (5).pptx
GRUPO 4 - Tstudent 1 (5).pptxGRUPO 4 - Tstudent 1 (5).pptx
GRUPO 4 - Tstudent 1 (5).pptxJimenaDoSa
 
Introducción a la Probabilidad - II parte
Introducción a la Probabilidad - II parteIntroducción a la Probabilidad - II parte
Introducción a la Probabilidad - II partePaolo Castillo
 
distribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptxdistribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptxAlexAndrade396300
 
Inferencia Estadística
Inferencia EstadísticaInferencia Estadística
Inferencia Estadísticaldbb2290
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherlaura ochoa
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherlaura ochoa
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherlaura ochoa
 
Técnicas de muestreo
Técnicas de muestreoTécnicas de muestreo
Técnicas de muestreoskchabelina
 

Similaire à Man4 (20)

Man3
Man3Man3
Man3
 
Man3
Man3Man3
Man3
 
Biometria clase 6
Biometria clase 6Biometria clase 6
Biometria clase 6
 
Analisis de varianza.doc
Analisis de varianza.docAnalisis de varianza.doc
Analisis de varianza.doc
 
Medidas de Dispersión
Medidas de DispersiónMedidas de Dispersión
Medidas de Dispersión
 
Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)
Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)
Planteamiento de Hipótesis de dos poblaciones para proporción (POWER POINT)
 
Estimacion y muestreo
Estimacion y muestreoEstimacion y muestreo
Estimacion y muestreo
 
medidas de tendencia central
medidas de tendencia centralmedidas de tendencia central
medidas de tendencia central
 
MODULO DE ESTADISTICA
MODULO DE ESTADISTICAMODULO DE ESTADISTICA
MODULO DE ESTADISTICA
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
 
Trabajo hipotesis
Trabajo hipotesisTrabajo hipotesis
Trabajo hipotesis
 
GRUPO 4 - Tstudent 1 (5).pptx
GRUPO 4 - Tstudent 1 (5).pptxGRUPO 4 - Tstudent 1 (5).pptx
GRUPO 4 - Tstudent 1 (5).pptx
 
Introducción a la Probabilidad - II parte
Introducción a la Probabilidad - II parteIntroducción a la Probabilidad - II parte
Introducción a la Probabilidad - II parte
 
Análisis de Varianza
Análisis de Varianza Análisis de Varianza
Análisis de Varianza
 
distribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptxdistribuciones fundamentales de muestreo.pptx
distribuciones fundamentales de muestreo.pptx
 
Inferencia Estadística
Inferencia EstadísticaInferencia Estadística
Inferencia Estadística
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisher
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisher
 
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisherPlanteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisher
 
Técnicas de muestreo
Técnicas de muestreoTécnicas de muestreo
Técnicas de muestreo
 

Dernier

SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaLuis Minaya
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...fcastellanos3
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTESaraNolasco4
 
EJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docx
EJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docxEJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docx
EJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docxFabianValenciaJabo
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfssuser50d1252
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 
GUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIA
GUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIAGUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIA
GUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIAELIASPELAEZSARMIENTO1
 
Presentacion minimalista aesthetic simple beige_20240415_224856_0000.pdf
Presentacion minimalista aesthetic simple beige_20240415_224856_0000.pdfPresentacion minimalista aesthetic simple beige_20240415_224856_0000.pdf
Presentacion minimalista aesthetic simple beige_20240415_224856_0000.pdfSarayLuciaSnchezFigu
 
Concurso José María Arguedas nacional.pptx
Concurso José María Arguedas nacional.pptxConcurso José María Arguedas nacional.pptx
Concurso José María Arguedas nacional.pptxkeithgiancarloroquef
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxRAMON EUSTAQUIO CARO BAYONA
 
PLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADO
PLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADOPLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADO
PLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADOMARIBEL DIAZ
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxMartín Ramírez
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfssuser50d1252
 

Dernier (20)

SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
EJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docx
EJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docxEJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docx
EJEMPLO MODELO DE PLAN DE REFUERZO ESCOLAR.docx
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 
GUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIA
GUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIAGUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIA
GUIA DE TEXTOS EDUCATIVOS SANTILLANA PARA SECUNDARIA
 
Presentacion minimalista aesthetic simple beige_20240415_224856_0000.pdf
Presentacion minimalista aesthetic simple beige_20240415_224856_0000.pdfPresentacion minimalista aesthetic simple beige_20240415_224856_0000.pdf
Presentacion minimalista aesthetic simple beige_20240415_224856_0000.pdf
 
Concurso José María Arguedas nacional.pptx
Concurso José María Arguedas nacional.pptxConcurso José María Arguedas nacional.pptx
Concurso José María Arguedas nacional.pptx
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
 
PLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADO
PLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADOPLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADO
PLAN DE TUTORIA- PARA NIVEL PRIMARIA CUARTO GRADO
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
 

Man4

  • 1. DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 3 Análisis de datos paramétricos para diseños de dos grupos
  • 2. Introducción • En los diseños de una única muestra no existe grupo o muestra de comparación. • Sin embargo, generalmente será conveniente, y en algunos casos necesario, utilizar más de una muestra.
  • 3. Joke • Dos señoras conversando en el bar: • María: “bueno, y tu marido en la cama, ¿qué tal es?” • …. • Juana: “¿comparado con quién?”
  • 4. • Es usual la utilización de dos muestras cuando: a) queremos comprobar si existen diferencias entre un grupo experimental y un grupo de control. B) si queremos comprobar la eficacia de un tratamiento mediremos la variable dependiente (v.d.) antes y después del tratamiento y comparamos ambas medias para comprobar si la terapia ha sido eficaz.
  • 5. Muestras independientes Sujeto Grupo v.d. 1 Experimental X1 2 Experimental X2 3 Experimental X3 4 Experimental X4 5 Experimental X5 6 Control X6 7 Control X7 8 Control X8 9 Control X9 10 Control X10
  • 6. Muestras dependientes Sujeto v.d. antes del v.d. después del tratamiento tratamiento 1 X1a X1d 2 X2a X2d 3 X3a X3d 4 X4a X4d 5 X5a X5d
  • 7. • En otras ocasiones el mismo problema que queremos investigar nos obliga a utilizar dos muestras, porque queremos estudiar diferencias entre dos poblaciones diferentes, como puede ser entre hombres y mujeres, entre ambiente rural y urbano, entre dos clases sociales, etc. • Obsérvese que estas diferencias exigen un diseño inter-sujetos (muestras independientes)
  • 8. MUESTRAS INDEPENDIENTES O RELACIONADAS • En todas las técnicas estadísticas que vemos en este curso suponemos que las observaciones dentro de una muestra son independientes, es decir, que no existe relación entre ellas. Por lo tanto, dentro de un grupo el valor de una determinada puntuación no nos informa en absoluto del valor de otras puntuaciones dentro del mismo grupo.
  • 9. MUESTRAS INDEPENDIENTES O RELACIONADAS • En cualquier caso, para garantizar la independencia de los datos dentro de un grupo, lo mejor que puede hacerse es seleccionar a los elementos de la muestra de forma aleatoria. • No obstante, obsérvese que la independencia intra-grupo es un SUPUESTO (y lo mejor que puede hacerse es ponerlo a prueba).
  • 10. • Por tanto, cuando trabajamos con dos muestras (o más de dos), las muestras pueden ser independientes o relacionadas. Son independientes cuando no existe relación entre los sujetos (unidades de observación) de una y otra, lo que podremos garantizar si los sujetos son asignados aleatoriamente a cada una de las muestras.
  • 11. • Tenemos muestras relacionadas cuando cada observación en una muestra tiene su pareja en la otra. El caso más evidente es cuando son los mismos sujetos los que pasan por diferentes condiciones experimentales. • En otras ocasiones no son los mismos sujetos los que se repiten en las muestras, pero hay una relación sujeto a sujeto en ambas.
  • 12. • Por ejemplo, si disponemos de 10 parejas de hermanos gemelos, podemos formar dos grupos de 5 personas donde cada dos hermanos son asignados, aleatoriamente, a grupos distintos. También podemos contar con padres e hijos, maridos y mujeres, etc.
  • 13. • Por último, también podemos utilizar pares de sujetos que están equiparados en variables que pueden influir en el diseño de la investigación. • Por ejemplo, supongamos que para probar la eficacia de dos métodos de enseñanza, queremos controlar la influencia del CI por lo que tomamos pares de sujetos con un CI semejante formando cada uno de ellos parte de muestras diferentes.
  • 14. CONTRASTES DE HIPÓTESIS SOBRE DOS MEDIAS EN MUESTRAS INDEPENDIENTES • En este apartado veremos tres contrastes de hipótesis sobre dos medias para muestras independientes en función de los supuestos que hagamos sobre las varianzas poblacionales. – Supuestas conocidas – Desconocidas pero suponiendo que son iguales – Desconocidas suponiendo que son diferentes.
  • 15. • En todo contraste de hipótesis el proceso de inferencia estadística se realiza sobre una distribución teórica que denominamos distribución muestral (DM). • Nos tenemos que preguntar cómo se compone la distribución muestral en el caso de dos medias con muestras independientes.
  • 16. Distribución muestral de la diferencia de medias para dos muestras independientes • Supongamos que tenemos dos poblaciones, y que cada una de ellas contiene 3 observaciones. • Denotaremos las puntuaciones mediante la letra latina Y. Presentamos las puntuaciones, la media y la varianza de dichas poblaciones.
  • 17. Población Muestra DM Población 1 Población 2 Muestra 1 Muestra 2 Y11= 2 Y21= 3.5 Y12= 5 Y22= 5 Y13= 8 Y23= 6.5
  • 18. • El primer subíndice hace referencia a la población/muestra a la que pertenecen y el segundo al orden que cada puntuación ocupa en su muestra. • Podemos calcular la media aritmética de todas las sub-muestras de tamaño, v.g., n = 2 con reposición para la Población 1, y que formarán la distribución muestral de la media para dicha población en muestras de tamaño n = 2.
  • 19.
  • 20.
  • 21. • Ahora debemos plantearnos ¿cuál será la DM de las DIFERENCIAS entre las medias de cada par posible de muestras?
  • 22. • Teóricamente podríamos plantearnos otra función de las medias muestrales (v.g., su suma, su producto, etc.) pero estaremos de acuerdo en que la diferencia entre las medias es la más sencilla además de que es congruente con la idea que subyace a H0: no existen diferencias entre ambas muestras, lo cual implica que su diferencia, por término medio, será cero.
  • 23.
  • 24. • Otra fórmula para calcular la varianza de las diferencias, en términos de las varianzas de las poblaciones originales, es:
  • 25. • En los contrastes que veremos a continuación vamos a suponer que las poblaciones de las que proceden las muestras que utilizaremos: – se distribuyen normalmente, o –n1 ≥ 30 y n2 ≥ 30.
  • 26. Esto nos garantiza que las distribuciones muestrales de la media en ambos casos también se distribuyen normalmente y, si esto es así, también se distribuirá normalmente la distribución muestral de las diferencias entre medias.
  • 27. Varianzas poblacionales conocidas • Ejemplo 3.1. Un psicólogo escolar utiliza un test de comprensión verbal recientemente traducido del inglés, que proporciona puntuaciones en un nivel de medida de intervalo.
  • 28. Varianzas poblacionales conocidas • Ejemplo 3.1 Se sabe, por investigaciones anteriores, que las varianzas en la población son para niños y niñas Respectivamente.
  • 29. Varianzas poblacionales conocidas • Ejemplo 3.1. Las investigaciones anteriores también indican que la media es la misma en ambos grupos, pero este último aspecto no ha sido comprobado con muestras españolas. El psicólogo considera que la traducción del test no es muy acertada y puede provocar diferencias que en realidad no se deben a la comprensión verbal.
  • 30. Varianzas poblacionales conocidas • Ejemplo 3.1. Por ello selecciona aleatoriamente una muestra de 100 niños y otra muestra de 200 niñas obteniendo una media igual a 20 para los niños e igual a 17’5 para las niñas. Con un nivel de confianza del 95%. ¿Podemos afirmar que la puntuación media en el test de comprensión verbal es la misma para niños y niñas?
  • 31. Condiciones y supuestos • Tenemos un diseño de dos muestras independientes (niños y niñas) en el que la variable dependiente (comprensión verbal) proporciona puntuaciones en una escala de intervalo. Aunque no sabemos si las poblaciones se distribuyen normalmente, trabajamos con muestras que son lo suficientemente grandes (n1 ≥ 30 y n2 ≥ 30).
  • 32. • Finalmente, el psicólogo asume que las varianzas de las poblaciones de niños y niñas son las que reflejan las investigaciones anteriores. En definitiva se cumplen los siguientes supuestos: • Variable dependiente con un nivel de medida de intervalo o razón. • Dos poblaciones que se distribuyen normalmente, o bien n1 ≥ 30 y n2 ≥ 30. • Varianzas poblacionales conocidas.
  • 33. Formulamos las hipótesis • En este caso el psicólogo piensa que pueden existir diferencias pero no tiene una hipótesis previa sobre la dirección de las mismas, por lo que planteamos un contraste de hipótesis bilateral:
  • 34. Formulamos las hipótesis • O equivalentemente:
  • 35. Estadístico de contraste y su DM • Conocemos las varianzas de las dos poblaciones y trabajamos con muestras grandes, lo que nos permite asumir la normalidad de la distribución muestral de las diferencias entre medias.
  • 36. Dos muestras independientes DM de la Niños (1) Niñas (2) diferencia de medias Variable X = Comprensión verbal MUESTRAS POBLACIÓN
  • 37. Dos muestras independientes DM de la Niños (1) Niñas (2) diferencia de medias Variable X = Comprensión verbal MUESTRAS POBLACIÓN
  • 38. • Observamos que la fórmula del estadístico de contraste sigue el mismo esquema ya visto: cuantifica la discrepancia entre la diferencia de medias observada entre las dos muestras frente a una diferencia nula planteada en la hipótesis nula, todo ello medido en unidades de desviación típica.
  • 39. • Por tanto, en el numerador tenemos la diferencia entre el valor del estadístico en la muestra respecto del valor del parámetro que postula la hipótesis nula (que omitimos porque es cero) y en el denominador la desviación típica de la DM del estadístico.
  • 40. • Calculamos el nivel p-crítico en la tabla de curva normal (probabilidad de obtener un valor como el observado o más extremo). • Obtenemos 0.9993
  • 41. • Pero esta p (0.9993) es el área que deja por debajo de sí la curva en el punto 3.21. Como necesitamos conocer el área superior y sabemos que todo el área vale la unidad: 1 – 0.9993 = 0.0007 Además, como el contraste es bilateral, multiplicamos esta p por 2: 2 x 0.0007 = 0.0014
  • 42.
  • 43. Nivel p-crítico=0.0007 Alpha/2=0.025
  • 44.
  • 45. • En otras palabras, el estadístico de contraste (la discrepancia observada) supera el valor crítico. • En general, en un contraste bilateral, mantendremos la hipótesis nula cuando el estadístico de contraste no alcance el valor crítico y la rechazaremos cuando:
  • 46. • Si utilizamos el nivel p-crítico para concluir qué decisión tomar con respecto a H0, llegamos a la misma conclusión, puesto que 0’0014 < 0’05 o en general:
  • 47. • El comparar el nivel crítico (p) con el nivel de significación (alpha) nos proporciona más información que la comparación del estadístico de contraste con el valor crítico, puesto que vemos claramente que es muy improbable que siendo la hipótesis nula verdadera obtengamos dos muestras cuyas medias tengan una diferencia como la observada. • El resultado sería significativo incluso a un nivel de confianza superior al 99%.
  • 48. Interpretar el resultado • Las sospechas del psicólogo parecen fundadas. Las diferencias significativas entre niños y niñas en fluidez verbal pueden deberse a una deficiente traducción del test.
  • 49. Intervalo de confianza • Si estuviéramos interesados en calcular el intervalo de confianza, lo haríamos mediante la expresión:
  • 50. Intervalo de confianza (0.975, 4.024)
  • 51. Varianzas poblacionales desconocidas pero supuestas iguales. • Ejemplo 3.2. En un estudio sobre depresión en personas mayores llevado a cabo en un centro geriátrico, se quiere comprobar si las personas ingresadas que no reciben visitas de sus familiares tienen una puntuación media en depresión superior a aquellas personas cuyos familiares les visitan con frecuencia.
  • 52. Varianzas poblacionales desconocidas pero supuestas iguales. • Ejemplo 3.2. Para comprobar esta hipótesis, se seleccionaron aleatoriamente 41 personas que no reciben visitas obteniéndose una puntuación media de 20 puntos con una cuasivarianza igual a 100, mientras que en una muestra aleatoria de 31 personas que si reciben visitas con frecuencia la media fue igual a 15 con una cuasivarianza igual a 90.
  • 53. Varianzas poblacionales desconocidas pero supuestas iguales. • Ejemplo 3.2. Suponiendo que las varianzas en la población son iguales para ambos grupos, y con un nivel de confianza del 99% ¿podemos decir que los datos obtenidos avalan la hipótesis de partida?
  • 54. Dos muestras independientes DM de la Ancianos que Ancianos que diferencia de no reciben reciben visitas medias Variable X visitas (1) (2) = Depresión MUESTRAS POBLACIÓN
  • 55. Condiciones y supuestos • Los requisitos en este caso son iguales que en el caso anterior. La única diferencia es que no conocemos las varianzas poblacionales, si bien las suponemos iguales. Comprobamos pues que se cumplen los siguientes puntos: • Variable dependiente con un nivel de medida de intervalo o razón. Suponemos que el test de depresión proporciona medidas en una escala de intervalo.
  • 56. Condiciones y supuestos • Supuestos: • No sabemos cómo se distribuye la variable en población, pero salvamos este obstáculo utilizando dos muestras con 30 o más observaciones cada una. • Varianzas poblacionales desconocidas y supuestas iguales.
  • 57. Formulamos las hipótesis • Partimos de la hipótesis de que la depresión media es superior en las personas que no reciben visitas de sus familiares (Grupo 1) respecto de las personas que reciben con frecuencia visitas de sus familiares (Grupo 2)
  • 58. Formulamos las hipótesis • En consecuencia, el contraste de hipótesis completo será unilateral derecho:
  • 59. Formulamos las hipótesis • Expresado en términos de desigualdades será:
  • 60. Estadístico de contraste • El estadístico de contraste en este caso se distribuye según t de Student con n1+n2-2 grados de libertad (obsérvese la cuasivarianza):
  • 61. Dos muestras independientes DM de la Ancianos que Ancianos que diferencia de no reciben reciben visitas medias Variable X visitas (1) (2) = Depresión MUESTRAS POBLACIÓN
  • 62. Estadístico de contraste • El estadístico de contraste en este caso se distribuye según t de Student con n1+n2-2 grados de libertad vale 2.14728.
  • 63. Establecemos la regla de decisión • Buscamos en las tablas de t de Student el valor crítico (contraste unilateral), que en este caso es igual a la puntuación que supera al 99% de la distribución para 70 grados de libertad, que se corresponde con 2.381
  • 64.
  • 65.
  • 66. Un valor de t=2.381 (el valor crítico) deja por encima de sí el 0.01 del área de la distribución.
  • 67. Mientras que el valor t = 2.15 deja por encima de sí algo más del 0.01 del área (las tablas no nos permiten determinarlo exactamente)
  • 68. • El nivel p-crítico es igual a p = 0’0175, pero no podemos calcularlo exactamente en las tablas del apéndice. • No obstante, podemos utilizarlas para calcularlo de forma aproximada, observando que para 70 grados de libertad nuestro estadístico de contraste se encuentra entre las puntuaciones 1’994 y 2’381 (1’994 < 2’15 < 2’381) que dejan por encima de si respectivamente las proporciones: 0’025 y 0’01, luego el nivel p-crítico se encontrará entre estos dos últimos valores (0’025 < p < 0’01).
  • 69.
  • 70. Conclusión • Como el valor del estadístico de contraste (Te=2.15) no supera al valor crítico (Tc=2.38) por lo que la diferencia encontrada no es significativa con un nivel de confianza del 99%.
  • 71. • En general en un contraste unilateral derecho mantendremos la hipótesis nula cuando el estadístico de contraste no supere el valor crítico • y la rechazaremos en caso contrario, es decir, cuando
  • 72. • Si comparamos el nivel p-crítico con el nivel de significación: 0’0175 < 0’01 se llega a la misma conclusión.
  • 73. Interpretación del resultado • Al nivel de confianza del 99% los resultados no indican que la puntuación media en depresión sea mayor en el grupo de sujetos que no reciben visitas respecto de los que sí las reciben. Pero los resultados sí son significativos al nivel de confianza del 95%, como apreciamos al comparar el nivel de significación con el nivel crítico.
  • 74. Interpretación del resultado • Quizás fuera conveniente profundizar en la relación entre ser visitado o no por los familiares y puntuar más alto en depresión en las personas que permanecen ingresadas en centros geriátricos.
  • 75. ¿Experimentos chorras o de sentido común?
  • 76. Intervalo de confianza (-18.2942, 28.2942)
  • 77. • XXX Ejemplo 3.3. Un laboratorio desarrolla un fármaco con el que se pretende reducir la ansiedad. Para comprobarlo, se extrajeron dos muestras aleatorias de cinco observaciones cada una que suponemos procedentes de poblaciones que se distribuyen normalmente con distinta varianza.
  • 78. • Ejemplo 3.3. A los sujetos de la primera muestra se les administró el fármaco y los de la segunda una sustancia placebo. Posteriormente se les midió la ansiedad a todos los sujetos mediante un test en el que cuanto más elevada es la puntuación mayor es la ansiedad.
  • 79. • Ejemplo 3.3. Las resultados de ambas muestras fueron: • Grupo 1 (con fármaco): {10; 20; 30; 20; 5} • Grupo 2 (sin fármaco): {30; 50; 30; 60; 20} Con un nivel de confianza del 95%, ¿podemos afirmar que el fármaco efectivamente reduce la ansiedad?
  • 80. Condiciones y supuestos • Necesitamos asumir que la variable dependiente esté medida a nivel de intervalo. En cuanto a las poblaciones de las que proceden las varianzas, necesitamos suponerlas normalmente distribuidas porque el tamaño de las muestras es pequeño. En este caso tampoco conocemos las varianzas poblacionales, aunque las suponemos distintas.
  • 81. Dos muestras independientes DM de la Sujetos que Sujetos que diferencia de reciben el reciben el medias Variable X fármaco (1) placebo (2) = Ansiedad X1 = 10, 20, 30, X = 30, 50, 30, 2 20, 5 60, 20 Distribución normal MUESTRAS POBLACIÓN
  • 82. Formulamos las hipótesis • De acuerdo con la hipótesis del laboratorio esperamos que la puntuación media sea inferior en el grupo 1 (nuestro fármaco reduce la ansiedad significativamente), por lo que hemos de plantear un contraste de hipótesis unilateral izquierdo.
  • 83. • Luego la hipótesis completa será:
  • 84. • Esta hipótesis se puede plantear también como:
  • 86. Distribución muestral • El estadístico T sigue una distribución muestral t de Student con los grados de libertad (redondeando al entero más próximo):
  • 87. Dos muestras independientes DM de la Sujetos que Sujetos que diferencia de reciben el reciben el medias Variable X fármaco (1) placebo (2) = Ansiedad X1 = 10, 20, 30, X = 30, 50, 30, 2 20, 5 60, 20 Distribución normal MUESTRAS POBLACIÓN
  • 88.
  • 89. Dos muestras independientes DM de la Sujetos que Sujetos que diferencia de reciben el reciben el medias Variable X fármaco (1) placebo (2) = Ansiedad X1 = 10, 20, 30, X = 30, 50, 30, 2 20, 5 60, 20 Distribución normal MUESTRAS POBLACIÓN
  • 90. Dos muestras independientes DM de la Sujetos que Sujetos que diferencia de reciben el reciben el medias Variable X fármaco (1) placebo (2) = Ansiedad X1 = 10, 20, 30, X = 30, 50, 30, 2 20, 5 60, 20 Distribución normal MUESTRAS POBLACIÓN
  • 91. Dos muestras independientes DM de la Sujetos que Sujetos que diferencia de reciben el reciben el medias Variable X fármaco (1) placebo (2) = Ansiedad X1 = 10, 20, 30, X = 30, 50, 30, 2 20, 5 60, 20 Distribución normal MUESTRAS POBLACIÓN
  • 92. Dos muestras independientes DM de la Sujetos que Sujetos que diferencia de reciben el reciben el medias Variable X fármaco (1) placebo (2) = Ansiedad X1 = 10, 20, 30, X = 30, 50, 30, 2 20, 5 60, 20 Distribución normal MUESTRAS POBLACIÓN
  • 93. • Regla de decisión: buscamos en las tablas t de Student el valor t que deje por debajo de sí un área del 0.05 (y 1-0.05 = 0.95 por encima) con 6 grados de libertad:
  • 94. Valor t con 6 grados de libertad y que deja por encima de sí el 0.05 del área (valor positivo, luego su negativo deja por debajo de sí el 0.05)
  • 96.
  • 97. • Conclusión: el valor del estadístico de contraste es una puntuación más extrema que el valor crítico que hemos buscado en la tabla t de Student (-2.46 < -1.94) por lo que rechazamos la hipótesis nula.
  • 98. • Con la misma lógica que en todos los contrastes, en general en un contraste bilateral izquierdo mantendremos la hipótesis nula cuando se cumpla que y la rechazaremos si
  • 99. • Para calcular aproximadamente el nivel p- crítico, en la tabla t de Student, para 6 grados de libertad, tenemos que se encuentra entre 2.447 < 2.46 < 3.143
  • 100. • por lo que deducimos que el nivel p-crítico estará comprendido entre las probabilidades de encontrar valores iguales o inferiores a estas dos puntuaciones 1- 0.975 = 0.025 1- 0.990 = 0.01 • 0.01 > p_crítico > 0.025
  • 101. Interpretar el resultado • A un nivel de confianza del 95% concluimos que la media en ansiedad es inferior para el grupo que tomó el fármaco, por lo que concluimos que, efectivamente, reduce la ansiedad.
  • 102. Consideraciones sobre los contrastes de hipótesis en dos muestras independientes • En el primer contraste de hipótesis incluíamos entre los supuestos el que las varianzas poblacionales son conocidas, lo que difícilmente podremos asumir en un caso práctico. • Si no conocemos las medias de las poblaciones con las que trabajamos, difícilmente podremos considerar que sí conocemos sus varianzas.
  • 103. • Lo más habitual, por lo tanto, será asumir que las varianzas poblacionales son desconocidas, y en este caso el contraste más utilizado es en el que suponemos varianzas poblacionales iguales.
  • 104. • Este supuesto, al que denominaremos homocedasticidad, es muy común en otras técnicas estadísticas, como veremos en los temas en que compararemos las medias de más de dos grupos (Análisis de la Varianza) o en el Análisis de Regresión.
  • 105. • La cuestión estriba en que podamos asumir la normalidad de la distribución muestral de las diferencias de las medias, lo que podremos garantizar si las muestras que utilizamos son grandes. Si la distribución muestral es normal y los tamaños de ambas muestras son iguales, podemos despreocuparnos de las varianzas poblacionales y suponer sin más que son iguales, sin que por ello peligre la validez del contraste de hipótesis que estamos realizando.
  • 106. • Ahora bien, habrá casos en los que la opción más acertada será suponer varianzas poblacionales distintas, y por lo tanto tendremos que utilizar el estadístico de contraste apropiado. • En la literatura científica sobre este tema se proponen diferentes procedimientos para ajustar los grados de libertad de la distribución muestral. Nosotros hemos utilizado la solución propuesta por Welch.
  • 107. • El procedimiento de Welch nos ofrece un valor inferior para los grados de libertad en relación a si tomamos n1+n2-2. Recuérdese en el ejemplo anterior que n1+n2-2=5+5-2=8 pero escogimos el valor dado por la fórmula gl = 6.
  • 108. • El contraste por lo tanto es más conservador (para un mismo alpha), siendo más difícil rechazar la hipótesis nula.
  • 109. • Muchos investigadores sugieren que ha de realizarse previamente un contraste de hipótesis sobre la igualdad las varianzas, de manera que si aceptamos la hipótesis nula las supondremos iguales y en caso contrario diferentes.
  • 110. TEST DE MANN-WHITNEY-WILCOXON • Cuando no podamos asumir los supuestos necesarios para realizar un contraste paramétrico sobre dos medias en muestras independientes, utilizaremos el test de Mann- Whitney-Wilcoxon (MWW), con el que pondremos a prueba la igualdad o desigualdad de las medianas de las poblaciones de las que proceden las muestras, pudiendo plantearse, al igual que en el caso de las medias, contrates unilaterales o bilaterales.
  • 111. TEST DE MANN-WHITNEY-WILCOXON • También podemos emplear el test MWW para reducir o eliminar el impacto de los valores atípicos (outliers) ya que utiliza los valores ordinales de los datos, no los propios datos.
  • 112. Supuestos • La variable dependiente empleada debe ser, al menos, de nivel ordinal. • Las distribuciones subyacentes a partir de las que se han extraído las muestras deben tener la misma forma. Dicha forma no tiene porque ser normal, si bien, el supuesto de igualdad de forma conlleva el supuesto de homocedasticidad.
  • 113. • Aunque se deba asumir la homocedasticidad, el test MWW no se muestra tan afectado por la violación del supuesto de homocedasticidad como lo es el test paramétrico correspondiente.
  • 114. Ejemplo 3.4 • Un equipo de psicólogos evolutivos ha estudiado como adquieren los niños la capacidad de empatizar con otros. Para este fin han desarrollado un test para medir la empatía en niños pequeños. Los estudios preliminares han mostrado que los chicos son más lentos en desarrollar esta capacidad y, además, la desarrollan en menor cuantía que las chicas.
  • 115. Ejemplo 3.4 • En uno de estos estudios se eligieron dos grupos al azar, uno de niños (Grupo 1) y otro de niñas (Grupo 2) y las puntuaciones obtenidas, en una escala de intervalo, fueron: • Grupo 1: 13; 13; 25; 13; 18; 8 • Grupo 2: 27; 21; 15; 21; 23; 30; 16 • Determine si estos resultados apoyan la afirmación de que los niños tienen menor empatía que las chicas (α = 0’05).
  • 116. Condiciones y supuestos • Aunque la variable dependiente está medida a un nivel de intervalo, no sabemos cómo es la forma de las distribuciones de niños y niñas en la población (normal, t, …). • Por otro lado, el tamaño de las muestras es pequeño (6 y 7 elementos, respectivamente ), y por lo tanto no podemos asumir que la distribución muestral de las diferencias es normal, por lo que realizamos un contraste no paramétrico aplicando el test MWW.
  • 117. • En general necesitamos que se cumplan las siguientes condiciones: – Variable dependiente medida en una escala al menos ordinal. – Distribuciones poblacionales con la misma forma.
  • 118. Formulamos las hipótesis • Queremos contrastar si los niños (Grupo 1) tienen menor empatía que las niñas (Grupo 2), por lo que el contraste es unilateral izquierdo. Las hipótesis planteadas hacen referencia a las medianas poblacionales.
  • 119. Formulamos las hipótesis • Luego la hipótesis completa es:
  • 120. Estadístico de contraste • Para calcular el estadístico del test MWW debemos combinar las dos muestras y transformar las observaciones directas en rangos, calculando la suma de los rangos pertenecientes a cada muestra por separado.
  • 121. Estadístico de contraste • La lógica del estadístico MWW consiste en que si la mediana de la población de la que se ha extraído la primera muestra es inferior a la mediana de la segunda población (de la que se ha extraído la segunda muestra) deberíamos esperar que la suma de los órdenes pertenecientes a la primera muestra fuese inferior a la suma de los órdenes pertenecientes a la segunda muestra.
  • 122. Comenzamos asignando rangos a todas las puntuaciones 8, 13, 15, 16, 18, 21, 23, 25, 27, 30 Grupo 1 Grupo 2 Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 Empatía 13 13 25 13 18 8 27 21 15 21 23 30 16 Rango 3 3 11 3 7 1 12 8’5 5 8’5 10 13 6
  • 123. • Observamos que hay empates. • En el Grupo 1 hay tres puntuaciones iguales (sujetos 1, 2 y 4 con puntuaciones todas iguales a 13), a las que les corresponderían los rangos 2, 3, 4, y a las que asignamos el rango medio de estos tres valores:
  • 124. • De igual forma, las puntuaciones de los sujetos 8 y 10 son igual a 21, y ocupan los lugares octavo y noveno, por lo que les asignamos el rango 8’5.
  • 125. • A continuación calculamos las sumas de los rangos para cada una de las muestras y a los que llamaremos S1 para el primer grupo y S2 para el segundo: – Grupo 1: S1 = 3 + 3 + 11 + 3 + 7 + 1 = 28 – Grupo 2: S2 = 12 + 8’5 + 5 + 8’5 + 10 + 13 + 6 = 63 Grupo 1 Grupo 2 Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 Empatía 13 13 25 13 18 8 27 21 15 21 23 30 16 Rango 3 3 11 3 7 1 12 8’5 5 8’5 10 13 6
  • 126. • Obtenemos los estadísticos U1 y U2, restando a S1 y S2 el sumatorio de rangos total de cada sub-grupo:
  • 127. • Si, v.g., tuviéramos un grupo con 2 puntuaciones, tendríamos los rangos 1º y 2º, cuyo sumatorio da 3.
  • 128. • Si, v.g., tuviéramos un grupo con 3 puntuaciones, tendríamos los rangos 1º, 2º y 3º, cuyo sumatorio da 6.
  • 129. • Si, v.g., tuviéramos un grupo con 4 puntuaciones, tendríamos los rangos 1º, 2º, 3º y 4º, cuyo sumatorio da 10. • Y así sucesivamente.
  • 130. • Luego la expresión • Nos proporciona el sumatorio de los rangos totales de los elementos de ese grupo. La diferencia entre los valores Si obtenidos y este valor es un índice de discrepancia.
  • 131. • Para el primer grupo • El sumatorio de los 6 primeros rangos del grupo con 6 puntuaciones daría un total de 21 (1/2 * 6 * 7) si consideramos el grupo por sí solo. En el grupo total se ha obtenido 28.
  • 132. • Para el segundo grupo • El sumatorio de los 7 primeros rangos del grupo con 7 puntuaciones daría un total de 28 (1/2 * 7 * 8) si consideramos el grupo por sí solo. En el grupo total se ha obtenido 63.
  • 133. • Las tablas están tabuladas en función del valor más pequeño de Ui. Luego escogemos el mínimo del conjunto {7, 35} que resulta ser 7. • Este valor es el estadístico de contraste obtenido.
  • 134. Regla de decisión • La Tabla U de Mann-Whitney-Wilcoxon expresa los valores críticos U en función del número de sujetos de cada grupo, del nivel de confianza y del tipo de contraste (bilateral o unilateral). Acudiendo a dicha tabla con α = 0’05; n1 = 6 y n2 = 7, obtenemos un valor crítico igual a 8.
  • 135.
  • 136. Conclusión • La significación (rechazo de H0) se alcanza si el estadístico de contraste (valor U obtenido en la muestra, en nuestro caso 7) es igual o menor que el valor crítico extraído de la tabla (en nuestro caso 8) al nivel de significación especificado. • Como 7 < 8, rechazamos la hipótesis nula al nivel de confianza del 95%.
  • 137. Interpretación del resultado • Al nivel de confianza del 95%, los resultados apoyan la afirmación de que los niños tienen menor empatía que las niñas, resultado que está de acuerdo con los estudios preliminares llevados a cabo por el equipo de psicólogos evolutivos y que se citan en el enunciado.
  • 138. Aproximación a la normal con muestras grandes • Cuando n1 o n2 son superiores a 20 podemos utilizar el Teorema del Límite Central para demostrar que el estadístico • se distribuye según una z:
  • 139. • En donde el término representa el valor medio esperado de U si H0 es cierta, es decir, si realmente los dos grupos tienen idéntica mediana. El denominador de Z representa el error típico de la distribución muestral del estadístico Ui.
  • 140. • Aunque con los datos del Ejemplo 3.4 no tenemos suficientes sujetos para utilizar la aproximación a la distribución normal, lo haremos para ilustrar su cálculo. • Observamos que en el estadístico Z se ha puesto Ui, ya que podemos utilizar U1 o U2 para realizar el contraste.
  • 141. • Observamos que en el estadístico Z se ha puesto Ui, ya que podemos utilizar U1 o U2 para realizar el contraste.
  • 142. • Estos resultados nos informan que el valor U1 (Grupo 1) es inferior al valor medio esperado si H0 es cierta (con un alpha = 0.05, el valor de la Z crítica es -1.64)
  • 143. CONTRASTE DE HIPÓTESIS SOBRE DOS VARIANZAS EN MUESTRAS INDEPENDIENTES • Ejemplo 3.5. Eysenck (1981) afirmaba que hombres y mujeres tienen la misma puntuación media en cociente intelectual (CI), pero que los hombres muestran mayor variabilidad en inteligencia. Para comprobar la hipótesis de Eysenck, seleccionamos aleatoriamente una muestra de 41 hombres y otra de 31 mujeres.
  • 144. CONTRASTE DE HIPÓTESIS SOBRE DOS VARIANZAS EN MUESTRAS INDEPENDIENTES • Ejemplo 3.5. Tras aplicar un test de inteligencia en ambas muestras, observamos que la cuasivarianza en el grupo de hombres es igual a 289, mientras que en el de mujeres vale 225. Con un nivel de confianza del 99% ¿avalan estos datos la hipótesis de Eysenck de que existen diferencias en la variabilidad del CI entre mujeres y hombres, siendo la de éstos mayor?
  • 145. Dos muestras independientes DM de la Hombres (1) Mujeres (2) diferencia de varianzas Variable X = CI MUESTRAS POBLACIÓN
  • 146. CONDICIONES Y SUPUESTOS • Asumimos que las puntuaciones que nos proporcionan los tests de inteligencia miden este constructo en una escala de intervalo, y que la variable medida se distribuye normalmente tanto en la población de hombres como en la de mujeres.
  • 147. CONDICIONES Y SUPUESTOS • En general, los supuestos necesarios son: • Variable dependiente con un nivel de medida de intervalo o razón. • Dos poblaciones con variables normalmente distribuidas, o bien n1 ≥ 30 y n2 ≥ 30.
  • 148. Formulamos la hipótesis • Plantearemos un contraste unilateral derecho, en el que la hipótesis alternativa corresponderá a la sugerida por Eysenck, e indicará que la variabilidad en inteligencia es superior en el grupo de hombres.
  • 149. • En consecuencia, las hipótesis son:
  • 150. • También podemos expresarlas como una razón:
  • 151. • Y por consiguiente:
  • 152. Estadístico de contraste • El estadístico de contraste sigue una distribución muestral “F” de Fisher:
  • 153. Dos muestras independientes DM de la Hombres (1) Mujeres (2) diferencia de varianzas Variable X = CI MUESTRAS POBLACIÓN
  • 154. Estadístico de contraste • Los grados de libertad del numerador y denominador son, respectivamente:
  • 155. Nivel p-crítico • El cálculo del nivel p-crítico mediante las tablas será aproximado. • Observamos en dichas tablas que el primer valor que nos ofrecen para 40 y 30 grados de libertad es igual a 1’573, al que supera una proporción igual a 0’10, luego con las tablas tan sólo podemos saber que el nivel p-crítico es mayor que 0’10 (p > 0’10).
  • 156.
  • 157.
  • 158.
  • 159.
  • 160. F empírica = 1.28
  • 161. Nivel p-crítico • Luego con las tablas tan sólo podemos saber que el nivel p-crítico es mayor que 0’10 (p > 0’10). Con un programa informático adecuado concluiríamos que el valor exacto de p es 0’2432.
  • 162. • Regla de decisión: a un nivel de confianza del 99% para 40 y 30 grados de libertad, el valor crítico es igual a 2’299.
  • 163.
  • 164. Conclusión • A la vista de los resultados mantenemos la hipótesis nula a un nivel de confianza del 99%, puesto que el valor del estadístico de contraste es inferior al valor crítico. • Los resultados obtenidos están lejos de ser significativos para cualquier nivel de confianza razonable. • Concluimos por lo tanto que la varianza de hombres y mujeres en inteligencia es la misma.
  • 165. Interpretar el resultado • Eysenck (1981) afirmaba que el hecho de que los hombres mostrasen mayor variabilidad en inteligencia implica que hay más hombres que mujeres con CI muy altos y con CI muy bajos. Si estos hubiesen sido los resultados de un estudio con todas las garantías, los resultados no apoyarían la hipótesis de Eysenck.
  • 166. Propiedad recíproca de la distribución F • Aunque en este contraste no ha sido necesario utilizarla, recordamos la propiedad recíproca de la distribución F que nos permite calcular probabilidades que no aparecen en la tabla:
  • 167. THE TOP TEN REASONS TO BECOME A STATISTICIAN Deviation is considered normal. We feel complete and sufficient. We are "mean" lovers. Statisticians do it discretely and continuously. We are right 95% of the time.
  • 168. THE TOP TEN REASONS TO BECOME A STATISTICIAN We can legally comment on someone's posterior distribution. We may not be normal but we are transformable. We never have to say we are certain. We are honestly significantly different (HSD). No one wants our jobs.