SlideShare une entreprise Scribd logo
1  sur  41
Télécharger pour lire hors ligne
Análisis de varianza
Prueba de Tukey
Lic. Carmen Chacón de Isla, MEd.
Lic.José Luis Isla Corrales, MSc.
 Una factoría de motores tiene 2 proveedores de los
cigüeñales que motoriza.
 Un tercer proveedor ofrece sus cigüeñales algo más
caros, argumentando sus mejores propiedades
dinámicas, concretamente que su equilibrado
dinámico es menor.
 La factoría decide hacer una prueba comparando 10
cigüeñales del nuevo proveedor (código 1) con 10
cigüeñales de cada uno de sus 2 proveedores
tradicionales (códigos 2 y 3)
 Los resultados obtenidos se recogen en la siguiente
tabla:
Factor estudiado (solo uno) PROVEEDOR
Variantes del factor (3) (1) (2) (3)
Resultados obtenidos
(equilibrado dinámico en grs.)
23 35 50
28 36 43
21 29 36
27 40 34
95 43 45
41 49 52
37 51 52
30 28 43
32 50 44
36 52 34
Cuestión clave:
¿Hay evidencia suficiente respecto
a la superioridad de los cigüeñales
del nuevo proveedor para cambiar a
éste, pese al precio ligeramente
más elevado?
Diseño experimental
 Este ejemplo es un caso particular de diseño
experimental en el que se estudia el efecto de un
único factor (variable independiente): el
proveedor, con 3 variantes (los 3 proveedores a
comparar) sobre la media de la variable respuesta
(dependiente): el equilibrado dinámico, que debe
ser el menor posible.
¿Cómo analizar los datos?
 Dado que conocemos una técnica estadística
para comparar dos tratamientos (t de
Student) ¿no será posible analizar los datos
anteriores comparando dos a dos las tres
parejas posibles de proveedores?
¿Cómo analizar los datos?
 Si en vez de tratarse de 3, hubiera 5 proveedores,
 ¿Cuántas parejas de tratamientos habría que
comparar?
 Suponiendo que los 5 proveedores fueran idénticos y si
en cada comparación se operase con un riesgo de error
de 5% ¿la probabilidad de obtener una conclusión
errónea (deducir que al menos dos de los proveedores
son distintos) sería del 5%?
¿Cómo analizar los datos?
 Analizar los resultados de este tipo de experimento
comparando 2 a 2 todas las parejas posibles de
tratamientos NO ES RECOMENDABLE porque:
1. Es muy laborioso
2. Se incrementa la probabilidad global de cometer
un error estadístico de tipo I (resultado falso
positivo: se rechaza Ho siendo ésta verdadera)
¿Cómo analizar los datos?
En casos como éste, la técnica más
adecuada es el Análisis de Varianza
(ANOVA, en inglés)
ANOVA
 Se utiliza:
Con variables cuantitativas
Cuando existen más de dos grupos
Para comparar medias mediante el análisis de sus varianzas
 Supone que:
existe distribución normal en cada uno de los grupos
existe homogeneidad de varianzas en los grupos
los grupos son totalmente independientes
ANOVA
 Se plantean hipótesis:
Ho (nula): las medias de los grupos son iguales
Ha (alterna): No todas las medias de los grupos son
iguales. Al menos una de las medias es distinta
ANOVA
 La idea de ANOVA es descomponer la VARIABILIDAD
TOTAL de los datos en:
 La variabilidad debida a la diferencia ENTRE LOS
TRATAMIENTOS O GRUPOS y
 La variedad residual, debida a la diferencia DENTRO
DE LOS TRATAMIENTOS O GRUPOS (también
llamada ERROR)
Cuantificación de la variabilidad
Variabilidad
TOTAL de los
datos
Variabilidad
ENTRE los
grupos
Variabilidad
DENTRO de los
grupos (error)
= +
Suma de cuadrados
TOTAL
(SCT)
Suma de cuadrados
ENTRE grupos
(SCE)
Suma de cuadrados
DENTRO de los
grupos
(SCD)
PROVEEDOR
(1) (2) (3)
23 35 50
28 36 43
21 29 36
27 40 34
95 43 45
41 49 52
37 51 52
30 28 43
32 50 44
36 52 34
CÁLCULOS TOTALES:
∑X = 370 + 413 + 433 = 1216
∑x2 = 17778 + 17801 + 19175 = 54754
Factor de corrección (C)= (∑x)2/n
C = (1216)2 /30 = 49288,53
VARIACIÓN TOTAL
SCT= ∑x2 – C = 54754 - 49288,53 = 5465,47
Grados de Libertad GLT = 30 – 1 = 29
VARIACIÓN ENTRE LOS GRUPOS
SCE= (370)2/10 + (413)2/10 + (433)2/10 – 49288,53 =
= 207,27
Grados de Libertad GLE = 3 – 1 = 2
VARIACIÓN DENTRO DE LOS GRUPOS (Error)
SCD = SCT – SCE
SCD = 5465,47 – 207,27 = 5258,20
Grados de Libertad GLD = GLT – GLE
GLD = 29 – 2 = 27
∑X1 =370 ∑x2=413 ∑x3=433
1 = 37 2 = 41,3 3 = 43,3
Cuadro resumen de ANOVA
FUENTE DE VARIACION Suma de
Cuadrados
Grados
de
Libertad
Cuadrados
medios
F
Entre los grupos 207,27 2 103,635 0,532
Dentro de los grupos 5258,20 27 194,748
TOTAL 5465,20 29
Valor es críticos para F:
Tabla: G.L. para cuadrado medio mayor: 2
G.L para cuadrado medio menor : 27
5% = 3,35
1% = 5,49
El valor encontrado para F es mucho menor. Se aprueba Ho.
Las diferencias NO son significativas
Los cigüeñales del nuevo proveedor no son superiores a los otros
ANOVA en Excel
Se escribe la Tabla de datos en
una página Excel
Pueden calcularse diferentes
parámetros como ∑x, medias,
∑x2, valiéndose de las fórmulas
del programa
ANOVA en Excel
Se busca la pestaña DATOS y en ella se abre Análisis de Datos (si no aparece
este complemento será necesario instalarlo previamente)
Se selecciona el tipo de análisis que se desea; en nuestro caso, Análisis de
varianza de un factor.
ANOVA en Excel
Para el Rango de entrada, seleccionar solamente los datos de la Tabla
Alfa es el nivel de significación escogido (5%)
Se puede seleccionar una hoja nueva para el resultado del análisis . Click en Aceptar
ANOVA en Excel: Resultado
ANOVA en Excel: Resultado
 El valor de F es mucho menor que el valor crítico registrado en las tablas para
el nivel de significación 0,05 (5%)
 La probabilidad de que las diferencias entre las medias sean debidas al azar es
de 0,5934 (59,34%). Se aprueba la Hipótesis Nula (Ho)
 El equilibrado dinámico de los cigüeñales del proveedor (1) no difieren
significativamente respecto a los de los proveedores tradicionales
Otro ejemplo de ANOVA
Se tienen las edades de tres grupos de personas
¿Existe diferencia estadísticamente significativa en el
promedio de edad entre los tres grupos?
Planteamos las hipótesis:
o Hipótesis nula (Ho): El promedio de edad de los
tres grupos es igual, con 95% de probabilidad
o Hipótesis alterna: Al menos en un grupo el
promedio de edad es distinto, con un 95% de
confiabilidad.
Otro ejemplo de ANOVA
 Se trata de un análisis de varianza de un solo factor
 Utilizamos el programa EXCEL para realizar el análisis
 Procedemos como en el caso anterior, escribiendo la
tabla de datos en una hoja de cálculo
 Se busca la pestaña DATOS y en ella se abre Análisis de
Datos
Otro ejemplo de ANOVA
Seleccionamos la pestaña Análisis de varianza de un factor
Otro ejemplo de ANOVA
Seleccionamos los datos en el rango de
entrada
Escogemos una nueva hoja en las
opciones de salida
Otro ejemplo de ANOVA
Este es el resultado:
Otro ejemplo de ANOVA:
Resultados
Otro ejemplo de ANOVA:
Conclusiones:
 La prueba nos arroja el resultado de un valor de F que
supera el valor crítico que aparece en las tablas para un
nivel de significancia de 0,05 (5%)
 Esto significa que la hipótesis nula es falsa: las
diferencias entre las medias de los tres grupos no son
aleatorias.
 Al menos una muestra de las tres tiene un promedio
diferente. Pero ¿cómo saber cuál o cuáles son las
medias que difieren significativamente entre sí?
 Existe una prueba que nos dará respuesta a esta
pregunta: PRUEBA DE TUKEY
Prueba de Tukey
 En esta prueba se determina las diferencias entre las
medias de las muestras y se comparan con una
denominada “Diferencia honestamente significativa”
(HSD), que se calcula mediante la siguiente fórmula:
 Multiplicador: valor obtenido en la Tabla Tukey (Valor Qa)
 MSe: Cuadrado medio de error (media cuadrática DENTRO de los
grupos)
 n: tamaño de la muestra en los grupos.
Prueba de Tukey
 El “multiplicador” o valor de alfa (a) se busca en la
Tabla Q de rangos studentizados, en la intersección
entre la fila de G.L. de la variación DENTRO de los
grupos (error) y la columna correspondiente al
número de grupos o tratamientos.
 En nuestro caso, los G.L. son 72 y el número de grupos,
3. En la Tabla de Q se consigue la fila de 60 G.L. y luego
pasa a 120. Cuando el número que se busca no aparece
en la Tabla, se selecciona el inmediatamente superior.
En este caso, tomamos el valor de la fila de 120 G.L. con
la columna 3, obteniendo a = 3,36
Prueba de Tukey
Prueba de Tukey
Utilizando los datos obtenidos del análisis de varianza en Excel, calculamos
HSD (Diferencia Honestamente Significativa ,también denominada Mínima
Diferencia Significativa)
Prueba de Tukey
• En la misma Hoja Excel se procede a
determinar las diferencia entre las
medias de las muestras
• La diferencia entre la media de la
muestra A y la de la muestra B: 39,92 –
28,88 = 11,04
• Diferencia entre la media de A y
media de C: 39,92 – 29 = 0,92.
• Entre las medias de B y C: 28,88 - 39 =
-10,12
• Si comparamos estas diferencias con
HSD, observamos que dos diferencias
superan esa diferencia mínima
significativa (sin importar el sign0)
ANOVA de dos factores
En esta tabla se expresan las puntuaciones (de 1 a 9) otorgadas por seis jueces
en un panel de degustación sensorial a cuatro muestras de salsa picante.
Se desea saber si las diferencias registradas entre las muestras es realmente
significativa o se deben al azar.
Hipótesis nula: Las diferencias observadas entre las muestras son aleatorias
Hipótesis alterna: Al menos hay una salsa que es diferente a las otras en su
sabor picante.
SABOR PICANTE
Juez Salsa 1 Salsa 2 Salsa 3 Salsa 4
A 9 3 5 1
B 7 6 4 1
C 7 4 3 2
D 9 3 3 2
E 7 7 8 5
F 9 8 3 1
ANOVA de dos factores
Seleccionamos
ANOA de dos
factores con una
sola muestra por
grupo
ANOVA de dos factores
ANOVA de dos factores: resultados
 Hay dos valores de F: uno compara las varianzas entre los
Jueces (filas) y otro entre las Salsas (columnas)
 El primer valor de F (1,536) no supera el valor crítico
(2,901), lo que significa que la variación entre los jueces no
es significativa, sino aleatoria.
 El segundo valor (36,819) supera ampliamente el valor
crítico (3,287), indicando que existe una diferencia
significativa en la variación respecto a las salsas
ANOVA de dos factores: prueba de
Tukey  Realizamos la prueba de Tukey
para determinar qué muestras están
causando las diferencias que nos
establece ANOVA:
 La mínima diferencia significativa
es 2,713.
 Comparando las medias de las
cuatro salsas, encontramos que la
puntuación promedio de la salsa 1
supera significativamente a las otras
tres.
 También hay diferencia
significativa entre los promedios de
las salsas 2 y 4
 No hay diferencias significativas
entre las salsas 2 y 3 ni entre las
salsas 3 y 4
1_ANOVA-INVESTIGACION-Y-TECNOLOGIA-QUINTO.pdf

Contenu connexe

Similaire à 1_ANOVA-INVESTIGACION-Y-TECNOLOGIA-QUINTO.pdf

Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
hoteles1
 
Trabajo hipotesis
Trabajo hipotesisTrabajo hipotesis
Trabajo hipotesis
hoteles1
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
jimmynter
 
pruebas no paraemtricas
pruebas no paraemtricas pruebas no paraemtricas
pruebas no paraemtricas
jimmynter
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
jimmynter
 
supuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
supuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaasupuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
supuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
ssuserd3ba681
 

Similaire à 1_ANOVA-INVESTIGACION-Y-TECNOLOGIA-QUINTO.pdf (20)

Laminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicasLaminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicas
 
Laminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicasLaminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicas
 
Laminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicasLaminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicas
 
Trabajo estadistica
Trabajo estadisticaTrabajo estadistica
Trabajo estadistica
 
Prueba anova
Prueba anovaPrueba anova
Prueba anova
 
Supuestos andeva
Supuestos andevaSupuestos andeva
Supuestos andeva
 
07_Anova_kruskal_friedman.pdf
07_Anova_kruskal_friedman.pdf07_Anova_kruskal_friedman.pdf
07_Anova_kruskal_friedman.pdf
 
Trabajo hipotesis
Trabajo hipotesisTrabajo hipotesis
Trabajo hipotesis
 
ANOVA DE UNO Y DOS FACTORES.pptx
ANOVA DE UNO Y DOS FACTORES.pptxANOVA DE UNO Y DOS FACTORES.pptx
ANOVA DE UNO Y DOS FACTORES.pptx
 
Análisis de la varianza
Análisis de la varianza  Análisis de la varianza
Análisis de la varianza
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
 
ANOVA.ppt
ANOVA.pptANOVA.ppt
ANOVA.ppt
 
pruebas no paraemtricas
pruebas no paraemtricas pruebas no paraemtricas
pruebas no paraemtricas
 
Trabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodosTrabajo de pruebas no paraemtricas 6 metodos
Trabajo de pruebas no paraemtricas 6 metodos
 
Bioestadística
BioestadísticaBioestadística
Bioestadística
 
supuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
supuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaasupuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
supuestos del analisis de varianzaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
 
Anova de un Factor.pdf
Anova  de un Factor.pdfAnova  de un Factor.pdf
Anova de un Factor.pdf
 
Spss 0702b estadistico
Spss 0702b estadisticoSpss 0702b estadistico
Spss 0702b estadistico
 
Analisis de varianza
Analisis de varianzaAnalisis de varianza
Analisis de varianza
 
diseño de experimentos uni 3.pdf
diseño de experimentos uni 3.pdfdiseño de experimentos uni 3.pdf
diseño de experimentos uni 3.pdf
 

Dernier

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
ssuserbdc329
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
IrapuatoCmovamos
 

Dernier (20)

La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptxCUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
CUADRO COMPARATIVO DE ARCHIVOS Y CARPETAS.pptx
 
Adultos Mayores más de 60 años como de la población total (2024).pdf
Adultos Mayores más de 60 años como  de la población total (2024).pdfAdultos Mayores más de 60 años como  de la población total (2024).pdf
Adultos Mayores más de 60 años como de la población total (2024).pdf
 
max-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptxmax-weber-principales-aportes de la sociologia (2).pptx
max-weber-principales-aportes de la sociologia (2).pptx
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx6.3 Hidrologia Geomorfologia Cuenca.pptx
6.3 Hidrologia Geomorfologia Cuenca.pptx
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
REPORTE DE HOMICIDIO DOLOSO IRAPUATO ABRIL 2024
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
biometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptxbiometria hematica y hemostasia y preanalitica.pptx
biometria hematica y hemostasia y preanalitica.pptx
 
Los primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdfLos primeros 60 países por IDH en el año (2024).pdf
Los primeros 60 países por IDH en el año (2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Las familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdfLas familias más ricas de África en el año (2024).pdf
Las familias más ricas de África en el año (2024).pdf
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 

1_ANOVA-INVESTIGACION-Y-TECNOLOGIA-QUINTO.pdf

  • 1. Análisis de varianza Prueba de Tukey Lic. Carmen Chacón de Isla, MEd. Lic.José Luis Isla Corrales, MSc.
  • 2.  Una factoría de motores tiene 2 proveedores de los cigüeñales que motoriza.  Un tercer proveedor ofrece sus cigüeñales algo más caros, argumentando sus mejores propiedades dinámicas, concretamente que su equilibrado dinámico es menor.  La factoría decide hacer una prueba comparando 10 cigüeñales del nuevo proveedor (código 1) con 10 cigüeñales de cada uno de sus 2 proveedores tradicionales (códigos 2 y 3)  Los resultados obtenidos se recogen en la siguiente tabla:
  • 3. Factor estudiado (solo uno) PROVEEDOR Variantes del factor (3) (1) (2) (3) Resultados obtenidos (equilibrado dinámico en grs.) 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34
  • 4. Cuestión clave: ¿Hay evidencia suficiente respecto a la superioridad de los cigüeñales del nuevo proveedor para cambiar a éste, pese al precio ligeramente más elevado?
  • 5. Diseño experimental  Este ejemplo es un caso particular de diseño experimental en el que se estudia el efecto de un único factor (variable independiente): el proveedor, con 3 variantes (los 3 proveedores a comparar) sobre la media de la variable respuesta (dependiente): el equilibrado dinámico, que debe ser el menor posible.
  • 6. ¿Cómo analizar los datos?  Dado que conocemos una técnica estadística para comparar dos tratamientos (t de Student) ¿no será posible analizar los datos anteriores comparando dos a dos las tres parejas posibles de proveedores?
  • 7. ¿Cómo analizar los datos?  Si en vez de tratarse de 3, hubiera 5 proveedores,  ¿Cuántas parejas de tratamientos habría que comparar?  Suponiendo que los 5 proveedores fueran idénticos y si en cada comparación se operase con un riesgo de error de 5% ¿la probabilidad de obtener una conclusión errónea (deducir que al menos dos de los proveedores son distintos) sería del 5%?
  • 8. ¿Cómo analizar los datos?  Analizar los resultados de este tipo de experimento comparando 2 a 2 todas las parejas posibles de tratamientos NO ES RECOMENDABLE porque: 1. Es muy laborioso 2. Se incrementa la probabilidad global de cometer un error estadístico de tipo I (resultado falso positivo: se rechaza Ho siendo ésta verdadera)
  • 9. ¿Cómo analizar los datos? En casos como éste, la técnica más adecuada es el Análisis de Varianza (ANOVA, en inglés)
  • 10. ANOVA  Se utiliza: Con variables cuantitativas Cuando existen más de dos grupos Para comparar medias mediante el análisis de sus varianzas  Supone que: existe distribución normal en cada uno de los grupos existe homogeneidad de varianzas en los grupos los grupos son totalmente independientes
  • 11. ANOVA  Se plantean hipótesis: Ho (nula): las medias de los grupos son iguales Ha (alterna): No todas las medias de los grupos son iguales. Al menos una de las medias es distinta
  • 12. ANOVA  La idea de ANOVA es descomponer la VARIABILIDAD TOTAL de los datos en:  La variabilidad debida a la diferencia ENTRE LOS TRATAMIENTOS O GRUPOS y  La variedad residual, debida a la diferencia DENTRO DE LOS TRATAMIENTOS O GRUPOS (también llamada ERROR)
  • 13. Cuantificación de la variabilidad Variabilidad TOTAL de los datos Variabilidad ENTRE los grupos Variabilidad DENTRO de los grupos (error) = + Suma de cuadrados TOTAL (SCT) Suma de cuadrados ENTRE grupos (SCE) Suma de cuadrados DENTRO de los grupos (SCD)
  • 14. PROVEEDOR (1) (2) (3) 23 35 50 28 36 43 21 29 36 27 40 34 95 43 45 41 49 52 37 51 52 30 28 43 32 50 44 36 52 34 CÁLCULOS TOTALES: ∑X = 370 + 413 + 433 = 1216 ∑x2 = 17778 + 17801 + 19175 = 54754 Factor de corrección (C)= (∑x)2/n C = (1216)2 /30 = 49288,53 VARIACIÓN TOTAL SCT= ∑x2 – C = 54754 - 49288,53 = 5465,47 Grados de Libertad GLT = 30 – 1 = 29 VARIACIÓN ENTRE LOS GRUPOS SCE= (370)2/10 + (413)2/10 + (433)2/10 – 49288,53 = = 207,27 Grados de Libertad GLE = 3 – 1 = 2 VARIACIÓN DENTRO DE LOS GRUPOS (Error) SCD = SCT – SCE SCD = 5465,47 – 207,27 = 5258,20 Grados de Libertad GLD = GLT – GLE GLD = 29 – 2 = 27 ∑X1 =370 ∑x2=413 ∑x3=433 1 = 37 2 = 41,3 3 = 43,3
  • 15. Cuadro resumen de ANOVA FUENTE DE VARIACION Suma de Cuadrados Grados de Libertad Cuadrados medios F Entre los grupos 207,27 2 103,635 0,532 Dentro de los grupos 5258,20 27 194,748 TOTAL 5465,20 29 Valor es críticos para F: Tabla: G.L. para cuadrado medio mayor: 2 G.L para cuadrado medio menor : 27 5% = 3,35 1% = 5,49 El valor encontrado para F es mucho menor. Se aprueba Ho. Las diferencias NO son significativas Los cigüeñales del nuevo proveedor no son superiores a los otros
  • 16.
  • 17.
  • 18. ANOVA en Excel Se escribe la Tabla de datos en una página Excel Pueden calcularse diferentes parámetros como ∑x, medias, ∑x2, valiéndose de las fórmulas del programa
  • 19. ANOVA en Excel Se busca la pestaña DATOS y en ella se abre Análisis de Datos (si no aparece este complemento será necesario instalarlo previamente) Se selecciona el tipo de análisis que se desea; en nuestro caso, Análisis de varianza de un factor.
  • 20. ANOVA en Excel Para el Rango de entrada, seleccionar solamente los datos de la Tabla Alfa es el nivel de significación escogido (5%) Se puede seleccionar una hoja nueva para el resultado del análisis . Click en Aceptar
  • 21. ANOVA en Excel: Resultado
  • 22. ANOVA en Excel: Resultado  El valor de F es mucho menor que el valor crítico registrado en las tablas para el nivel de significación 0,05 (5%)  La probabilidad de que las diferencias entre las medias sean debidas al azar es de 0,5934 (59,34%). Se aprueba la Hipótesis Nula (Ho)  El equilibrado dinámico de los cigüeñales del proveedor (1) no difieren significativamente respecto a los de los proveedores tradicionales
  • 23. Otro ejemplo de ANOVA Se tienen las edades de tres grupos de personas ¿Existe diferencia estadísticamente significativa en el promedio de edad entre los tres grupos? Planteamos las hipótesis: o Hipótesis nula (Ho): El promedio de edad de los tres grupos es igual, con 95% de probabilidad o Hipótesis alterna: Al menos en un grupo el promedio de edad es distinto, con un 95% de confiabilidad.
  • 24. Otro ejemplo de ANOVA  Se trata de un análisis de varianza de un solo factor  Utilizamos el programa EXCEL para realizar el análisis  Procedemos como en el caso anterior, escribiendo la tabla de datos en una hoja de cálculo  Se busca la pestaña DATOS y en ella se abre Análisis de Datos
  • 25. Otro ejemplo de ANOVA Seleccionamos la pestaña Análisis de varianza de un factor
  • 26. Otro ejemplo de ANOVA Seleccionamos los datos en el rango de entrada Escogemos una nueva hoja en las opciones de salida
  • 27. Otro ejemplo de ANOVA Este es el resultado:
  • 28. Otro ejemplo de ANOVA: Resultados
  • 29. Otro ejemplo de ANOVA: Conclusiones:  La prueba nos arroja el resultado de un valor de F que supera el valor crítico que aparece en las tablas para un nivel de significancia de 0,05 (5%)  Esto significa que la hipótesis nula es falsa: las diferencias entre las medias de los tres grupos no son aleatorias.  Al menos una muestra de las tres tiene un promedio diferente. Pero ¿cómo saber cuál o cuáles son las medias que difieren significativamente entre sí?  Existe una prueba que nos dará respuesta a esta pregunta: PRUEBA DE TUKEY
  • 30. Prueba de Tukey  En esta prueba se determina las diferencias entre las medias de las muestras y se comparan con una denominada “Diferencia honestamente significativa” (HSD), que se calcula mediante la siguiente fórmula:  Multiplicador: valor obtenido en la Tabla Tukey (Valor Qa)  MSe: Cuadrado medio de error (media cuadrática DENTRO de los grupos)  n: tamaño de la muestra en los grupos.
  • 31. Prueba de Tukey  El “multiplicador” o valor de alfa (a) se busca en la Tabla Q de rangos studentizados, en la intersección entre la fila de G.L. de la variación DENTRO de los grupos (error) y la columna correspondiente al número de grupos o tratamientos.  En nuestro caso, los G.L. son 72 y el número de grupos, 3. En la Tabla de Q se consigue la fila de 60 G.L. y luego pasa a 120. Cuando el número que se busca no aparece en la Tabla, se selecciona el inmediatamente superior. En este caso, tomamos el valor de la fila de 120 G.L. con la columna 3, obteniendo a = 3,36
  • 33. Prueba de Tukey Utilizando los datos obtenidos del análisis de varianza en Excel, calculamos HSD (Diferencia Honestamente Significativa ,también denominada Mínima Diferencia Significativa)
  • 34. Prueba de Tukey • En la misma Hoja Excel se procede a determinar las diferencia entre las medias de las muestras • La diferencia entre la media de la muestra A y la de la muestra B: 39,92 – 28,88 = 11,04 • Diferencia entre la media de A y media de C: 39,92 – 29 = 0,92. • Entre las medias de B y C: 28,88 - 39 = -10,12 • Si comparamos estas diferencias con HSD, observamos que dos diferencias superan esa diferencia mínima significativa (sin importar el sign0)
  • 35. ANOVA de dos factores En esta tabla se expresan las puntuaciones (de 1 a 9) otorgadas por seis jueces en un panel de degustación sensorial a cuatro muestras de salsa picante. Se desea saber si las diferencias registradas entre las muestras es realmente significativa o se deben al azar. Hipótesis nula: Las diferencias observadas entre las muestras son aleatorias Hipótesis alterna: Al menos hay una salsa que es diferente a las otras en su sabor picante. SABOR PICANTE Juez Salsa 1 Salsa 2 Salsa 3 Salsa 4 A 9 3 5 1 B 7 6 4 1 C 7 4 3 2 D 9 3 3 2 E 7 7 8 5 F 9 8 3 1
  • 36. ANOVA de dos factores Seleccionamos ANOA de dos factores con una sola muestra por grupo
  • 37. ANOVA de dos factores
  • 38. ANOVA de dos factores: resultados  Hay dos valores de F: uno compara las varianzas entre los Jueces (filas) y otro entre las Salsas (columnas)  El primer valor de F (1,536) no supera el valor crítico (2,901), lo que significa que la variación entre los jueces no es significativa, sino aleatoria.  El segundo valor (36,819) supera ampliamente el valor crítico (3,287), indicando que existe una diferencia significativa en la variación respecto a las salsas
  • 39.
  • 40. ANOVA de dos factores: prueba de Tukey  Realizamos la prueba de Tukey para determinar qué muestras están causando las diferencias que nos establece ANOVA:  La mínima diferencia significativa es 2,713.  Comparando las medias de las cuatro salsas, encontramos que la puntuación promedio de la salsa 1 supera significativamente a las otras tres.  También hay diferencia significativa entre los promedios de las salsas 2 y 4  No hay diferencias significativas entre las salsas 2 y 3 ni entre las salsas 3 y 4