SlideShare une entreprise Scribd logo
1  sur  41
The Fisher Assumptions and how to check them Alexander Hernández Hernández Estadísticas  Avanzadas  Prof. Balbino García
Las 5 Suposiciones 1- Igual desviación estándar 2- Probabilidad de error independiente 3-  Suposición de Normalidad 4- Efectos Aditivos y Constantes 5- Efectos constantes de los niveles de los factores
I-Igual desviación estándar Razones por las cuales las DE deben ser iguales: 1- Cuando las DE no son iguales, las observaciones con la mayor DE tienden a dominar el promedio. 2- El método formal estima un tamaño típico de error casual, o en algunos casos un tamaño para cada fuente de probabilidad de error.
Como verificar la suposición  Existen dos formas para verificar cuan bien las suposiciones son representativas de la data. 1- Para muchos conjuntos podemos dividir la data en grupos, luego calculamos la DE para cada grupo y las comparamos.  2- Para cualquier conjunto podemos crear diagramas de dispersión para comparar residuos vs. valores ajustados, para luego identificar patrones.
Como verificar la suposición para DE iguales 1- Escoge un factor que divida tu data en algunos grupos. 2- Calcule DE separadas para cada grupo 3- Encontrar la proporción entre la DE mayor y la DE menor, ( DE max/DE min ). 4- De forma general, si la proporción es mayor que 3, no asuma que las verdaderas DE son iguales. Trate de transformarlas a una nueva escala.
Ejemplo: Walking Babies Los números presentados en esta tabla nos muestran  el número de meses que le tomo a los bebes caminar. Verifique utilizando la suposición para DE iguales. La proporción seria la siguiente: DE max / DE min = 1.90/0.96 = 1.98, como es resultado es menor que 3 : la suposición es razonable.
Diagramas de dispersión,residuos vs. valores ajustados  Un análisis  de datos cuidadoso siempre debe incluir un diagrama de dispersión de residuos vs. valores ajustados, la misma nos sirve para verificar si hay valores extremos y/o patrones en la gráfica.   Luego de hecho el diagrama se decidirá y hay que realizar ajustes o transformaciones en la data.
Ejemplo: Puzzled Childrens En este estudio se les mostro a un grupo de niños, como resolver rompecabezas de bloques, y luego se les digo que realizaran la mayor cantidad que pudieran en un periodo de tiempo. La respuesta obtenida seria, el numero de rompecabezas resueltos. Si observamos la tabla, la data nos muestra un patrón, excepto por la celda inferior derecha.
Diagramas de dispersión,residuos vs. valores ajustados
II-Probabilidad de error independiente Por ejemplo, si sacamos los errores de probabilidad de una caja con boletos enumerados y remplazamos cada boleto y mezclamos antes de sacar uno nuevamente, las probabilidades de error van a ser independientes. Conociendo el valor de alguno de ellos no obtenemos información suficiente sobre los demás.
II-Probabilidad de error independiente Esta suposición refleja una actitud básica de la estadística. La misma nos dice que cualquier patrón sistemático observado entre los elementos, debe ser parte del modelo. Si podemos hacer dichos patrones partes del modelo, y restarle valores observados que correspondan a esos patrones, entonces tendríamos los valores residuales libres de relaciones sistemáticas. De esta forma la probabilidad de error independiente seria mas apropiada.
II-Probabilidad de error independiente A continuación observaremos un ejemplo fallido de identificación de patrones sistemáticos y como esta puede afectar el análisis.
II-Probabilidad de error independiente ,[object Object],[object Object]
Diagrama de dispersión Ad-hoc A continuación observaremos un estudio realizado para identificar si existe relación entre el número de las habitaciones de un hospital y la localización de alfombras.
Diagrama de dispersión Ad-hoc Si observamos el diagrama podemos identificar que los residuos positivos tienden a ir con los números mas altos de habitaciones.
Diagramas de dispersión en bloques En los diagramas de dispersión en bloques podemos graficar los datos utilizando los factores de un nivel vs el de otro. Si el modelo y la suposición de Fisher concuerdan, la gráfica que obtenemos debe ser una línea paralela a la línea de identidad       y = x .
Diagramas de dispersión en bloques Observando los siguiente diagramas podemos ver que efectivamente concuerdan con la suposición de Fisher ya que la línea que obtenemos queda paralela a la línea identidad y = x.
Remedios para casos no relacionados      ¿Que podríamos hacer si los patrones obtenidos y la línea y = x no concuerdan? 1- Para algunos casos la pobre correspondencia es debido a valores extremos. De ser así podemos estimar un valor que reemplace a este, para luego re analizar la data.  Sin embargo debemos prever conclusiones que dependan del cambio de estos valores.
Remedios para casos no relacionados  2- Para otros casos los patrones dependen de la escala escogida. Transformar la escala puede ayudar pero sino se realiza adecuadamente puede deshacerse de los patrones. 3- Para otros casos es mejor simplemente cambiar el diseño del modelo.
III-Suposición de normalidad ANOVA se basa fuertemente en los conceptos de promedios y DE cómo resúmenes de sus datos. Estos dos resúmenes funcionan muy bien para datos cuyos residuos siguen una curva normal, pero a menudo no funcionan para datos que no siguen este patrón.   Por esta razón debemos graficar los datos para tener una idea de que tipo de residuos son los que tenemos. Este procedimiento debe ser parte de cualquier ANOVA.
III-Suposición de normalidad      Características de curvas no normal 1- Valores Extremos 2- Bultos y lagunas 3- Asimetría y sesgos 4- Colas largas o cortas
III-Suposición de normalidad Regularmente es fácil observar los valores extremos en una gráfica de puntos. Pero sin embargo en la mayoría de los casos, las características antes mencionadas son un poco difíciles de observar en este tipo de grafica. Para esto mostraremos dos tipos de gráficas, el histograma y las gráficas regulares con el propósito de visualizar mejor estas características.
Histograma Pasos a seguir: 1- Construye una gráfica de puntos 2- Divide su rango de 7 a 15 intervalos iguales 3- Construye un rectángulo sobre cada intervalo, con una altura proporcional al numero de puntos presentes en el intervalo.      Si el histograma tiene forma simétrica como de campana, la suposición de normalidad es razonable.
Histograma
Histograma
Graficas regulares  A pesar de que los histogramas cubren una gran parte de las características , estos no son muy buenos para representar algunas otras características tales como las colas. Para esto utilizaremos las llamadas gráficas regulares. Las graficas regulares son diagramas de dispersión especializados donde comparamos valores observados o valores residuales vs. valores esperados.
Graficas regulares  Los valores esperados son escogidos para que estén lo mas cercano posible a una curva normal. Los puntos deben quedar lo mas alineado posible.
Gráficas regulares
IV-Efectos Aditivos y Constantes Por que es importante esta suposición… El modelo ANOVA asume que valores observados se comportan como si fueran sido creados añadiendo números asociados a los factores del diseño. Existe una pieza constante para cada nivel de cada factor. Ambas suposiciones son necesarias para justificar una descomposición lineal.
Efectos Aditivos y Constantes A menos que podamos asumir que los efectos de las condiciones son aditivos, no tendría sentido estimar estos efectos como lo hacemos, sumando para obtener promedios y restando para obtener el resto.
Alternativa al modelo ANOVA Es importante señalar que existen grupos de datos cualitativos y cuantitativos. Es importante tener en cuenta que en ocasiones lo que parece ser cuantitativo no es sino cualitativo, y lo que parece ser cualitativo no es sino cuantitativo. En algunas ocasiones la suposición falla ya que ANOVA no es el mejor enfoque.
Efectos Aditivos y Constantes Si obtenemos una respuesta numérica , y los datos son categóricos, entonces deberíamos ser mas cuidadosos sobre los procesos y los efectos constantes que realizamos.  Por esta causa principalmente es que falla la suposición.
Efectos Aditivos y Constantes Para este tipo de grupos de datos, las dos suposiciones van de la mano, si una falla la otra también lo hará.  Existe dos tipos de gráficas que pueden ser usadas para verificar las suposiciones. Una de ellas es la gráfica de bloques y los diagramas de dispersión, residuales  vs. valores ajustados antes mencionada.
Efectos Aditivos y Constantes Si la suposición no encaja, existen dos tipos de remedios: 1- Transformar la escala de igual forma que se realizo para las DE iguales, para hacer la suposición razonable 2- Si esta primera no diera resultado, lo mas favorable seria realizar un nuevo que permita relacionar mas fácilmente los términos de interacción.
V-Como reemplazar valores extremos Como se comento en secciones anteriores, muy a menudo, cuando una o mas de las suposiciones de Fisher fallan, esa falla es debida a observaciones externas. Estadísticos han inventado algunas soluciones para manejar valores extremos, algunas de ellas muy elaboradas. Sin embargo el acercamiento presentado a continuación tiene la ventaja de ser uno sencillo y muy cercano al sentido común.
V-Como reemplazar valores extremos De acuerdo a este acercamiento, siempre que encontremos un valor desviado, debemos realizar dos análisis.  En el primero de ellos debemos analizar toda la data incluyendo los valores extremos. Luego realizaremos un segundo análisis. Para este, primero removemos los valores extremos , luego teniendo en cuenta que estos son observaciones perdidas, debemos estimar remplazos para estos valores. Para finalmente analizar la data arreglada.
V-Como reemplazar valores extremos
V-Como reemplazar valores extremos Comparando estos dos análisis podremos ver los efectos de los valores extremos en un conjunto de datos. Si los resultados observados son relativamente similares no tendremos muchos cambios en las conclusiones. Pero si al contrario, tenemos cambios significativos entre los análisis, debemos ser un poco mas cuidadosos a la hora de llegar a conclusiones.
V-Como reemplazar valores extremos Si inicialmente notamos que los valores extremos son relativamente moderados, la conclusión mas segura es no realizar la prueba. Si por el contrario los residuales de las observaciones son 3 o mas deviaciones estándar lejos de cero, y los demás residuales son de forma normal, entonces el análisis antes descrito es la alternativa mas confiable.
Referencias George W. Cobb (1998) IntroducctiontoDesign and Analysis of Experiments. Cap 12
The fisher assumptions and how to check them

Contenu connexe

Tendances

Prueba de normalidad en SPSS
Prueba de normalidad en SPSSPrueba de normalidad en SPSS
Prueba de normalidad en SPSSAugusto Zavala
 
Proyecto de estadistica infrencial exposicion
Proyecto de estadistica infrencial exposicionProyecto de estadistica infrencial exposicion
Proyecto de estadistica infrencial exposiciondianagarciaandrade
 
Análisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesisAnálisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesisJuan F.Guevara
 
Mapas estadistica 3 corte
Mapas estadistica 3 corteMapas estadistica 3 corte
Mapas estadistica 3 cortehermesortiz1508
 
Estadistica 3. Medidas de Tendencia Central
Estadistica   3. Medidas de Tendencia CentralEstadistica   3. Medidas de Tendencia Central
Estadistica 3. Medidas de Tendencia CentralEdward Ropero
 
MEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓNMEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓNGrecia Hernandez Sandoval
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia centralmarileila
 
Formulario Contrastes y Comparaciones de Medias
Formulario Contrastes y Comparaciones de MediasFormulario Contrastes y Comparaciones de Medias
Formulario Contrastes y Comparaciones de MediasSandra Lucia
 
Power point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresPower point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresKelly Moreno
 
Presentacion de estadistica cristhian delgado
Presentacion de estadistica cristhian delgadoPresentacion de estadistica cristhian delgado
Presentacion de estadistica cristhian delgadocristhian delgado
 
T026800007004 0-felvir rivas-_trabajofinaldefensa-000
T026800007004 0-felvir rivas-_trabajofinaldefensa-000T026800007004 0-felvir rivas-_trabajofinaldefensa-000
T026800007004 0-felvir rivas-_trabajofinaldefensa-000Cleto de la Torre
 
Resumen de unidad v de felix castro garcia
Resumen de unidad v de felix castro garciaResumen de unidad v de felix castro garcia
Resumen de unidad v de felix castro garciaFELIX Castro Garcia
 
15 spss comparacion de medias
15 spss comparacion de medias15 spss comparacion de medias
15 spss comparacion de mediasCarlos Rojas
 
Presentacion elena paca
Presentacion   elena pacaPresentacion   elena paca
Presentacion elena paca0603271735
 

Tendances (20)

Estadistica inferencial
Estadistica inferencialEstadistica inferencial
Estadistica inferencial
 
Prueba de normalidad en SPSS
Prueba de normalidad en SPSSPrueba de normalidad en SPSS
Prueba de normalidad en SPSS
 
Error absoluto
Error absolutoError absoluto
Error absoluto
 
Proyecto de estadistica infrencial exposicion
Proyecto de estadistica infrencial exposicionProyecto de estadistica infrencial exposicion
Proyecto de estadistica infrencial exposicion
 
Análisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesisAnálisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesis
 
Mapas estadistica 3 corte
Mapas estadistica 3 corteMapas estadistica 3 corte
Mapas estadistica 3 corte
 
Estadígrafos
EstadígrafosEstadígrafos
Estadígrafos
 
Estadistica 3. Medidas de Tendencia Central
Estadistica   3. Medidas de Tendencia CentralEstadistica   3. Medidas de Tendencia Central
Estadistica 3. Medidas de Tendencia Central
 
MEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓNMEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓN
MEDIDAS DE TENDENCIA CENTRAL POSICIÓN Y DISPERSIÓN
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Formulario Contrastes y Comparaciones de Medias
Formulario Contrastes y Comparaciones de MediasFormulario Contrastes y Comparaciones de Medias
Formulario Contrastes y Comparaciones de Medias
 
Estadísticas
EstadísticasEstadísticas
Estadísticas
 
Power point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramiresPower point presentacion, medidas tendenciales de andris ramires
Power point presentacion, medidas tendenciales de andris ramires
 
Presentacion de estadistica cristhian delgado
Presentacion de estadistica cristhian delgadoPresentacion de estadistica cristhian delgado
Presentacion de estadistica cristhian delgado
 
Estadistica 8
Estadistica 8Estadistica 8
Estadistica 8
 
T026800007004 0-felvir rivas-_trabajofinaldefensa-000
T026800007004 0-felvir rivas-_trabajofinaldefensa-000T026800007004 0-felvir rivas-_trabajofinaldefensa-000
T026800007004 0-felvir rivas-_trabajofinaldefensa-000
 
Resumen de unidad v de felix castro garcia
Resumen de unidad v de felix castro garciaResumen de unidad v de felix castro garcia
Resumen de unidad v de felix castro garcia
 
15 spss comparacion de medias
15 spss comparacion de medias15 spss comparacion de medias
15 spss comparacion de medias
 
Capitulo 1
Capitulo 1Capitulo 1
Capitulo 1
 
Presentacion elena paca
Presentacion   elena pacaPresentacion   elena paca
Presentacion elena paca
 

En vedette

Modelo Estadístico
Modelo EstadísticoModelo Estadístico
Modelo EstadísticoSara López
 
Agenda de negociación modelo de fisher y ury
Agenda de negociación modelo de fisher y uryAgenda de negociación modelo de fisher y ury
Agenda de negociación modelo de fisher y urykatopo
 
Estadisticas Inferenciales
Estadisticas InferencialesEstadisticas Inferenciales
Estadisticas InferencialesSandra Zapata
 
Ideas4all Iniciador Alicante Enero 2010
Ideas4all Iniciador Alicante Enero 2010Ideas4all Iniciador Alicante Enero 2010
Ideas4all Iniciador Alicante Enero 2010Francisco Páez
 
PresentacióN Rsc Project
PresentacióN Rsc ProjectPresentacióN Rsc Project
PresentacióN Rsc ProjectRSC-PROJECT
 
Expo! de Filosofia
Expo! de FilosofiaExpo! de Filosofia
Expo! de Filosofiaorvinjair
 
Comonocreeren Dios
Comonocreeren DiosComonocreeren Dios
Comonocreeren Diossolvasquez
 
Arte Románico (Yaritza)
Arte Románico (Yaritza)Arte Románico (Yaritza)
Arte Románico (Yaritza)Luz García
 

En vedette (20)

UNIDAD II
UNIDAD IIUNIDAD II
UNIDAD II
 
Modelo Estadístico
Modelo EstadísticoModelo Estadístico
Modelo Estadístico
 
Agenda de negociación modelo de fisher y ury
Agenda de negociación modelo de fisher y uryAgenda de negociación modelo de fisher y ury
Agenda de negociación modelo de fisher y ury
 
Web
WebWeb
Web
 
Estadisticas Inferenciales
Estadisticas InferencialesEstadisticas Inferenciales
Estadisticas Inferenciales
 
DISEÑO DE BLOQUES COMPLETO AL AZAR 1
DISEÑO DE BLOQUES COMPLETO AL AZAR 1DISEÑO DE BLOQUES COMPLETO AL AZAR 1
DISEÑO DE BLOQUES COMPLETO AL AZAR 1
 
Ideas4all Iniciador Alicante Enero 2010
Ideas4all Iniciador Alicante Enero 2010Ideas4all Iniciador Alicante Enero 2010
Ideas4all Iniciador Alicante Enero 2010
 
PresentacióN Rsc Project
PresentacióN Rsc ProjectPresentacióN Rsc Project
PresentacióN Rsc Project
 
Manualrevista
ManualrevistaManualrevista
Manualrevista
 
Expo! de Filosofia
Expo! de FilosofiaExpo! de Filosofia
Expo! de Filosofia
 
Usabilidad Web
Usabilidad WebUsabilidad Web
Usabilidad Web
 
Comonocreeren Dios
Comonocreeren DiosComonocreeren Dios
Comonocreeren Dios
 
Tarea Lucy
Tarea LucyTarea Lucy
Tarea Lucy
 
3D ART
3D ART3D ART
3D ART
 
Arte Románico (Yaritza)
Arte Románico (Yaritza)Arte Románico (Yaritza)
Arte Románico (Yaritza)
 
1 Cintia
1 Cintia1 Cintia
1 Cintia
 
GSM - 20 ans de folie
GSM - 20 ans de folieGSM - 20 ans de folie
GSM - 20 ans de folie
 
Bloque 0 Pacie
Bloque 0 PacieBloque 0 Pacie
Bloque 0 Pacie
 
[Code Camp 2009] WPF 4 Beta 1 Designer con Visual Studio 2010 Beta 1 (José Vi...
[Code Camp 2009] WPF 4 Beta 1 Designer con Visual Studio 2010 Beta 1 (José Vi...[Code Camp 2009] WPF 4 Beta 1 Designer con Visual Studio 2010 Beta 1 (José Vi...
[Code Camp 2009] WPF 4 Beta 1 Designer con Visual Studio 2010 Beta 1 (José Vi...
 
Les derniers achats
Les derniers achatsLes derniers achats
Les derniers achats
 

Similaire à The fisher assumptions and how to check them

CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...JOSUEELIASLOPEZHERNA
 
Supuesto no autocorrelación de análisis de regresion
Supuesto no autocorrelación de análisis de regresionSupuesto no autocorrelación de análisis de regresion
Supuesto no autocorrelación de análisis de regresionKevin Erick Pacheco
 
Diagrama de dispersión.pdf
Diagrama de dispersión.pdfDiagrama de dispersión.pdf
Diagrama de dispersión.pdfAwitadePozol
 
Regresion simple 1 estadistica
Regresion simple 1   estadisticaRegresion simple 1   estadistica
Regresion simple 1 estadisticaJhon Fredy Tchc
 
Regreso a la mediocridad
Regreso a la mediocridadRegreso a la mediocridad
Regreso a la mediocridadManlyn Rivera
 
Resumen parte 1
Resumen parte 1Resumen parte 1
Resumen parte 1Sierras89
 
Proyecto de estadistica inferencial exposicion
Proyecto de estadistica inferencial exposicionProyecto de estadistica inferencial exposicion
Proyecto de estadistica inferencial exposiciondianagarciaandrade
 
Revista de estadistica
Revista de estadisticaRevista de estadistica
Revista de estadisticaReisabethReyes
 
Análisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesisAnálisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesisjuanchojuancho
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadisticaShouky Delgado
 
5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte I5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte Ijpgv84
 
Estadistica Inferencial
Estadistica InferencialEstadistica Inferencial
Estadistica InferencialTamara Apráez
 
diagnosis de la regresion
diagnosis de la regresiondiagnosis de la regresion
diagnosis de la regresioncarlosjardon
 

Similaire à The fisher assumptions and how to check them (20)

CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
 
R56137
R56137R56137
R56137
 
Biometria clase 1_2a
Biometria clase 1_2aBiometria clase 1_2a
Biometria clase 1_2a
 
Supuesto no autocorrelación de análisis de regresion
Supuesto no autocorrelación de análisis de regresionSupuesto no autocorrelación de análisis de regresion
Supuesto no autocorrelación de análisis de regresion
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
Biometria clase 3
Biometria clase 3Biometria clase 3
Biometria clase 3
 
EDA
EDAEDA
EDA
 
Diagrama de dispersión.pdf
Diagrama de dispersión.pdfDiagrama de dispersión.pdf
Diagrama de dispersión.pdf
 
Regresion simple 1 estadistica
Regresion simple 1   estadisticaRegresion simple 1   estadistica
Regresion simple 1 estadistica
 
Regreso a la mediocridad
Regreso a la mediocridadRegreso a la mediocridad
Regreso a la mediocridad
 
Resumen parte 1
Resumen parte 1Resumen parte 1
Resumen parte 1
 
Proyecto de estadistica inferencial exposicion
Proyecto de estadistica inferencial exposicionProyecto de estadistica inferencial exposicion
Proyecto de estadistica inferencial exposicion
 
Revista de estadistica
Revista de estadisticaRevista de estadistica
Revista de estadistica
 
Análisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesisAnálisis factorial aplicado en la elaboración de una tesis
Análisis factorial aplicado en la elaboración de una tesis
 
Lectura unidad 9
Lectura unidad 9Lectura unidad 9
Lectura unidad 9
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadistica
 
5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte I5 Semana Analisis Multivariante Parte I
5 Semana Analisis Multivariante Parte I
 
Estadistica Inferencial
Estadistica InferencialEstadistica Inferencial
Estadistica Inferencial
 
desviacion estandar
desviacion estandardesviacion estandar
desviacion estandar
 
diagnosis de la regresion
diagnosis de la regresiondiagnosis de la regresion
diagnosis de la regresion
 

Plus de Alex

Presentacion python final
Presentacion python finalPresentacion python final
Presentacion python finalAlex
 
Presentacion python final
Presentacion python finalPresentacion python final
Presentacion python finalAlex
 
Randomization
RandomizationRandomization
RandomizationAlex
 
Gerencia De Proyectos
Gerencia De ProyectosGerencia De Proyectos
Gerencia De ProyectosAlex
 
Ejercicio 1 Programacion Lineal
Ejercicio 1 Programacion LinealEjercicio 1 Programacion Lineal
Ejercicio 1 Programacion LinealAlex
 
Programación Lineal
Programación LinealProgramación Lineal
Programación LinealAlex
 
Programación Lineal
Programación LinealProgramación Lineal
Programación LinealAlex
 
Programación Lineal
Programación LinealProgramación Lineal
Programación LinealAlex
 
Programación Lineal
Programación LinealProgramación Lineal
Programación LinealAlex
 

Plus de Alex (9)

Presentacion python final
Presentacion python finalPresentacion python final
Presentacion python final
 
Presentacion python final
Presentacion python finalPresentacion python final
Presentacion python final
 
Randomization
RandomizationRandomization
Randomization
 
Gerencia De Proyectos
Gerencia De ProyectosGerencia De Proyectos
Gerencia De Proyectos
 
Ejercicio 1 Programacion Lineal
Ejercicio 1 Programacion LinealEjercicio 1 Programacion Lineal
Ejercicio 1 Programacion Lineal
 
Programación Lineal
Programación LinealProgramación Lineal
Programación Lineal
 
Programación Lineal
Programación LinealProgramación Lineal
Programación Lineal
 
Programación Lineal
Programación LinealProgramación Lineal
Programación Lineal
 
Programación Lineal
Programación LinealProgramación Lineal
Programación Lineal
 

The fisher assumptions and how to check them

  • 1. The Fisher Assumptions and how to check them Alexander Hernández Hernández Estadísticas Avanzadas Prof. Balbino García
  • 2. Las 5 Suposiciones 1- Igual desviación estándar 2- Probabilidad de error independiente 3- Suposición de Normalidad 4- Efectos Aditivos y Constantes 5- Efectos constantes de los niveles de los factores
  • 3. I-Igual desviación estándar Razones por las cuales las DE deben ser iguales: 1- Cuando las DE no son iguales, las observaciones con la mayor DE tienden a dominar el promedio. 2- El método formal estima un tamaño típico de error casual, o en algunos casos un tamaño para cada fuente de probabilidad de error.
  • 4. Como verificar la suposición Existen dos formas para verificar cuan bien las suposiciones son representativas de la data. 1- Para muchos conjuntos podemos dividir la data en grupos, luego calculamos la DE para cada grupo y las comparamos. 2- Para cualquier conjunto podemos crear diagramas de dispersión para comparar residuos vs. valores ajustados, para luego identificar patrones.
  • 5. Como verificar la suposición para DE iguales 1- Escoge un factor que divida tu data en algunos grupos. 2- Calcule DE separadas para cada grupo 3- Encontrar la proporción entre la DE mayor y la DE menor, ( DE max/DE min ). 4- De forma general, si la proporción es mayor que 3, no asuma que las verdaderas DE son iguales. Trate de transformarlas a una nueva escala.
  • 6. Ejemplo: Walking Babies Los números presentados en esta tabla nos muestran el número de meses que le tomo a los bebes caminar. Verifique utilizando la suposición para DE iguales. La proporción seria la siguiente: DE max / DE min = 1.90/0.96 = 1.98, como es resultado es menor que 3 : la suposición es razonable.
  • 7. Diagramas de dispersión,residuos vs. valores ajustados Un análisis de datos cuidadoso siempre debe incluir un diagrama de dispersión de residuos vs. valores ajustados, la misma nos sirve para verificar si hay valores extremos y/o patrones en la gráfica. Luego de hecho el diagrama se decidirá y hay que realizar ajustes o transformaciones en la data.
  • 8. Ejemplo: Puzzled Childrens En este estudio se les mostro a un grupo de niños, como resolver rompecabezas de bloques, y luego se les digo que realizaran la mayor cantidad que pudieran en un periodo de tiempo. La respuesta obtenida seria, el numero de rompecabezas resueltos. Si observamos la tabla, la data nos muestra un patrón, excepto por la celda inferior derecha.
  • 9. Diagramas de dispersión,residuos vs. valores ajustados
  • 10. II-Probabilidad de error independiente Por ejemplo, si sacamos los errores de probabilidad de una caja con boletos enumerados y remplazamos cada boleto y mezclamos antes de sacar uno nuevamente, las probabilidades de error van a ser independientes. Conociendo el valor de alguno de ellos no obtenemos información suficiente sobre los demás.
  • 11. II-Probabilidad de error independiente Esta suposición refleja una actitud básica de la estadística. La misma nos dice que cualquier patrón sistemático observado entre los elementos, debe ser parte del modelo. Si podemos hacer dichos patrones partes del modelo, y restarle valores observados que correspondan a esos patrones, entonces tendríamos los valores residuales libres de relaciones sistemáticas. De esta forma la probabilidad de error independiente seria mas apropiada.
  • 12. II-Probabilidad de error independiente A continuación observaremos un ejemplo fallido de identificación de patrones sistemáticos y como esta puede afectar el análisis.
  • 13.
  • 14. Diagrama de dispersión Ad-hoc A continuación observaremos un estudio realizado para identificar si existe relación entre el número de las habitaciones de un hospital y la localización de alfombras.
  • 15. Diagrama de dispersión Ad-hoc Si observamos el diagrama podemos identificar que los residuos positivos tienden a ir con los números mas altos de habitaciones.
  • 16. Diagramas de dispersión en bloques En los diagramas de dispersión en bloques podemos graficar los datos utilizando los factores de un nivel vs el de otro. Si el modelo y la suposición de Fisher concuerdan, la gráfica que obtenemos debe ser una línea paralela a la línea de identidad y = x .
  • 17. Diagramas de dispersión en bloques Observando los siguiente diagramas podemos ver que efectivamente concuerdan con la suposición de Fisher ya que la línea que obtenemos queda paralela a la línea identidad y = x.
  • 18. Remedios para casos no relacionados ¿Que podríamos hacer si los patrones obtenidos y la línea y = x no concuerdan? 1- Para algunos casos la pobre correspondencia es debido a valores extremos. De ser así podemos estimar un valor que reemplace a este, para luego re analizar la data. Sin embargo debemos prever conclusiones que dependan del cambio de estos valores.
  • 19. Remedios para casos no relacionados 2- Para otros casos los patrones dependen de la escala escogida. Transformar la escala puede ayudar pero sino se realiza adecuadamente puede deshacerse de los patrones. 3- Para otros casos es mejor simplemente cambiar el diseño del modelo.
  • 20. III-Suposición de normalidad ANOVA se basa fuertemente en los conceptos de promedios y DE cómo resúmenes de sus datos. Estos dos resúmenes funcionan muy bien para datos cuyos residuos siguen una curva normal, pero a menudo no funcionan para datos que no siguen este patrón. Por esta razón debemos graficar los datos para tener una idea de que tipo de residuos son los que tenemos. Este procedimiento debe ser parte de cualquier ANOVA.
  • 21. III-Suposición de normalidad Características de curvas no normal 1- Valores Extremos 2- Bultos y lagunas 3- Asimetría y sesgos 4- Colas largas o cortas
  • 22. III-Suposición de normalidad Regularmente es fácil observar los valores extremos en una gráfica de puntos. Pero sin embargo en la mayoría de los casos, las características antes mencionadas son un poco difíciles de observar en este tipo de grafica. Para esto mostraremos dos tipos de gráficas, el histograma y las gráficas regulares con el propósito de visualizar mejor estas características.
  • 23. Histograma Pasos a seguir: 1- Construye una gráfica de puntos 2- Divide su rango de 7 a 15 intervalos iguales 3- Construye un rectángulo sobre cada intervalo, con una altura proporcional al numero de puntos presentes en el intervalo. Si el histograma tiene forma simétrica como de campana, la suposición de normalidad es razonable.
  • 26. Graficas regulares A pesar de que los histogramas cubren una gran parte de las características , estos no son muy buenos para representar algunas otras características tales como las colas. Para esto utilizaremos las llamadas gráficas regulares. Las graficas regulares son diagramas de dispersión especializados donde comparamos valores observados o valores residuales vs. valores esperados.
  • 27. Graficas regulares Los valores esperados son escogidos para que estén lo mas cercano posible a una curva normal. Los puntos deben quedar lo mas alineado posible.
  • 29. IV-Efectos Aditivos y Constantes Por que es importante esta suposición… El modelo ANOVA asume que valores observados se comportan como si fueran sido creados añadiendo números asociados a los factores del diseño. Existe una pieza constante para cada nivel de cada factor. Ambas suposiciones son necesarias para justificar una descomposición lineal.
  • 30. Efectos Aditivos y Constantes A menos que podamos asumir que los efectos de las condiciones son aditivos, no tendría sentido estimar estos efectos como lo hacemos, sumando para obtener promedios y restando para obtener el resto.
  • 31. Alternativa al modelo ANOVA Es importante señalar que existen grupos de datos cualitativos y cuantitativos. Es importante tener en cuenta que en ocasiones lo que parece ser cuantitativo no es sino cualitativo, y lo que parece ser cualitativo no es sino cuantitativo. En algunas ocasiones la suposición falla ya que ANOVA no es el mejor enfoque.
  • 32. Efectos Aditivos y Constantes Si obtenemos una respuesta numérica , y los datos son categóricos, entonces deberíamos ser mas cuidadosos sobre los procesos y los efectos constantes que realizamos. Por esta causa principalmente es que falla la suposición.
  • 33. Efectos Aditivos y Constantes Para este tipo de grupos de datos, las dos suposiciones van de la mano, si una falla la otra también lo hará. Existe dos tipos de gráficas que pueden ser usadas para verificar las suposiciones. Una de ellas es la gráfica de bloques y los diagramas de dispersión, residuales vs. valores ajustados antes mencionada.
  • 34. Efectos Aditivos y Constantes Si la suposición no encaja, existen dos tipos de remedios: 1- Transformar la escala de igual forma que se realizo para las DE iguales, para hacer la suposición razonable 2- Si esta primera no diera resultado, lo mas favorable seria realizar un nuevo que permita relacionar mas fácilmente los términos de interacción.
  • 35. V-Como reemplazar valores extremos Como se comento en secciones anteriores, muy a menudo, cuando una o mas de las suposiciones de Fisher fallan, esa falla es debida a observaciones externas. Estadísticos han inventado algunas soluciones para manejar valores extremos, algunas de ellas muy elaboradas. Sin embargo el acercamiento presentado a continuación tiene la ventaja de ser uno sencillo y muy cercano al sentido común.
  • 36. V-Como reemplazar valores extremos De acuerdo a este acercamiento, siempre que encontremos un valor desviado, debemos realizar dos análisis. En el primero de ellos debemos analizar toda la data incluyendo los valores extremos. Luego realizaremos un segundo análisis. Para este, primero removemos los valores extremos , luego teniendo en cuenta que estos son observaciones perdidas, debemos estimar remplazos para estos valores. Para finalmente analizar la data arreglada.
  • 38. V-Como reemplazar valores extremos Comparando estos dos análisis podremos ver los efectos de los valores extremos en un conjunto de datos. Si los resultados observados son relativamente similares no tendremos muchos cambios en las conclusiones. Pero si al contrario, tenemos cambios significativos entre los análisis, debemos ser un poco mas cuidadosos a la hora de llegar a conclusiones.
  • 39. V-Como reemplazar valores extremos Si inicialmente notamos que los valores extremos son relativamente moderados, la conclusión mas segura es no realizar la prueba. Si por el contrario los residuales de las observaciones son 3 o mas deviaciones estándar lejos de cero, y los demás residuales son de forma normal, entonces el análisis antes descrito es la alternativa mas confiable.
  • 40. Referencias George W. Cobb (1998) IntroducctiontoDesign and Analysis of Experiments. Cap 12