Las series cronológicas, son un caso particular de las distribuciones bidimensionales donde una variable es necesariamente el tiempo que puede ser medido en años, meses, días, etc.
1. 1983 Año Bicentenario
Del Nacimiento del
Libertador Simón Bolívar
REPÚBLICA BOLIVARIANA DE VENEZUELA
UNIVERSIDAD BICENTENARIA DE ARAGUA
VICERRECTORADO ACADÉMICO
DECANATO DE INVESTIGACIÓN, EXTENSIÓN
CHARALLAVE
Facilitador: Participante:
Yelitza Rodriguez Zuraima Perez ci.13.384.899
Emily Guerrero ci.19.685.714
Yang Cano ci 18.130.273
Sección: C1 2017-II
SERIES
BIDIMENSIONALES Y
CRONOLÓGICAS
2.
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis
alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado.
Ejemplo con respecto a la variable dependiente o de interés:
El Anova requiere el cumplimiento los siguientes supuestos:
Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza (homoscedasticidad).
El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la media global (SCT), que bajo el supuesto de que
H0 es cierta es una estimación de obtenida a partir de toda la información muestral, en dos partes:
Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los valores de cada muestra con respecto a sus
correspondientes medias.
Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias de las muestras con respecto a la media global.
Las expresiones para el cálculo de los elementos que intervienen en el Anova son las siguientes:
Media Global:
Variación Total:
Variación Intra-grupos:
Variación Inter-grupos:
Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media.
3.
ALGO DE NOTACIÓN RELATIVA AL MODELO
Este apartado está dedicado a introducir alguna notación para escribir los términos que serán más
importantes a la hora de realizar un contraste por el método ANOVA. En primer lugar tenemos:
Usando estos términos vamos a desglosar la variación total de la muestra en variación total dentro de
cada nivel (intravariación) más la variación entre los distintos niveles (intervariación). Para ello
utilizamos la proposición
Donde
4.
En el cálculo del estadístico intervienen N cantidades, ligadas por una relación:
De este modo el número de grados de libertad de este estadístico es N-1 (recuérdese la noción de
grados de libertad de un estadístico Por razones análogas tenemos que el número de grados de
libertad de es N-t y el de es N-t y el de es t-1. Así introducimos los siguientes
estadísticos:
Estos son los estadísticos que realmente nos interesan a la hora de realizar el contraste de igualdad
de medias. Cuando la diferencia entre los efectos de los diferentes niveles sea muy baja, es de
esperar que la cuasivarianza total sea próxima a la intravarianza, o lo que es lo mismo, que la
intervarianza sea pequeña en relación con la intravarianza.
5.
Figura: En la figura de superior no existe una evidencia significativa en
contra de que las medias de los tres grupos de observaciones coinciden. En
la figura inferior sí.
6.
Análisis de Varianza de un Factor
El análisis de varianza (ANOVA) de un factor nos sirve para comparar varios grupos en
una variable cuantitativa. Esta prueba es una generalización del contraste de igualdad de
medias para dos muestras independientes. Se aplica para contrastar la igualdad de medias
de tres o más poblaciones independientes y con distribución normal. Supuestas k
poblaciones independientes, las hipótesis del contraste son siguientes:
1. H0: µ1=µ2= …=µk Las medias poblacionales son iguales
2. 2. H1: Al menos dos medias poblacionales son distintas
Para realizar el contraste ANOVA, se requieren k muestras independientes de la variable de
interés. Una variable de agrupación denominada Factor y clasifica las observaciones de la
variable en las distintas muestras. Suponiendo que la hipótesis nula es cierta, el estadístico
utilizado en el análisis de varianza sigue una distribución F de Fisher-Snedecor con k-1 y n-
k grados de libertad, siendo k el número de muestras y n el número total de observaciones
que participan en el estudio.
7.
Una vez concretado de que existen diferencias significativas mediante el análisis de la varianza,
interesa conocer que niveles de factor son los que han incluido mas para que se de este resultado.
Análisis de los resultados del ANOVA: Comparaciones múltiples
Una vez contrastado el que existen diferencias significativas mediante el análisis de la varianza, nos interesa
conocer que niveles del factor son los que han influido más para que se de este resultado. Como ilustración, en
el último ejemplo se ve claramente que los tratamientos segundo y cuarto dan resultados muy diferentes, y
probablemente de hay venga el que se haya rechazado la igualdad de todos los efectos.
8.
El método más utilizado consiste en realizar todas las comparaciones por parejas:
Lo que corresponde a los ya conocidos contrastes de la T de Student, que tienen en este caso como
estadístico experimental a (de nuevo suponiendo la homocedasticidad en todas las muestras):
ya que la intravarianza SD , es un estimador de 0² con N-t grados de libertad.
Sin embargo el nivel de significación de los contraste debe ser disminuido para tener en cuenta que
ahora al hacer multitud de contraste aumenta la probabilidad del error de tipo I.