SlideShare une entreprise Scribd logo
1  sur  22
Estadística Descriptiva:
Correlación y Regresión


                            LEONARDO LÓPEZ C.
           ECONOMIA ESTADISTICA COMPUTARIZADA

                                PARALELO: 261
CORRELACION
la correlación indica la fuerza y la dirección de una
relación lineal entre dos variables aleatorias. Se considera
que dos variables cuantitativas están correlacionadas
cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos
de la otra: si tenemos dos variables (A y B) existe
correlación si al aumentar los valores de A lo hacen
también los de B y viceversa. La correlación entre dos
variables no implica, por sí misma, ninguna relación de
causalidad

Existen diversos coeficientes que miden el grado de
correlación, adaptados a la naturaleza de los datos. El
más conocido es el coeficiente de correlación de
Pearson (introducido en realidad por Francis Galton), que
CORRELACION
En el caso de que se esté estudiando dos variables
aleatorias x e y sobre una población estadística; el
coeficiente de correlación de Pearson se simboliza con la
letra ρx,y, siendo la expresión que nos permite calcularlo:




Donde:
σXY es la covarianza de (X,Y)
σX es la desviación típica de la
variable X
σY es la desviación típica de la
variable Y
Matriz de Correlación
Una matriz de correlación es una tabla de doble
entrada para A B y C, que muestra una lista multivariable
horizontalmente y la misma lista verticalmente y con el
correspondiente coeficiente de correlación llamado r'.

El análisis factorial se puede utilizar para estudiar series
numéricas o de valores cuantitativos para un determinado
número de variables cuantitativas y mayor de dos. Por
ejemplo, tres características o más para series numéricas
con igual número de datos.
Matriz de Correlación
Estas variables independientes o explicativas están
dispuestas ya en una matriz de correlación, que es
una tabla de doble entrada para A B y C, que muestra una
lista multivariable horizontalmente y la misma lista
verticalmente y con el correspondiente coeficiente de
correlación llamado r o la relación entre cada pareja en
cada celda, expresada con un número que va desde 0 a 1.
El modelo mide y muestra la interdependencia en
relaciones asociadas o entre cada pareja de variables y
todas al mismo tiempo.
COVARIANZA
Es una medida de dispersión conjunta de dos variables
estadísticas.
La    covarianza     SXY   (a    veces     también
denotada      Cov(X,Y)   )  de    dos     variables
aleatorias X e Y es:


donde          es el operador esperanza. Para
distribuciones discretas la fórmula anterior se
concreta en


Cuando las variables aleatorias X e Y son n-
dimensionales, es decir,           e
, su matriz de covarianzas ΣXY es:
COVARIANZA
 Si Sxy > 0 hay dependencia directa (positiva), es decir, a
  grandes valores de x corresponden grandes valores de y.
 Si Sxy = 0 Una covarianza 0 se interpreta como la no
  existencia de una relación lineal entre las dos variables
  estudiadas.
 Si Sxy < 0 hay dependencia inversa o negativa, es decir, a
  grandes W, y V son xvariables aleatorias y a, b,valores de
  Si X, Y, valores de corresponden pequeños c, d son
  y.
  constantes ("constante" en este contexto significa no
               ,
  aleatorio), se cumple que:
               la varianza de
               X


                       fórmula que suele emplearse en la
                       práctica para calcular la covarianza.
Coeficiente de Correlación Lineal
El coeficiente de correlación lineal es el
cociente entre la covarianza y el producto de
las desviaciones típicas de ambas variables.
El coeficiente de correlación lineal se expresa
mediante la letra r.
Coeficiente de Correlación Lineal
  Propiedades
1. El coeficiente de correlación no varía al hacerlo la escala
  de medición.
  Es decir, si expresamos la altura en metros o en
  centímetros el coeficiente de correlación no varía.

2. El signo del coeficiente de correlación es el mismo que el
  de la covarianza.
    Si la covarianza es positiva, la correlación es directa.
    Si la covarianza es negativa, la correlación es inversa.
    Si la covarianza es nula, no existe correlación.

3. El coeficiente de correlación lineal es un número real
  comprendido entre −1 y 1.
  −1 ≤ r ≤ 1
Coeficiente de Correlación Lineal
4. Si el coeficiente de correlación lineal toma valores
   cercanos a −1 la correlación es fuerte e inversa, y será
   tanto más fuerte cuanto más se aproxime r a −1.

5. Si el coeficiente de correlación lineal toma valores
   cercanos a 1 la correlación es fuerte y directa, y será tanto
   más fuerte cuanto más se aproxime r a 1.

6. Si el coeficiente de correlación lineal toma valores
   cercanos a 0, la correlación es débil.

7. Si r = 1 ó −1, los puntos de la nube están sobre la recta
   creciente o decreciente. Entre ambas variables
   hay dependencia funcional.
Coeficiente de Correlación Lineal
 Ejemplo
 Las notas de 12 alumnos de una clase en Matemáticas y Física son
 las siguientes:

 Hallar el coeficiente de correlación de la distribución e interpretarlo.
                  1º Hallamos las medias aritméticas.            NOTA
                                                      •Al ser el coeficiente de
                                                      correlación    positivo,   la
                                                      correlación es directa.
                  2º Calculamos la covarianza.
                                                      •Como      coeficiente    de
                                                      correlación     está     muy
                                                      próximo a 1 la correlación
                  3º Calculamos las desviaciones típicas.muy fuerte.
                                                      es


                  4º Aplicamos la fórmula del coeficiente de
                  correlación lineal.
REGRESIÓN
En estadística la regresión lineal o ajuste lineal es
un método matemático que modeliza la relación entre
una    variable    dependiente    Y,    las     variables
independientes Xi y un término aleatorio ε. Este modelo
puede ser expresado como:



donde β0 es la intersección o término "constante", las
             son los parámetros respectivos a cada
variable independiente, y p es el número de parámetros
independientes a tener en cuenta en la regresión. La
regresión lineal puede ser contrastada con la regresión no
lineal.
Regresión Lineal
    Para poder crear un modelo de regresión lineal, es
    necesario que se cumpla con los siguientes supuestos:
   La relación entre las variables es lineal.
   Los errores en la medición de las variables explicativas
    son independientes entre sí.
   Los        errores      tienen      varianza    constante.
    (Homocedasticidad)
   Los errores tienen una esperanza matemática igual a cero
    (los errores de una misma magnitud y distinto signo son
    equiprobables).
   El error total es la suma de todos los errores.
Regresión Lineal
El     modelo       lineal    relaciona     la      variable
dependiente Y con K variables explicativas Xk (k = 1,...K), o
cualquier   transformación   de     éstas,  que    generan
un hiperplano de parámetros βk desconocidos:

donde      es la perturbación aleatoria que recoge todos
aquellos factores de la realidad no controlables u
observables y que por tanto se asocian con el azar, y es la
que confiere al modelo su carácter estocástico. En el caso
más sencillo, con una sola variable explicativa, el
hiperplano es una recta:
                    Y = β1 + β2X2 +
                    ε
Regresión Lineal
El problema de la regresión consiste en elegir
unos valores determinados para los parámetros
desconocidos βk, de modo que la ecuación quede
completamente especificada. Para ello se necesita un
conjunto de observaciones. En una observación
cualquiera i-ésima (i= 1,... I) se registra el comportamiento
simultáneo de la variable dependiente y las variables
explicativas (las perturbaciones aleatorias se suponen no
observables).
Regresión Lineal
Los valores escogidos como estimadores de los
parámetros, , son los coeficientes de regresión, sin que se
pueda garantizar que coinciden con parámetros reales del
proceso generador. Por tanto, en




Los valores       son por su parte estimaciones de la
perturbación aleatoria o errores.
Regresión Lineal Simple
Sólo se maneja una variable independiente, por lo que
sólo cuenta con dos parámetros. Son de la forma:
                    Yi = β0 + β1Xi + εi
donde εi es el error asociado a la medición del valor Xi y
siguen los supuestos de modo que εi∼N(0,σ2) (media
cero, varianza constante e igual a un σ y
con        ).
Regresión Lineal Simple
Dado el modelo de regresión simple, si se                calcula
la esperanza (valor esperado) del valor Y, se obtiene:

Derivando respecto a y e igualando a cero, se obtiene:



Obteniendo dos ecuaciones denominadas ecuaciones
normales que generan la siguiente solución para ambos
parámetros:




La interpretación del parámetro β1 es que un incremento en Xi
de una unidad, Yi incrementará en β1
Correlación por Rangos
Este coeficiente es una medida de asociación lineal que
utiliza los rangos, números de orden, de cada grupo de
sujetos y compara dichos rangos. Existen dos métodos
para calcular el coeficiente de correlación de los rangos
uno señalado por Spearman y otro por Kendall. El r de
Spearman llamado también rho de Spearman es más fácil
de calcular que el de Kendall.
Correlación por Rangos
Coeficiente de Correlación de Spearman
ρ (ro) es una medida de la correlación (la asociación o
interdependencia)         entre        dos     variables
aleatorias continuas. Para calcular ρ, los datos son
ordenados y reemplazados por su respectivo orden.
El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes
estadísticos de orden de x - y. N es el número de parejas.
Correlación por Rangos
Se tiene que considerar la existencia de datos idénticos a
la hora de ordenarlos, aunque si éstos son pocos, se
puede ignorar tal circunstancia
Para muestras mayores de 20 observaciones, podemos
utilizar la siguiente aproximación a la distribución t de
Student.

La interpretación de coeficiente de Spearman es igual que
la del coeficiente de correlación de Pearson. Oscila entre -
1 y +1, indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no
independencia. La tau de Kendall es un coeficiente de
correlación por rangos, inversiones entre dos
ordenaciones de una distribución normal bivariante.
Correlación por Rangos
Los     datos      La columna "d" que muestra las diferencias entre
brutos usados      las dos columnas de orden. Finalmente, se crea
en        este     otra columna "d2". Esta última es sólo la columna
ejemplo     se     "d" al cuadrado
ven debajo.                                      Nótese como el
                                                 número de orden
                                                 de los valores
                                                 que son idénticos
                                                 es la media de
                                                 los números de
                                                 orden que les
                                                 corresponderían
                                                 si no lo fueran.
 Los valores de la columna d2 pueden
 ser sumados para averiguar            .
                                                   De lo que resulta
 El valor de n es 10. Así que esos valores
                                                         ρ=−
 pueden ser sustituidos en la fórmula.             0.187878787879

Contenu connexe

Tendances

Distribuciones de probabilidad
Distribuciones de probabilidadDistribuciones de probabilidad
Distribuciones de probabilidadLaksmi Rodriguez
 
Presentación probabilidad
Presentación probabilidadPresentación probabilidad
Presentación probabilidadHalvar55
 
Distribuciones discretas de_probabiliidad
Distribuciones discretas de_probabiliidadDistribuciones discretas de_probabiliidad
Distribuciones discretas de_probabiliidadUNAD
 
AEP19. Presentación 3: Variables aleatorias
AEP19. Presentación 3:  Variables aleatoriasAEP19. Presentación 3:  Variables aleatorias
AEP19. Presentación 3: Variables aleatoriasFrancisco Sandoval
 
Capítulo 06, Distribuciones discretas de probabilidad
Capítulo 06, Distribuciones discretas de probabilidadCapítulo 06, Distribuciones discretas de probabilidad
Capítulo 06, Distribuciones discretas de probabilidadAlejandro Ruiz
 
Intervalos de confianza 2018
Intervalos de confianza 2018Intervalos de confianza 2018
Intervalos de confianza 2018franciscoe71
 
Distribución de probabilidad discreta
Distribución de probabilidad discretaDistribución de probabilidad discreta
Distribución de probabilidad discretamaria jose dimas
 
Probabilidad power point
Probabilidad power pointProbabilidad power point
Probabilidad power pointGleixys0509
 
Prueba de hipótesis para proporciones
Prueba de hipótesis para proporcionesPrueba de hipótesis para proporciones
Prueba de hipótesis para proporcionesskchabelina
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianzaAndres Oyarzun
 
La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...
La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...
La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...jcgallardo11
 
Distribución binomial
Distribución binomialDistribución binomial
Distribución binomialleandro1107
 
Aplicaciones de las derivadas trazado de curvas
Aplicaciones de las derivadas   trazado de curvasAplicaciones de las derivadas   trazado de curvas
Aplicaciones de las derivadas trazado de curvasBrian Bastidas
 
Prueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianzaPrueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianzaIselitaa Hernadez
 

Tendances (20)

Distribuciones de probabilidad
Distribuciones de probabilidadDistribuciones de probabilidad
Distribuciones de probabilidad
 
Presentación probabilidad
Presentación probabilidadPresentación probabilidad
Presentación probabilidad
 
Prueba de Hipotesis Est ind clase01
Prueba de Hipotesis Est ind clase01Prueba de Hipotesis Est ind clase01
Prueba de Hipotesis Est ind clase01
 
Distribuciones discretas de_probabiliidad
Distribuciones discretas de_probabiliidadDistribuciones discretas de_probabiliidad
Distribuciones discretas de_probabiliidad
 
AEP19. Presentación 3: Variables aleatorias
AEP19. Presentación 3:  Variables aleatoriasAEP19. Presentación 3:  Variables aleatorias
AEP19. Presentación 3: Variables aleatorias
 
Semana 2 1_
Semana 2 1_Semana 2 1_
Semana 2 1_
 
Capítulo 06, Distribuciones discretas de probabilidad
Capítulo 06, Distribuciones discretas de probabilidadCapítulo 06, Distribuciones discretas de probabilidad
Capítulo 06, Distribuciones discretas de probabilidad
 
Probabilidades
ProbabilidadesProbabilidades
Probabilidades
 
Intervalos de confianza 2018
Intervalos de confianza 2018Intervalos de confianza 2018
Intervalos de confianza 2018
 
Distribución de probabilidad discreta
Distribución de probabilidad discretaDistribución de probabilidad discreta
Distribución de probabilidad discreta
 
Probabilidad power point
Probabilidad power pointProbabilidad power point
Probabilidad power point
 
Prueba de hipótesis para proporciones
Prueba de hipótesis para proporcionesPrueba de hipótesis para proporciones
Prueba de hipótesis para proporciones
 
T de student
T de studentT de student
T de student
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianza
 
La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...
La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...
La Distribucion Normal - Ing Juan Carlos Gallardo Mendoza- jcgallardo11@gmail...
 
Distribuciones muestrales
Distribuciones muestralesDistribuciones muestrales
Distribuciones muestrales
 
Distribución binomial
Distribución binomialDistribución binomial
Distribución binomial
 
Aplicaciones de las derivadas trazado de curvas
Aplicaciones de las derivadas   trazado de curvasAplicaciones de las derivadas   trazado de curvas
Aplicaciones de las derivadas trazado de curvas
 
probabilidadesUSFA
probabilidadesUSFAprobabilidadesUSFA
probabilidadesUSFA
 
Prueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianzaPrueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianza
 

En vedette

-algebra lineal y vectores aleatorios
-algebra lineal y vectores aleatorios-algebra lineal y vectores aleatorios
-algebra lineal y vectores aleatoriosjesus7_884
 
REDES NEURONALES ADALINE
REDES NEURONALES ADALINEREDES NEURONALES ADALINE
REDES NEURONALES ADALINEESCOM
 

En vedette (20)

-algebra lineal y vectores aleatorios
-algebra lineal y vectores aleatorios-algebra lineal y vectores aleatorios
-algebra lineal y vectores aleatorios
 
Retailing cruz azul
Retailing cruz azulRetailing cruz azul
Retailing cruz azul
 
Ejemplos sim manual cap 4
Ejemplos sim manual cap 4Ejemplos sim manual cap 4
Ejemplos sim manual cap 4
 
Distribuciones de probabilidad discretas
Distribuciones de probabilidad discretasDistribuciones de probabilidad discretas
Distribuciones de probabilidad discretas
 
Adm ventas i parcial
Adm ventas i parcialAdm ventas i parcial
Adm ventas i parcial
 
Distribuciones de probabilidad continuas
Distribuciones de probabilidad continuasDistribuciones de probabilidad continuas
Distribuciones de probabilidad continuas
 
Distribucion 2 beta
Distribucion 2   betaDistribucion 2   beta
Distribucion 2 beta
 
1. estadistica descriptiva
1.  estadistica descriptiva1.  estadistica descriptiva
1. estadistica descriptiva
 
Distribucion 3 weibull
Distribucion 3   weibullDistribucion 3   weibull
Distribucion 3 weibull
 
9. distribuciones continuas
9.  distribuciones continuas9.  distribuciones continuas
9. distribuciones continuas
 
2. estadistica descriptiva
2.  estadistica descriptiva2.  estadistica descriptiva
2. estadistica descriptiva
 
Analisis tecnico bursatil
Analisis tecnico bursatilAnalisis tecnico bursatil
Analisis tecnico bursatil
 
Distribucion 1 gamma
Distribucion 1   gammaDistribucion 1   gamma
Distribucion 1 gamma
 
Aplicaciones de la biología
Aplicaciones de la biologíaAplicaciones de la biología
Aplicaciones de la biología
 
8. probabilidad y variables aleatorias
8.  probabilidad y variables aleatorias8.  probabilidad y variables aleatorias
8. probabilidad y variables aleatorias
 
2 simulacion unidad 1
2   simulacion unidad 12   simulacion unidad 1
2 simulacion unidad 1
 
REDES NEURONALES ADALINE
REDES NEURONALES ADALINEREDES NEURONALES ADALINE
REDES NEURONALES ADALINE
 
Retail marketing espol iche bpl
Retail marketing espol iche bplRetail marketing espol iche bpl
Retail marketing espol iche bpl
 
Tablas dinamicas de excel
Tablas dinamicas de excelTablas dinamicas de excel
Tablas dinamicas de excel
 
1 simulacion unidad1
1 simulacion   unidad11 simulacion   unidad1
1 simulacion unidad1
 

Similaire à 4. estadística descriptiva

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptx
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptxANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptx
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptxIanMita
 
Análisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simpleAnálisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simpleJoan Fernando Chipia Lobo
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019franciscoe71
 
Correlaciondepearson[1]
Correlaciondepearson[1]Correlaciondepearson[1]
Correlaciondepearson[1]guest0c1548
 
Presentacion de correlacion de pearson y sperman
Presentacion de correlacion de pearson y spermanPresentacion de correlacion de pearson y sperman
Presentacion de correlacion de pearson y spermanLombardJr
 
CORRELACION DE PEARSON
CORRELACION DE PEARSONCORRELACION DE PEARSON
CORRELACION DE PEARSONSamuel Triana
 
Coeficiente de correlacion.
Coeficiente de correlacion.Coeficiente de correlacion.
Coeficiente de correlacion.christianperezc
 
Coeficiente de Correlación de Pearson
Coeficiente de Correlación de PearsonCoeficiente de Correlación de Pearson
Coeficiente de Correlación de PearsonRonald Macuado
 
Trabajo estadistica tema 3
Trabajo estadistica tema 3Trabajo estadistica tema 3
Trabajo estadistica tema 3Angela Rivera
 
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMANCOEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMANKarla GM
 
coeficientes de correlación de Pearson y de Sperman
coeficientes de correlación de Pearson y de Spermancoeficientes de correlación de Pearson y de Sperman
coeficientes de correlación de Pearson y de SpermanAntonio Diaz
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealjorge chami
 
Coeficientes de correlación de pearson y de sperman
Coeficientes de correlación de pearson y de spermanCoeficientes de correlación de pearson y de sperman
Coeficientes de correlación de pearson y de spermandavinson garcia
 

Similaire à 4. estadística descriptiva (20)

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptx
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptxANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptx
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE.pptx
 
Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Análisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simpleAnálisis de correlación y regresión lineal simple
Análisis de correlación y regresión lineal simple
 
Correlacion lineal 2019
Correlacion lineal 2019Correlacion lineal 2019
Correlacion lineal 2019
 
Correlaciondepearson[1]
Correlaciondepearson[1]Correlaciondepearson[1]
Correlaciondepearson[1]
 
Presentacion de correlacion de pearson y sperman
Presentacion de correlacion de pearson y spermanPresentacion de correlacion de pearson y sperman
Presentacion de correlacion de pearson y sperman
 
Pearson y sperman
Pearson y spermanPearson y sperman
Pearson y sperman
 
CORRELACION DE PEARSON
CORRELACION DE PEARSONCORRELACION DE PEARSON
CORRELACION DE PEARSON
 
Coeficiente de correlacion.
Coeficiente de correlacion.Coeficiente de correlacion.
Coeficiente de correlacion.
 
Roman rincon
Roman rinconRoman rincon
Roman rincon
 
Clase 6- Ingeniería y Arquitectura 2024.pptx
Clase 6- Ingeniería y Arquitectura 2024.pptxClase 6- Ingeniería y Arquitectura 2024.pptx
Clase 6- Ingeniería y Arquitectura 2024.pptx
 
Regresión lineal
Regresión linealRegresión lineal
Regresión lineal
 
Coeficiente de Correlación de Pearson
Coeficiente de Correlación de PearsonCoeficiente de Correlación de Pearson
Coeficiente de Correlación de Pearson
 
Trabajo estadistica tema 3
Trabajo estadistica tema 3Trabajo estadistica tema 3
Trabajo estadistica tema 3
 
Correlacion y regresion
Correlacion y regresionCorrelacion y regresion
Correlacion y regresion
 
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMANCOEFICIENTES DE CORRELACIÓN DE  PEARSON Y DE SPERMAN
COEFICIENTES DE CORRELACIÓN DE PEARSON Y DE SPERMAN
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
coeficientes de correlación de Pearson y de Sperman
coeficientes de correlación de Pearson y de Spermancoeficientes de correlación de Pearson y de Sperman
coeficientes de correlación de Pearson y de Sperman
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Coeficientes de correlación de pearson y de sperman
Coeficientes de correlación de pearson y de spermanCoeficientes de correlación de pearson y de sperman
Coeficientes de correlación de pearson y de sperman
 

Plus de Leonardo Daniel López Condoy (8)

Ejercicio de Simulación
Ejercicio de Simulación Ejercicio de Simulación
Ejercicio de Simulación
 
Distribucion 4 erlang
Distribucion 4   erlangDistribucion 4   erlang
Distribucion 4 erlang
 
Simulation
SimulationSimulation
Simulation
 
3 unidad 2 ejemplos de simulacion
3 unidad 2   ejemplos de simulacion3 unidad 2   ejemplos de simulacion
3 unidad 2 ejemplos de simulacion
 
Técnicas y administración de ventas ii (color)
Técnicas y administración de ventas ii (color)Técnicas y administración de ventas ii (color)
Técnicas y administración de ventas ii (color)
 
Teoria de colores
Teoria de coloresTeoria de colores
Teoria de colores
 
Retailing kfc
Retailing kfcRetailing kfc
Retailing kfc
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 

4. estadística descriptiva

  • 1. Estadística Descriptiva: Correlación y Regresión LEONARDO LÓPEZ C. ECONOMIA ESTADISTICA COMPUTARIZADA PARALELO: 261
  • 2. CORRELACION la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad Existen diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El más conocido es el coeficiente de correlación de Pearson (introducido en realidad por Francis Galton), que
  • 3. CORRELACION En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población estadística; el coeficiente de correlación de Pearson se simboliza con la letra ρx,y, siendo la expresión que nos permite calcularlo: Donde: σXY es la covarianza de (X,Y) σX es la desviación típica de la variable X σY es la desviación típica de la variable Y
  • 4. Matriz de Correlación Una matriz de correlación es una tabla de doble entrada para A B y C, que muestra una lista multivariable horizontalmente y la misma lista verticalmente y con el correspondiente coeficiente de correlación llamado r'. El análisis factorial se puede utilizar para estudiar series numéricas o de valores cuantitativos para un determinado número de variables cuantitativas y mayor de dos. Por ejemplo, tres características o más para series numéricas con igual número de datos.
  • 5. Matriz de Correlación Estas variables independientes o explicativas están dispuestas ya en una matriz de correlación, que es una tabla de doble entrada para A B y C, que muestra una lista multivariable horizontalmente y la misma lista verticalmente y con el correspondiente coeficiente de correlación llamado r o la relación entre cada pareja en cada celda, expresada con un número que va desde 0 a 1. El modelo mide y muestra la interdependencia en relaciones asociadas o entre cada pareja de variables y todas al mismo tiempo.
  • 6. COVARIANZA Es una medida de dispersión conjunta de dos variables estadísticas. La covarianza SXY (a veces también denotada Cov(X,Y) ) de dos variables aleatorias X e Y es: donde es el operador esperanza. Para distribuciones discretas la fórmula anterior se concreta en Cuando las variables aleatorias X e Y son n- dimensionales, es decir, e , su matriz de covarianzas ΣXY es:
  • 7. COVARIANZA  Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y.  Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas.  Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes W, y V son xvariables aleatorias y a, b,valores de Si X, Y, valores de corresponden pequeños c, d son y. constantes ("constante" en este contexto significa no , aleatorio), se cumple que: la varianza de X fórmula que suele emplearse en la práctica para calcular la covarianza.
  • 8. Coeficiente de Correlación Lineal El coeficiente de correlación lineal es el cociente entre la covarianza y el producto de las desviaciones típicas de ambas variables. El coeficiente de correlación lineal se expresa mediante la letra r.
  • 9. Coeficiente de Correlación Lineal Propiedades 1. El coeficiente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía. 2. El signo del coeficiente de correlación es el mismo que el de la covarianza.  Si la covarianza es positiva, la correlación es directa.  Si la covarianza es negativa, la correlación es inversa.  Si la covarianza es nula, no existe correlación. 3. El coeficiente de correlación lineal es un número real comprendido entre −1 y 1. −1 ≤ r ≤ 1
  • 10. Coeficiente de Correlación Lineal 4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1. 5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1. 6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil. 7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.
  • 11. Coeficiente de Correlación Lineal Ejemplo Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes: Hallar el coeficiente de correlación de la distribución e interpretarlo. 1º Hallamos las medias aritméticas. NOTA •Al ser el coeficiente de correlación positivo, la correlación es directa. 2º Calculamos la covarianza. •Como coeficiente de correlación está muy próximo a 1 la correlación 3º Calculamos las desviaciones típicas.muy fuerte. es 4º Aplicamos la fórmula del coeficiente de correlación lineal.
  • 12. REGRESIÓN En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como: donde β0 es la intersección o término "constante", las son los parámetros respectivos a cada variable independiente, y p es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.
  • 13. Regresión Lineal Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:  La relación entre las variables es lineal.  Los errores en la medición de las variables explicativas son independientes entre sí.  Los errores tienen varianza constante. (Homocedasticidad)  Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).  El error total es la suma de todos los errores.
  • 14. Regresión Lineal El modelo lineal relaciona la variable dependiente Y con K variables explicativas Xk (k = 1,...K), o cualquier transformación de éstas, que generan un hiperplano de parámetros βk desconocidos: donde es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo su carácter estocástico. En el caso más sencillo, con una sola variable explicativa, el hiperplano es una recta: Y = β1 + β2X2 + ε
  • 15. Regresión Lineal El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos βk, de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el comportamiento simultáneo de la variable dependiente y las variables explicativas (las perturbaciones aleatorias se suponen no observables).
  • 16. Regresión Lineal Los valores escogidos como estimadores de los parámetros, , son los coeficientes de regresión, sin que se pueda garantizar que coinciden con parámetros reales del proceso generador. Por tanto, en Los valores son por su parte estimaciones de la perturbación aleatoria o errores.
  • 17. Regresión Lineal Simple Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son de la forma: Yi = β0 + β1Xi + εi donde εi es el error asociado a la medición del valor Xi y siguen los supuestos de modo que εi∼N(0,σ2) (media cero, varianza constante e igual a un σ y con ).
  • 18. Regresión Lineal Simple Dado el modelo de regresión simple, si se calcula la esperanza (valor esperado) del valor Y, se obtiene: Derivando respecto a y e igualando a cero, se obtiene: Obteniendo dos ecuaciones denominadas ecuaciones normales que generan la siguiente solución para ambos parámetros: La interpretación del parámetro β1 es que un incremento en Xi de una unidad, Yi incrementará en β1
  • 19. Correlación por Rangos Este coeficiente es una medida de asociación lineal que utiliza los rangos, números de orden, de cada grupo de sujetos y compara dichos rangos. Existen dos métodos para calcular el coeficiente de correlación de los rangos uno señalado por Spearman y otro por Kendall. El r de Spearman llamado también rho de Spearman es más fácil de calcular que el de Kendall.
  • 20. Correlación por Rangos Coeficiente de Correlación de Spearman ρ (ro) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden. El estadístico ρ viene dado por la expresión: donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
  • 21. Correlación por Rangos Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student. La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre - 1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
  • 22. Correlación por Rangos Los datos La columna "d" que muestra las diferencias entre brutos usados las dos columnas de orden. Finalmente, se crea en este otra columna "d2". Esta última es sólo la columna ejemplo se "d" al cuadrado ven debajo. Nótese como el número de orden de los valores que son idénticos es la media de los números de orden que les corresponderían si no lo fueran. Los valores de la columna d2 pueden ser sumados para averiguar . De lo que resulta El valor de n es 10. Así que esos valores ρ=− pueden ser sustituidos en la fórmula. 0.187878787879