SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
Estadística bidimensional



                    Juan Carlos Ballabriga
            Departamento de Matemáticas
                  IES Benjamín de Tudela
Variables estadísticas bidimensionales

 Se trata de variables que surgen cuando se estudian dos
 características asociadas a la observación de un mismo
 fenómeno.
Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un
grupo de 10 personas, podemos obtener los siguientes valores


        Talla
        (cms) 160 165 168 170 171 175 175 180 180 182

        Peso
        (kgs)   55   58   58    61   67    62   66    74   79    83




 Podemos llamar X a la talla e Y al peso con lo que
  se obtendría la variable bidimensional (X, Y)
  que toma 10 valores, que son las 10 parejas de
  valores de la tabla anterior: (160,55), (165,58), etc.
Variables estadísticas bidimensionales
 En algunos casos el número de "parejas" de valores (x,y) es
  grande y además muchos de ellos aparecen repetidos; en
  este caso se utiliza una "Tabla de doble entrada" como la
  que se muestra a continuación en el ejemplo 2

 En la primera fila se colocan los valores de una de las
  características o variable que componen la variable
  bidimensional y en la primera columna los de la otra.
Variables estadísticas bidimensionales
 Ejemplo 2.- Se representa por X el número de hijos de 100
  familias y por Y el número de hijas
                  Nº de hijas (y)                       Frecuencias
            Nº de hijos (x)         0    1    2    3   Marginales (x)


                     0              10 15 15 3              43

                     1              10 12     7    2        31

                     2              8    4    3    1        16

                     3              3    2    1    0         6

                     4              2    1    1    0         4
              Frecuencias
             Marginales(y)
                                    33   34   27   6      100
Representación gráfica
 Diagramas de dispersión o nubes de puntos: En
 unos ejes de coordenadas representaremos la
 posición y frecuencia de cada pareja de datos
Diagramas de dispersión o nubes de puntos
 En el ejemplo 1 anterior en el que se estudiaba la talla y el peso de 10
  personas se obtendría el siguiente diagrama de dispersión: (En el eje X
  se representa la talla en cm. y en el eje Y el peso en kg.)
En el caso de tablas de doble entrada

      3
                         2       1
              3


                     7               3
              15                         1       1
      2




                     12      4           2               1
              15

      1



                                         3           2
               10   10       8

     0
          0          1           2           3               4
Diagramas de dispersión o nubes de puntos

 Se puede ver en el primera figura que correspondía al
  diagrama de talla - peso que la serie de puntos presenta
  una tendencia "ascendente" . Se dice en este caso que
  existen entre las dos variables una "dependencia directa"
  .

 En caso en que la tendencia sea "descendente" se diría que
  estaríamos ante una " dependencia inversa "


 Naturalmente en caso en que no se pueda observar una
  tendencia clara estaríamos ante una dependencia muy débil
  que no se puede observar mediante la nube de puntos
Diferentes tipos de diagramas
Dependencia funcional
                                70


                                60


                                50


                                40


                                30


                                20


                                10


                                 0
      -10   -8   -6   -4   -2         0   2   4   6   8   10
                                -10
Ajustes lineales
Covarianza y Correlación

 • Para estudiar si hay relación o no entre las variables

 • Puede ser directa o inversa

 • Se puede “cuantificar”
Covarianza
                             xi    X yi Y      fi
                     xy
                                     fi


                                                    xi yi f i
 Usaremos una fórmula más cómoda          xy                    X Y
                                                        fi
Tabla de frecuencia
        Talla (cm)  Peso kg)     x-X          y-Y      (x-X)(y-Y)
                160         55      -12,6        -11,3      142,38
                165         58       -7,6         -8,3       63,08
                168         58       -4,6         -8,3       38,18
                170         61       -2,6         -5,3       13,78
                171         67       -1,6          0,7        -1,12
                175         62        2,4         -4,3      -10,32
                175         66        2,4         -0,3        -0,72
                180         74        7,4          7,7       56,98
                180         79        7,4         12,7       93,98
                182         83        9,4         16,7      156,98
                 10

       Media x           172,6          Cov                 15,698
       Media y            66,3


                                   Covarianza
Peso (kg)

90
80
70
60
50                                                     Como vemos la relación es
40
30
                                                       Positiva (creciente) y parece
20                                                     que es bastante fuerte, pero
10                                                     ¿cuánto?
 0
     155   160   165       170       175   180   185
                        Talla (cm)
Coeficiente de Correlación
 Para cuantificar la relación usaremos el coeficiente de correlación:


                                    xy
                        r
                                x        y


   Propiedades:
           • Es un valor entre -1 y 1
           • Si es positivo la relación es directa y si es negativa es inversa
           • Cuando se acerca a cero no hay relación
En el ejemplo 1
     Talla (cm) Peso kg)    x-X              y-Y      (x-X)(y-Y)    (x-X)2         (y-Y)2
             160       55      -12,6            -11,3     142,38      158,76         127,69
             165       58       -7,6             -8,3       63,08       57,76          68,89
             168       58       -4,6             -8,3       38,18       21,16          68,89
             170       61       -2,6             -5,3       13,78        6,76          28,09
             171       67       -1,6              0,7       -1,12        2,56           0,49
             175       62        2,4             -4,3      -10,32        5,76          18,49
             175       66        2,4             -0,3       -0,72        5,76           0,09
             180       74        7,4              7,7       56,98       54,76          59,29
             180       79        7,4             12,7       93,98       54,76        161,29
             182       83        9,4             16,7     156,98        88,36        278,89
              10                                            553,2       456,4          812,1

    Media x         172,6              Cov                 55,32                Var x                45,64
    Media y          66,3                                                       Var x                81,21
                                                                                Des x           6,7557383

                                                                                Des y          9,01165911

                                       Coef. Correl.        0,91


   Mucha relación directa
Recta de regresión
   Relación entre dos variables

   Variable independiente x

   Variable dependiente y

   función lineal del tipo y = ax + b, su gráfica
    correspondería a una recta de regresión.

   Ajuste por mínimos cuadrados
Se deduce que la recta de regresión debe pasar por el punto correspondiente a
                                                                           xy
las medias de ambas variables     X ,Y    y que debe tener por pendiente
                                                                            2
Con ello la expresión de la recta de regresión utilizando la ecuación      x
punto-pendiente será:

                                         xy
                            y Y           2
                                               x X
                                         x



 Esta es la llamada "Recta de regresión de y sobre x". Si se deseara estudiar la
 dependencia de x respecto a y sólo habría que cambiar en la expresión de la
 recta x por y, obteniéndose la recta regresión de x sobre y

                                          xy
                            x X            2
                                               y Y
                                          y
En la imagen siguiente se muestra la recta de regresión de y (peso) sobre x (talla)
 del ejemplo 1 de este tema. En este caso se supone que represente cómo depende
 el peso de una persona de su talla
                                      Peso (kg)
                  100

                   80

                   60

                   40

                   20

                    0
                        155   160   165     170        175   180   185
                                          Talla (cm)


Si recordamos que entre la talla y el peso decíamos que existía una dependencia
directa, la recta de regresión lo confirma ya que su pendiente es positiva: a medida
que aumenta la talla aumenta el peso. Por tanto:

   Dependencia directa - Pendiente de la recta positiva - Función creciente
Peso (kg)
                                                      ( X ,Y )
   90
   80
   70
   60
   50
   40
   30                                             ( X ,Y )
   20
   10
    0
        155   160       165       170       175         180   185
                               Talla (cm)


Media x         172,6
Media y          66,3
Utilidad tiene la recta de regresión


 Mediante la recta de regresión podríamos obtener de manera
  aproximada el valor de la variable dependiente (y) de la que
  conociéramos la variable independiente (x), en una población
  semejante a aquella de la que se ha obtenido la muestra

 De manera más precisa, si conocemos la expresión de la recta de
  regresión, se pueden calcular valores para la variable y, conocidos los de
  x, como si se tratara de una función
Ejemplo :
Si observamos la gráfica, podríamos suponer por ejemplo que una persona de 185
cm pesaría algo más de 80 kg
                                                                        Peso (kg)
                                                     90
                                                     80
De acuerdo a la fórmula                              70
                                                     60
                                                     50
                                      xy
                          y Y          2
                                           x X       40
                                                     30
                                                     20
                                      x              10
                                                      0
                                                          155   160   165    170    175   180   185
                                                                            Talla (cm)


  La recta de regresión de la variable y (peso) sobre x (talla) será la recta:

  -que pasa por el punto (172,6 ; 66,3) (medias respectivas de (x,y))

  -tiene de pendiente: 55.32 / 50.71 = 1.0909

  Recta: y – 66.3 = 1.0909 ( x – 172.6) que operando y simplificando queda:


                                   y = 1.0909x – 121.9
El valor del peso que suponíamos aproximado para una talla de 185 cm
sería:

Peso= 1.0909 · 185 – 121.9 = 79.9


Este valor obtenido es algo menor al esperado. Eso quiere decir que las
predicciones hechas con la recta de regresión no son exactas.


Por tanto la recta de regresión se puede utilizar para realizar predicciones
para la variable y a partir de valores conocidos de la variable x.
Resumen:

     • Variables bidimensionales
     • Coeficiente de correlación
     • Regresión
     • Recta de regresión

Contenu connexe

Tendances

9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionalesANDREASEGURA30
 
Limites de funciones
Limites de funcionesLimites de funciones
Limites de funcionesBartoluco
 
Regresion y correlacion ppt
Regresion y correlacion pptRegresion y correlacion ppt
Regresion y correlacion pptrodrigomartinezs
 
Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Juan Carlos GB
 
DISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIALDISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIALSonyé Lockheart
 
Técnicas de conteo
Técnicas de conteo Técnicas de conteo
Técnicas de conteo Gerardo HG
 
Distribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuasDistribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuasCristhiam Montalvan Coronel
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...JAVIER SOLIS NOYOLA
 
Funciones Exponenciales Y Logaritmicas
Funciones Exponenciales Y LogaritmicasFunciones Exponenciales Y Logaritmicas
Funciones Exponenciales Y LogaritmicasJuan Serrano
 
Distribución normal
Distribución normalDistribución normal
Distribución normalsistemas2013
 

Tendances (20)

9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionales
 
Limites de funciones
Limites de funcionesLimites de funciones
Limites de funciones
 
Regresion y correlacion ppt
Regresion y correlacion pptRegresion y correlacion ppt
Regresion y correlacion ppt
 
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
 
Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:
 
Sistema de ecuaciones lineales
Sistema de ecuaciones linealesSistema de ecuaciones lineales
Sistema de ecuaciones lineales
 
Probabilidad
ProbabilidadProbabilidad
Probabilidad
 
Probabilidades
ProbabilidadesProbabilidades
Probabilidades
 
DISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIALDISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN BERNOULLI Y DISTRIBUCIÓN BINOMIAL
 
Ejercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadisticaEjercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadistica
 
Conjunto ejercicios-y-teoria
Conjunto ejercicios-y-teoriaConjunto ejercicios-y-teoria
Conjunto ejercicios-y-teoria
 
Técnicas de conteo
Técnicas de conteo Técnicas de conteo
Técnicas de conteo
 
Regresión lineal
Regresión linealRegresión lineal
Regresión lineal
 
Distribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuasDistribuciones de variables aleatorias discretas y continuas
Distribuciones de variables aleatorias discretas y continuas
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
 
Capitulo 3 ejercicios
Capitulo 3 ejerciciosCapitulo 3 ejercicios
Capitulo 3 ejercicios
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
Funciones Exponenciales Y Logaritmicas
Funciones Exponenciales Y LogaritmicasFunciones Exponenciales Y Logaritmicas
Funciones Exponenciales Y Logaritmicas
 
Distribución normal
Distribución normalDistribución normal
Distribución normal
 

Similaire à Estadística bidimensional

Regresión
RegresiónRegresión
Regresióntmonicas
 
Otras Medidas de Dispersión
Otras Medidas de DispersiónOtras Medidas de Dispersión
Otras Medidas de Dispersiónguestfe91fd
 
S14 Regresión lineal simple.pdf
S14 Regresión lineal simple.pdfS14 Regresión lineal simple.pdf
S14 Regresión lineal simple.pdfHeynerGomez2
 
Pronósticos en los negocios parte 2 - Grupo 4
Pronósticos en los negocios parte 2 - Grupo 4Pronósticos en los negocios parte 2 - Grupo 4
Pronósticos en los negocios parte 2 - Grupo 4Nelson Salinas
 
analisis de regresion y correlacion de variables
analisis de regresion y correlacion de variablesanalisis de regresion y correlacion de variables
analisis de regresion y correlacion de variablesAngelCastillo858247
 
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...JOSUEELIASLOPEZHERNA
 
Biometria sesion teorica_martes_12_junio_2012
Biometria sesion teorica_martes_12_junio_2012Biometria sesion teorica_martes_12_junio_2012
Biometria sesion teorica_martes_12_junio_2012Javiera Saavedra
 
Medidas de posición
Medidas de posiciónMedidas de posición
Medidas de posiciónCelia Pérez
 
Correlación y Regresión lineal simple
Correlación y Regresión lineal simple Correlación y Regresión lineal simple
Correlación y Regresión lineal simple Alberto Esteban Valdez
 
Elementos de estadistica_descriptiva
Elementos de estadistica_descriptivaElementos de estadistica_descriptiva
Elementos de estadistica_descriptivasalonsosanz
 
Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01
Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01
Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01Novato de la Weeb Fox Weeb
 
Regresion simple.
Regresion simple.Regresion simple.
Regresion simple.ITCG
 

Similaire à Estadística bidimensional (20)

Regresión
RegresiónRegresión
Regresión
 
28 ejercicios
28 ejercicios28 ejercicios
28 ejercicios
 
Otras Medidas de Dispersión
Otras Medidas de DispersiónOtras Medidas de Dispersión
Otras Medidas de Dispersión
 
S14 Regresión lineal simple.pdf
S14 Regresión lineal simple.pdfS14 Regresión lineal simple.pdf
S14 Regresión lineal simple.pdf
 
Pronósticos en los negocios parte 2 - Grupo 4
Pronósticos en los negocios parte 2 - Grupo 4Pronósticos en los negocios parte 2 - Grupo 4
Pronósticos en los negocios parte 2 - Grupo 4
 
Análisis de la varianza
Análisis de la varianzaAnálisis de la varianza
Análisis de la varianza
 
Probabilidad
ProbabilidadProbabilidad
Probabilidad
 
Correlacion (1)
Correlacion (1)Correlacion (1)
Correlacion (1)
 
analisis de regresion y correlacion de variables
analisis de regresion y correlacion de variablesanalisis de regresion y correlacion de variables
analisis de regresion y correlacion de variables
 
Estadística 1
Estadística 1Estadística 1
Estadística 1
 
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
 
Biometria sesion teorica_martes_12_junio_2012
Biometria sesion teorica_martes_12_junio_2012Biometria sesion teorica_martes_12_junio_2012
Biometria sesion teorica_martes_12_junio_2012
 
Regresion Lineakl
Regresion LineaklRegresion Lineakl
Regresion Lineakl
 
Medidas de posición
Medidas de posiciónMedidas de posición
Medidas de posición
 
Estadistica 3
Estadistica 3Estadistica 3
Estadistica 3
 
Correlación y Regresión lineal simple
Correlación y Regresión lineal simple Correlación y Regresión lineal simple
Correlación y Regresión lineal simple
 
Elementos de estadistica_descriptiva
Elementos de estadistica_descriptivaElementos de estadistica_descriptiva
Elementos de estadistica_descriptiva
 
A9 r55a7
A9 r55a7A9 r55a7
A9 r55a7
 
Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01
Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01
Teoriaregresionminimoscuadradosver1 2-110127153338-phpapp01
 
Regresion simple.
Regresion simple.Regresion simple.
Regresion simple.
 

Plus de carlosprofesor2001 (7)

Estadistica
EstadisticaEstadistica
Estadistica
 
Derivación
DerivaciónDerivación
Derivación
 
Conicas eso
Conicas esoConicas eso
Conicas eso
 
Conicas bt
Conicas btConicas bt
Conicas bt
 
Aritmética mercantil
Aritmética mercantilAritmética mercantil
Aritmética mercantil
 
Limites
LimitesLimites
Limites
 
Prueba
PruebaPrueba
Prueba
 

Estadística bidimensional

  • 1. Estadística bidimensional Juan Carlos Ballabriga Departamento de Matemáticas IES Benjamín de Tudela
  • 2. Variables estadísticas bidimensionales  Se trata de variables que surgen cuando se estudian dos características asociadas a la observación de un mismo fenómeno.
  • 3. Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes valores Talla (cms) 160 165 168 170 171 175 175 180 180 182 Peso (kgs) 55 58 58 61 67 62 66 74 79 83  Podemos llamar X a la talla e Y al peso con lo que se obtendría la variable bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de la tabla anterior: (160,55), (165,58), etc.
  • 4. Variables estadísticas bidimensionales  En algunos casos el número de "parejas" de valores (x,y) es grande y además muchos de ellos aparecen repetidos; en este caso se utiliza una "Tabla de doble entrada" como la que se muestra a continuación en el ejemplo 2  En la primera fila se colocan los valores de una de las características o variable que componen la variable bidimensional y en la primera columna los de la otra.
  • 5. Variables estadísticas bidimensionales  Ejemplo 2.- Se representa por X el número de hijos de 100 familias y por Y el número de hijas Nº de hijas (y) Frecuencias Nº de hijos (x) 0 1 2 3 Marginales (x) 0 10 15 15 3 43 1 10 12 7 2 31 2 8 4 3 1 16 3 3 2 1 0 6 4 2 1 1 0 4 Frecuencias Marginales(y) 33 34 27 6 100
  • 6. Representación gráfica  Diagramas de dispersión o nubes de puntos: En unos ejes de coordenadas representaremos la posición y frecuencia de cada pareja de datos
  • 7. Diagramas de dispersión o nubes de puntos  En el ejemplo 1 anterior en el que se estudiaba la talla y el peso de 10 personas se obtendría el siguiente diagrama de dispersión: (En el eje X se representa la talla en cm. y en el eje Y el peso en kg.)
  • 8. En el caso de tablas de doble entrada 3 2 1 3 7 3 15 1 1 2 12 4 2 1 15 1 3 2 10 10 8 0 0 1 2 3 4
  • 9. Diagramas de dispersión o nubes de puntos  Se puede ver en el primera figura que correspondía al diagrama de talla - peso que la serie de puntos presenta una tendencia "ascendente" . Se dice en este caso que existen entre las dos variables una "dependencia directa" .  En caso en que la tendencia sea "descendente" se diría que estaríamos ante una " dependencia inversa "  Naturalmente en caso en que no se pueda observar una tendencia clara estaríamos ante una dependencia muy débil que no se puede observar mediante la nube de puntos
  • 10. Diferentes tipos de diagramas
  • 11. Dependencia funcional 70 60 50 40 30 20 10 0 -10 -8 -6 -4 -2 0 2 4 6 8 10 -10
  • 13. Covarianza y Correlación • Para estudiar si hay relación o no entre las variables • Puede ser directa o inversa • Se puede “cuantificar”
  • 14. Covarianza xi X yi Y fi xy fi xi yi f i Usaremos una fórmula más cómoda xy X Y fi
  • 15. Tabla de frecuencia Talla (cm) Peso kg) x-X y-Y (x-X)(y-Y) 160 55 -12,6 -11,3 142,38 165 58 -7,6 -8,3 63,08 168 58 -4,6 -8,3 38,18 170 61 -2,6 -5,3 13,78 171 67 -1,6 0,7 -1,12 175 62 2,4 -4,3 -10,32 175 66 2,4 -0,3 -0,72 180 74 7,4 7,7 56,98 180 79 7,4 12,7 93,98 182 83 9,4 16,7 156,98 10 Media x 172,6 Cov 15,698 Media y 66,3 Covarianza
  • 16. Peso (kg) 90 80 70 60 50 Como vemos la relación es 40 30 Positiva (creciente) y parece 20 que es bastante fuerte, pero 10 ¿cuánto? 0 155 160 165 170 175 180 185 Talla (cm)
  • 17. Coeficiente de Correlación Para cuantificar la relación usaremos el coeficiente de correlación: xy r x y Propiedades: • Es un valor entre -1 y 1 • Si es positivo la relación es directa y si es negativa es inversa • Cuando se acerca a cero no hay relación
  • 18. En el ejemplo 1 Talla (cm) Peso kg) x-X y-Y (x-X)(y-Y) (x-X)2 (y-Y)2 160 55 -12,6 -11,3 142,38 158,76 127,69 165 58 -7,6 -8,3 63,08 57,76 68,89 168 58 -4,6 -8,3 38,18 21,16 68,89 170 61 -2,6 -5,3 13,78 6,76 28,09 171 67 -1,6 0,7 -1,12 2,56 0,49 175 62 2,4 -4,3 -10,32 5,76 18,49 175 66 2,4 -0,3 -0,72 5,76 0,09 180 74 7,4 7,7 56,98 54,76 59,29 180 79 7,4 12,7 93,98 54,76 161,29 182 83 9,4 16,7 156,98 88,36 278,89 10 553,2 456,4 812,1 Media x 172,6 Cov 55,32 Var x 45,64 Media y 66,3 Var x 81,21 Des x 6,7557383 Des y 9,01165911 Coef. Correl. 0,91 Mucha relación directa
  • 19. Recta de regresión  Relación entre dos variables  Variable independiente x  Variable dependiente y  función lineal del tipo y = ax + b, su gráfica correspondería a una recta de regresión.  Ajuste por mínimos cuadrados
  • 20. Se deduce que la recta de regresión debe pasar por el punto correspondiente a xy las medias de ambas variables X ,Y y que debe tener por pendiente 2 Con ello la expresión de la recta de regresión utilizando la ecuación x punto-pendiente será: xy y Y 2 x X x Esta es la llamada "Recta de regresión de y sobre x". Si se deseara estudiar la dependencia de x respecto a y sólo habría que cambiar en la expresión de la recta x por y, obteniéndose la recta regresión de x sobre y xy x X 2 y Y y
  • 21. En la imagen siguiente se muestra la recta de regresión de y (peso) sobre x (talla) del ejemplo 1 de este tema. En este caso se supone que represente cómo depende el peso de una persona de su talla Peso (kg) 100 80 60 40 20 0 155 160 165 170 175 180 185 Talla (cm) Si recordamos que entre la talla y el peso decíamos que existía una dependencia directa, la recta de regresión lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto: Dependencia directa - Pendiente de la recta positiva - Función creciente
  • 22. Peso (kg) ( X ,Y ) 90 80 70 60 50 40 30 ( X ,Y ) 20 10 0 155 160 165 170 175 180 185 Talla (cm) Media x 172,6 Media y 66,3
  • 23. Utilidad tiene la recta de regresión  Mediante la recta de regresión podríamos obtener de manera aproximada el valor de la variable dependiente (y) de la que conociéramos la variable independiente (x), en una población semejante a aquella de la que se ha obtenido la muestra  De manera más precisa, si conocemos la expresión de la recta de regresión, se pueden calcular valores para la variable y, conocidos los de x, como si se tratara de una función
  • 24. Ejemplo : Si observamos la gráfica, podríamos suponer por ejemplo que una persona de 185 cm pesaría algo más de 80 kg Peso (kg) 90 80 De acuerdo a la fórmula 70 60 50 xy y Y 2 x X 40 30 20 x 10 0 155 160 165 170 175 180 185 Talla (cm) La recta de regresión de la variable y (peso) sobre x (talla) será la recta: -que pasa por el punto (172,6 ; 66,3) (medias respectivas de (x,y)) -tiene de pendiente: 55.32 / 50.71 = 1.0909 Recta: y – 66.3 = 1.0909 ( x – 172.6) que operando y simplificando queda: y = 1.0909x – 121.9
  • 25. El valor del peso que suponíamos aproximado para una talla de 185 cm sería: Peso= 1.0909 · 185 – 121.9 = 79.9 Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones hechas con la recta de regresión no son exactas. Por tanto la recta de regresión se puede utilizar para realizar predicciones para la variable y a partir de valores conocidos de la variable x.
  • 26. Resumen: • Variables bidimensionales • Coeficiente de correlación • Regresión • Recta de regresión