3. Regresión lineal
• Es una técnica estadística utilizada para estudiar la relación entre variables.
Se adapta a una amplia variedad de situaciones. En la investigación social, el
análisis de regresión se utiliza para predecir un amplio rango de fenómenos,
desde medidas económicas hasta diferentes aspectos del comportamiento
humano. (Field, 2009)
4. Supuestos de la regresión lineal
• Para cada sujeto en el estudio, tiene que haber pares de puntos
referidos. Es decir, si un sujeto tiene una puntuación en la variable X,
entonces el mismo tema también debe tener una puntuación en la
variableY.
• La relación entre las dos variables debe ser lineal, es decir, la relación
se puede representar con mayor precisión por una línea recta.
• Las variables deben medirse al menos a nivel ordinal.
• La variabilidad de las puntuaciones en la variableY debe permanecer
constante en todas los valores de la variable X (homocedasticidad)
(Ho, 2006)
5. Regresión múltiple
• Es una de las técnicas multivariantes principales. Primero pos u pionera y
amplia aplicación en la investigación empírica. Segundo, por proporcional la
base de técnicas analíticas posteriores, como el análisis discriminante o el
modelado de ecuaciones estructurales. (Cea, 2004)
6. Objetivos de la regresión múltiple
• Predecir los valores que adoptará la variable dependiente a partir de los
valores conocidos de la serie más pequeña posible de variables
independientes.
• Cuantificar la relación de dependencia mediante el coeficiente de
correlación R de Pearson y su cuadrado
• Determinar el grado de confianza con que el investigador puede afirmar que
la relación observada en los datos muéstrales es realmente cierta.
(Cea, 2004)
7. Supuestos básicos del análisis de regresión
múltiple
• Tamaño de la muestra elevado
• Variable dependiente continua
• Inclusión de variables independientes relevantes
• Linealidad entre variables independiente y dependiente
• Aditividad los efectos de las variables independientes en la dependiente han de
poderse sumar entre sí.
• Normalidad: la distribución de los datos de las variables ha de corresponderse
con la distribución normal.
• Homocedasticidad o igual de varianzas.
• Ausencia de colinealidad entre las variables independientes
• Independencia de los términos de error (Cea, 2004)
9. Bondad de ajuste
• Coeficiente de determinación R2, es decir el cuadrado del coeficiente de
correlación múltiple. Se trata de una medida estandarizada que toma
valores entre 0 y 1; representa el grado de ganancia que podemos obtener al
predecir una variable basándonos en el conocimiento que tenemos de otra u
otras variables.
10. Tolerancia para evaluar la colinealidad
• La tolerancia de una variable independiente es la proporción de varianza de
esa variable que no está asociada (que no depende) del resto de variables
independientes incluidas en la ecuación.
• Una variable con una tolerancia de, por ejemplo, 0.01 es una variable que
comparte el 99% de su varianza con el resto de variables independientes.
11. Durbin-Watson
• Este estadístico proporciona información sobre el grado de independencia
existente entre ellos, dicho estadístico oscila entre 0 y 4, y toma el valor 2
cuando los residuos son independientes. Los valores menos que 2 indican
autocorrelación positiva y los mayores que 2 autocorrelación negativa. Se
puede asumir independencia entre los residuos cuando DW toma valores
entre 1.5 y 2.5.
12. Métodos de selección de variables
• Introducción: este método construye la ecuación de regresión utilizando
todas las variables seleccionadas por el investigador. Es el método utilizado
por defecto en SPSS
• Eliminación: Elimina en un solo paso todas las variables de la lista
Independiente u ofrece coeficientes de regresión que corresponderían a
cada variable en el caso de que pasaran a formar parte de la ecuación de
regresión
13. Métodos de selección de variables
• Hacia adelante: las variables se incorporan al modelo de regresión una a
una. En el primer paso se selecciona la variable independiente que, a demás
de superar los criterios de entrada, más alto correlaciona con la
dependiente.
• Hacia atrás: Comienza incluyendo en el modelo todas las variables
seleccionadas en la lista independientes y luego procede a eliminarlas una a
una. La primera variable eliminada es aquella que, además de cumplir los
criterios de salida, posee el coeficiente de regresión más bajo en valor
absoluto.
• Pasos sucesivos: Este método es una especie de mezcla de los métodos
hacia adelante y hacia atrás. El proceso se detiene cuando no quedan
variables que superen los criterios de entrada y las variables seleccionadas
no cumplen los criterios de salida
•
14. Referencias
• Cea, M. (2004). Análisis multivariable.Teoría y práctica en la investigación
social. España: Síntesis
• Field, A. (2009). Discovering statistic using SPSS. USA: SAGE
• Ho, R. (2006). Handbook of Univariate and Multivariate Data Analysis and
Interpretation with SPSS. Australia: Chapman & Hall/CRC