1. DIAGRAMA DE DISPERSIÓN
El término correlación se utiliza generalmente para indicar la correspondencia o la
relación recíproca que se da entre dos o más cosas, ideas, personas, entre otras.
En tanto, en probabilidad y estadística, la correlación es aquello que indicará la fuerza
y la dirección lineal que se establece entre dos variables aleatorias.
Un diagrama de dispersión es un tipo de diagrama matemático que utiliza las
coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de
datos.
Los datos se muestran como un conjunto de puntos, cada uno con el valor de una
variable que determina la posición en el eje horizontal y el valor de la otra variable
determinado por la posición en el eje vertical. Un diagrama de dispersión se llama
también gráfico de dispersión.
Se emplea cuando una variable está bajo el control del experimentador. Si existe un
parámetro que se incrementa o disminuye de forma sistemática por el
experimentador, se le denomina parámetro de control o variable independiente = eje
de x y habitualmente se representa a lo largo del eje horizontal. La variable medida o
dependiente = eje de y usualmente se representa a lo largo del eje vertical. Si no
existe una variable dependiente, cualquier variable se puede representar en cada eje y
el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las
dos variables.
1º Correlación directa
La recta correspondiente a la nube de puntos de la distribución es una
recta creciente.
2º Correlación inversa
2. La recta correspondiente a la nube de puntos de la distribución es una
recta decreciente.
3º Correlación nula
En este caso se dice que las variables son incorreladas y la nube de
puntos tiene una forma redondeada.
Grado de correlación
El grado de correlación indica la proximidad que hay entre los
puntos de la nube de puntos. Se pueden dar tres tipos:
3. 1. Correlación fuerte
La correlación será fuerte cuanto más cerca estén los puntos de
la recta.
2. Correlación débil
La correlación será débil cuanto más separados estén los puntos
de la recta.
3. Correlación nula
4. REGRESION CUADRATICA
Una regresión cuadrática es el proceso de encontrar la ecuación de la parábola que
mejor se ajuste para un conjunto de datos. Como resultado, obtenemos una ecuación
de la formadonde .
La potencia predictiva relativa de un modelo cuadrático está denotada por R 2. El
valor de R 2 varía entre 0 y 1. Mientras más cercano el valor esté de 1, más preciso
será el modelo.
Ejemplo 1:
Considere el conjunto de datos. Determine la regresión cuadrática para el conjunto.
(-3, 7.5), (-2, 3), (-1, 0.5), (0, 1), (1, 3), (2, 6), (3, 14)
Introduzca las coordenadas en x y las coordenadas en y en su calculadora y realice
una regresión cuadrática. La ecuación de la parábola que mejor se aproxima al punto
es
Realice la gráfica. Obtendrá una gráfica como esta.
Puede ver que el valor de R 2 para los datos es 0.9942.
5. • El coeficiente de correlación, r, presenta valores entre –1 y +1.
• Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de
puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una
recta de regresión.
• Cuando r es cercano a +1, hay una buena correlación positiva entre las variables
según un modelo lineal y la recta de regresión que se determine tendrá pendiente
positiva, será creciente.
• Cuando r es cercano a -1, hay una buena correlación negativa entre las variables
según un modelo lineal y la recta de regresión que se determine tendrá pendiente
negativa: es decreciente.
DIAGRAMA DE DISPERSION:
6. Una función cuadrática o de segundo grado se puede representar de manera genérica como
:
Y= a+bx+cx^
EJEMPLO:
sumatorias de la matriz:
Por lo tanto: a=9.6 b=1.76 c=2.02
la parábola de mejor ajuste es entonces:
7. INTRODUCCION
Se entiende por correlación el grado de relación existente entre dos variables.
Cuando entre dos variables existe una correlación total, se cumple que a cada valor de
una, le corresponde un único valor de la otra (función matemática).
Es frecuente que dos variables estén relacionadas de forma que a cada valor de una de
ellas le correspondan varios valores de la otra.
En este caso es interesante investigar el grado de correlación existente entre ambas
para ellos es útil el diagrama de dispersión.
El diagrama de dispersión es la representación gráfica del grado de relación entre dos
variables cuantitativas.
El modelo de regresión cuadrática es una alternativa cuando el modelo lineal no logra
un coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un
comportamiento que puede considerarse como parabólico.
8. CONCLUSIÓN
Los gráficos de dispersión se usan normalmente para mostrar y comparar valores
numéricos, como datos científicos, estadísticos y de ingeniería. Además, cuando se
desea comparar grandes cantidades de puntos de datos sin tener en cuenta el tiempo.
Cuantos más datos incluya en un gráfico de dispersión, mejores comparaciones podrá
realizar.
Puede usarse para estudiar una relación de causa y efecto entre variables
cuantitativas.
Puede mostrar relaciones entre dos efectos para ver si podrían derivarse de una causa
común o servir de sustituto uno del otro.
Puede examinar también la relación entre dos causas.Los gráficos de dispersión son
ideales para controlar la distribución de los valores y los clústeres de los puntos de
datos. Éste es el mejor tipo de gráfico si el conjunto de datos contiene muchos puntos
(por ejemplo, varios miles)
De forma predeterminada, los gráficos de dispersión muestran los puntos de datos
como círculos. Si tiene varias series en un gráfico de dispersión, se puede plantear la
posibilidad de cambiar la forma del marcador de cada punto por un cuadrado, un
triángulo, un rombo o cualquier otra forma, de manera que sea más visible la
correlación.
9. REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN SUPERIOR
INSTITUTO UNIVERSITARIO DE TECNOLOGIA DE ADMINISTRACIÓN
INDUSTRIAL
ESTADISTICA
143C3
TRABAJO DE
ESTADISTICA
INTEGRANTE:
MIGUEL VIRGUEZ
CI: V- 20613032
CARACAS, FEBRERO 2013