SlideShare une entreprise Scribd logo
1  sur  7
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 1
PRUEBA DE PREPARACIÓN Nº2
DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN
Y REGRESIÓN
A lo largo de este tema cada vez que hablemos de variables, supondremos que se
tratan de variables de carácter cuantitativo y discreto, todas tomadas de una misma
población. El hecho de que sean rasgos de una misma población nos hará
preguntarnos si existe una posible dependencia o relación entre los mismos.
Dependencia funcional y estadística de una variable estadística bidimensional (X,Y)
Decimos que existe dependencia funcional de Y sobre X cuando a cada valor xi
se le asigna un único valor yj (y = f(x)), es decir, que el valor de una de las
variables determina exactamente en valor de la otra. Según como se
encuentren los puntos la relación será lineal, exponencial, parabólica…
Las variables X e Y serán independientes si el valor de una variable no influye
sobre la otra, sino que sus distribuciones coinciden.
El resto de casos se trata de dependencia o relación estadística, que será más
o menos intensa según si el diagrama de puntos que formen se aproxime más o
menos a la representación imaginaria de una función. Las relaciones pueden
ser:
o directa, si cuando crece o decrece la una, hace lo mismo la otra,
o inversa, si cuando crece o decrece la una, la otra hace lo contrario.
Diagrama de dispersión
Para descubrir estas relaciones entre variables (X e Y) usamos frecuentemente el
diagrama de dispersión o “nube de puntos”, por ser capaz de informarnos de la clase
de dependencia que poseen.
Considerando que:
xi toma los valores x1, x2,…, xr.
yj toma los valores y1, y2,…, yp.
Entonces definimos nij como el número de individuos que toman el valor xi (para X) y el
valor yj (para la variable Y).
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 2
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 0.2 0.4 0.6 0.8
Dependencia lineal funcional
(directa)
Todos estos datos se organizan fácilmente en tablas de doble entrada.
Así representaremos en el plano cartesiano cada uno de los puntos (xi, yj) con
frecuencia no nula. Los valores de la variable X estarán situados en el eje de abscisas y
los de Y en el de ordenadas. En realidad, en abscisas procuraremos colocar de las dos
variables, la “explicativa” o independiente, siempre que esto se cumpla.
0
0.1
0.2
0.3
0.4
0.5
0 0.2 0.4 0.6
Dependencia lineal estadística
débil (directa)
0
0.1
0.2
0.3
0.4
0.5
0.6
0 0.2 0.4 0.6
Dependencia lineal
estadística débil (inversa)
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 0.2 0.4 0.6 0.8
Dependencia lineal funcional
(inversa)
0
0.1
0.2
0.3
0.4
0.5
0.6
0 0.2 0.4 0.6 0.8
Dependencia lineal estadística
fuerte (directa)
0
0.2
0.4
0.6
0.8
1
1.2
0 0.5 1
Dependencia lineal estadística
fuerte (inversa)
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 3
Antes de sacar conclusiones, debemos tener en cuenta si:
Las variables definidas nos hacen intuir la existencia de una posible relación.
Existen numerosos datos y la nube de puntos sugiere alguna clase de
dependencia.
Los valores observados se han obtenido de la población o de una muestra.
Existen posibles influencias de otras variables sobre las estudiadas.
No olvidemos que causalidad implica correlación, pero no al revés. Es decir: una
relación causa-efecto tiene, por ende, que deberse a una relación entre las variables;
sin embargo, dos variables dependientes no tienen que tener una relación causa-
efecto.
Covarianza
Para estudiar la relación entre dos variables se calcula la denominada covarianza (Sxy),
que nos indica el grado de variación conjunta de ambas variables así como el sentido
de la misma:
directa o positiva (ambas varían en el mismo sentido).
inversa o negativa (varían conjuntamente pero en sentido contrario).
En resumen, nos permite cuantificar la dependencia estadística entre las variables.
Covarianza poblacional:
Covariancia muestral:
La varianza, al ser una suma de valores al cuadrado, tiene siempre valores positivos.
En cambio, la covarianza puede tener resultados negativos ya que en el producto de
dos diferencias, si una es negativa, el producto final será también negativo. Este es el
caso de multiplicar valores de X por encima de la media (+) por valores de Y por debajo
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 4
de la misma (-). Existen otros casos en los que los valores positivos compensan a los
negativos haciendo que el valor de la covarianza tienda a cero.
Entonces tenemos que la covarianza tendrá:
Valores positivos si la relación entre las variables es directa.
Valores negativos si la relación de las variables es inversa.
De cero si no existe relación entre las variables o la que la relación que la
explica no es ninguna de las estudiadas.
La covarianza depende pues de:
La intensidad de la relación (el valor absoluto de la covarianza será mayor
cuanto mayor sea la intensidad de la misma).
Las unidades de medida usadas. Al variar la unidad de medida de la varianza,
ésta cambia exponencialmente. Por otro lado, si alteramos las unidades de la
covarianza, el resultado cambia proporcionalmente.
La varianza de las dos variables estudiadas.
Coeficiente de correlación lineal de Pearson
El coeficiente de correlación lineal (r) mide la intensidad de la relación entre X e Y.
;
Características:
Sólo en relaciones de tipo lineal.
Se nombra con ρ cuando pertenece a la población, y r si pertenece a una
muestra.
No tiene unidades: el cambio de las unidades de medida, al contrario que la
varianza y la covarianza, no afecta a su resultado.
Su valor oscila entre 1 y -1.
o 1 cuando la correlación es perfecta y directa.
o 0 cuando no existe correlación.
o -1 cuando es perfecta e inversa.
Pruebas de hipótesis: relación entre dos variables cuantitativas
Normalmente en el estudio usamos una muestra de la población (r), es decir, una
estimación del valor auténtico, de la relación real (ρ).
Por ello debemos construir las siguientes hipótesis:
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 5
H0: ρ=0. No existe relación entre las variables.
H1: ρ≠0 (ρ <0 ó ρ >0). Existe relación entre las variables.
Se sabe que siguen una distribución “t” de Student-Fischer con n-2 grados de libertad
si las dos variables siguen la ley normal y no están relacionadas. Entonces, según el
valor de “t” obtenido:
Si t ≤ tαν, no se puede rechazar la hipótesis de independencia de las dos
variables en la población origen de la muestra.
Si t > tαν, se afirma la hipótesis de que existe relación entre las dos variables en
la población origen de la muestra.
Regresión
Para predecir los valores de una de las variables a partir de la otra utilizamos las rectas
de regresión:
de Y sobre X, para hallar los valores de Y conocida X.
de X sobre Y, para hallar los valores de X conocida Y.
En algunos casos, un valor de X se corresponde a un único valor de Y (modelo lineal).
En ellos α representa un valor constante que sitúa la recta, y β es la pendiente de la
misma. En otros casos, a un mismo valor de X no siempre le corresponde un único
valor de Y, sino un intervalo de los mismos. Pero, para ambos casos, podemos
recurrir a la misma expresión ya que nos permite simplificar, comprender y predecir
la relación existente entre las variables:
y = α + βx
Con esto deducimos que habrá un cierto margen de error en la aproximación de la
nube de puntos a una sola recta. Por ello flexibilizamos la fórmula de la siguiente
forma: y = α + βx + e. “e” se corresponde a la parte de la variable Y no explicable por la
variable X, debido a la acción de otras variables auxiliares. Entonces “e” se considera
un efecto residual.
y = α + βx + e
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 6
Este modelo combina el efecto científico, esperable, determinista de la variable con el
efecto aleatorio, azaroso, debido a la combinación de variables desconocidas o no
medidas que ejercen su influencia.
Para hallar una recta que se adapte adecuadamente a los valores observados es
necesario estimar α y β poblacionales, que serán sustituidos respectivamente por a y
b.
y = a + bx + e
Tenemos entonces los valores reales “y” y los ajustados “y*”. La diferencia entre
ambos “e” se corresponde a la discrepancia, el margen de error o valor residual para
un individuo entre el valor observado y el calculado:
y = y* + e
Ahora debemos utilizar el método de los mínimos cuadrados para minimizar la suma
de los residuos al cuadrado.
A partir de esta expresión obtenemos las estimaciones de a y b. Este último equivale
al coeficiente de regresión.
;
Una vez hallados ambos valores, hay que contrastar la recta de regresión mediante el
coeficiente de correlación o averiguar si el coeficiente de regresión “b” es semejante al
especificado por la hipótesis nula.
H0: β=0. No existe relación.
H1: β≠0. Existe relación.
Si H0 es cierta, entonces seguirá la distribución “t” de Student-Fisher, por lo que
podremos resolver la prueba de hipótesis con normalidad.
BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón
Página 7
Cálculo de la recta de regresión
Consiste en la sustitución de la nube de puntos por una función que represente la
relación existente entre las variables.
Representatividad de la recta de regresión
Es necesario buscar un criterio para evaluar la representatividad de la recta de
regresión (función) que hemos hallado, evaluar la corrección del ajuste realizado.
Si la varianza de los valores residuales es pequeña, el ajuste será bueno, próximo a la
realidad. Sin embargo, si la varianza es grande, la representatividad de la recta será
escasa.
A partir de la definición anterior: y = y* + e, obtenemos que:
Sy
2
= Sy*
2
+ Se
2
Coeficiente de determinación
El coeficiente de determinación “R2
” es una medida de la proporción en que la
variación total medida por Sy
2
viene explicada por su componente Sy*
2
, es decir, mide
la representatividad que la recta de regresión tiene de la realidad.
Características:
Su valor es siempre positivo (<0).
Su valor se sitúa entre 0 y 1.
o Si R2
= 1, la relación entre las variables es perfecta, y la
representatividad de la recta es máxima. No existen valores residuales.
o Si R2
= 0, la recta de regresión no explica en absoluto la relación entre
las variables.
No posee unidades.
Equivale al cuadrado del coeficiente de correlación lineal de Pearson (R2
= r2
).

Contenu connexe

Tendances

Tema 2.1 regresión lineal
Tema 2.1  regresión linealTema 2.1  regresión lineal
Tema 2.1 regresión lineal
Anthony Maule
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
thomas669
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
aramirez
 

Tendances (20)

Tema 2.1 regresión lineal
Tema 2.1  regresión linealTema 2.1  regresión lineal
Tema 2.1 regresión lineal
 
Correlacion de pearson
Correlacion de pearsonCorrelacion de pearson
Correlacion de pearson
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Distribución normal y t de student
Distribución normal y t de studentDistribución normal y t de student
Distribución normal y t de student
 
Escalas o Niveles de medición (estadística)
Escalas o Niveles de medición (estadística)Escalas o Niveles de medición (estadística)
Escalas o Niveles de medición (estadística)
 
Metodo parametrico y no parametrico
Metodo parametrico y no parametricoMetodo parametrico y no parametrico
Metodo parametrico y no parametrico
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadrado
 
PRUEBAS PARAMETRICAS
PRUEBAS PARAMETRICASPRUEBAS PARAMETRICAS
PRUEBAS PARAMETRICAS
 
Coeficiente de Correlación de Pearson
Coeficiente de Correlación de PearsonCoeficiente de Correlación de Pearson
Coeficiente de Correlación de Pearson
 
Análisis de Regresión Lineal
Análisis de Regresión LinealAnálisis de Regresión Lineal
Análisis de Regresión Lineal
 
Estadistica parametrica y no parametrica
Estadistica parametrica y no parametricaEstadistica parametrica y no parametrica
Estadistica parametrica y no parametrica
 
Análisis de Correlacion Lineal
Análisis de Correlacion LinealAnálisis de Correlacion Lineal
Análisis de Correlacion Lineal
 
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Coeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearmanCoeficiente de corelacio de pearson y spearman
Coeficiente de corelacio de pearson y spearman
 
Medidas de Dispersión
Medidas de DispersiónMedidas de Dispersión
Medidas de Dispersión
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
 
Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
 
Correlación
CorrelaciónCorrelación
Correlación
 

Similaire à DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB

Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
AlejandraViteri6
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Edgar López
 
Análisis estadístico.
Análisis estadístico.Análisis estadístico.
Análisis estadístico.
MaradelosngelesSalaz1
 
Tema 3 acabado!.
Tema 3 acabado!.Tema 3 acabado!.
Tema 3 acabado!.
pabloteba
 
Coeficiente de Correlacion
Coeficiente de CorrelacionCoeficiente de Correlacion
Coeficiente de Correlacion
lmldaniellml
 

Similaire à DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB (20)

Clase 2 De Octubre 2009
Clase 2 De Octubre 2009Clase 2 De Octubre 2009
Clase 2 De Octubre 2009
 
4. estadística descriptiva
4.  estadística descriptiva4.  estadística descriptiva
4. estadística descriptiva
 
Regresion estadistica
Regresion estadisticaRegresion estadistica
Regresion estadistica
 
Tema 6
Tema 6Tema 6
Tema 6
 
Bidimensional
BidimensionalBidimensional
Bidimensional
 
9 distribuciones bidimensionales
9 distribuciones bidimensionales9 distribuciones bidimensionales
9 distribuciones bidimensionales
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
 
Análisis estadístico.
Análisis estadístico.Análisis estadístico.
Análisis estadístico.
 
Coeficientes de correlación
Coeficientes de correlaciónCoeficientes de correlación
Coeficientes de correlación
 
Correlacion y regresion
Correlacion y regresionCorrelacion y regresion
Correlacion y regresion
 
Estadística y probabilidad
Estadística y probabilidadEstadística y probabilidad
Estadística y probabilidad
 
Tema 3 acabado!.
Tema 3 acabado!.Tema 3 acabado!.
Tema 3 acabado!.
 
tema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdftema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdf
 
PPT-Correlación-PROB.-Y-EST.pptx
PPT-Correlación-PROB.-Y-EST.pptxPPT-Correlación-PROB.-Y-EST.pptx
PPT-Correlación-PROB.-Y-EST.pptx
 
Pearson y de Sperman
Pearson y de Sperman Pearson y de Sperman
Pearson y de Sperman
 
análisis estadistico.pptx
análisis estadistico.pptxanálisis estadistico.pptx
análisis estadistico.pptx
 
Coeficiente de Correlacion
Coeficiente de CorrelacionCoeficiente de Correlacion
Coeficiente de Correlacion
 
Datos bivariados
Datos bivariadosDatos bivariados
Datos bivariados
 
Datos bivariados
Datos bivariadosDatos bivariados
Datos bivariados
 
Datos bivariados
Datos bivariadosDatos bivariados
Datos bivariados
 

Plus de Lola FFB

Plus de Lola FFB (20)

PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...
PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...
PPT TFG "Comorbilidad en la psoriasis y su relación con la terapia biológica"...
 
Tema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFB
Tema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFBTema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFB
Tema 15. UROANDROLOGÍA (I). DISFUNCIÓN ERÉCTIL. Patología quirúrgica. Lola FFB
 
Temas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFB
Temas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFBTemas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFB
Temas 10-11. PATOLOGÍA INTRAESCROTAL. Patología quirúrgica. Lola FFB
 
DIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFB
DIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFBDIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFB
DIÁTESIS HEMORRÁGICAS. Pediatría. LolaFFB
 
TOS FERINA. Pediatría. LolaFFB
TOS FERINA. Pediatría. LolaFFBTOS FERINA. Pediatría. LolaFFB
TOS FERINA. Pediatría. LolaFFB
 
MALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFB
MALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFBMALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFB
MALABSORCIÓN DE LOS HIDRATOS DE CARBONO. Pediatría. LolaFFB
 
FIBROSIS QUÍSTICA. Pediatría. LolaFFB
FIBROSIS QUÍSTICA. Pediatría. LolaFFBFIBROSIS QUÍSTICA. Pediatría. LolaFFB
FIBROSIS QUÍSTICA. Pediatría. LolaFFB
 
CARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFB
CARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFBCARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFB
CARDIOPATÍAS CONGÉNITAS. Pediatría. LolaFFB
 
ETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFB
ETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFBETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFB
ETAPAS DE LA INVESTIGACIÓN DE UN BROTE. Epidemiología. LolaFFB
 
VIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFB
VIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFBVIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFB
VIGILANCIA EPIDEMIOLÓGICA. Epidemiología. LolaFFB
 
HISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFB
HISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFBHISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFB
HISTORIA NATURAL DE LA ENFERMEDAD. NIVELES DE PREVENCIÓN. Epidemiología. LolaFFB
 
ESTUDIOS TRANSVERSALES. Epidemiología. LolaFFB
ESTUDIOS TRANSVERSALES. Epidemiología. LolaFFBESTUDIOS TRANSVERSALES. Epidemiología. LolaFFB
ESTUDIOS TRANSVERSALES. Epidemiología. LolaFFB
 
MODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFB
MODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFBMODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFB
MODELOS CAUSALES EN EPIDEMIOLOGÍA. Epidemiología. LolaFFB
 
TÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFB
TÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFBTÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFB
TÉCNICAS DE ESTANDARIZACIÓN. Epidemiología. LolaFFB
 
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFBPRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB
 
MEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFB
MEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFBMEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFB
MEDICIÓN DE LOS PROBLEMAS DE SALUD. TM Y MP. Epidemiología. LolaFFB
 
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFBVARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD. Bioestadística. LolaFFB
 
FUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFB
FUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFBFUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFB
FUENTES DE DATOS DE MORBILIDAD. Epidemiología. LolaFFB
 
USOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFB
USOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFBUSOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFB
USOS DE LA EPIDEMIOLOGÍA Y SALUD PÚBLICA. Epidemiología. LolaFFB
 
CONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFB
CONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFBCONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFB
CONCEPTO DE EPIDEMIOLOGÍA. Epidemiología. LolaFFB
 

Dernier

(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)
(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)
(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)
UDMAFyC SECTOR ZARAGOZA II
 
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materalDiabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
f5j9m2q586
 
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
UDMAFyC SECTOR ZARAGOZA II
 
Diabetes Mellitus 2024 y fisiologia y datos.pdf
Diabetes Mellitus 2024 y fisiologia y datos.pdfDiabetes Mellitus 2024 y fisiologia y datos.pdf
Diabetes Mellitus 2024 y fisiologia y datos.pdf
AbelPerezB
 

Dernier (20)

indicadores para el proceso de esterilización de ceye .pdf
indicadores para el proceso de esterilización de ceye .pdfindicadores para el proceso de esterilización de ceye .pdf
indicadores para el proceso de esterilización de ceye .pdf
 
(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)
(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)
(2024-04-30). ACTUALIZACIÓN EN PREP FRENTE A VIH (PPT)
 
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materalDiabetes tipo 2 expo guias ada 2024 apuntes y materal
Diabetes tipo 2 expo guias ada 2024 apuntes y materal
 
1. Anatomía funcional de los organos reproductivos en animales menores
1. Anatomía funcional de los organos reproductivos en animales menores1. Anatomía funcional de los organos reproductivos en animales menores
1. Anatomía funcional de los organos reproductivos en animales menores
 
Historia Clínica y Consentimiento Informado en Odontología
Historia Clínica y Consentimiento Informado en OdontologíaHistoria Clínica y Consentimiento Informado en Odontología
Historia Clínica y Consentimiento Informado en Odontología
 
Resolucion Ministerial 242-2024-MINSA.pdf
Resolucion Ministerial 242-2024-MINSA.pdfResolucion Ministerial 242-2024-MINSA.pdf
Resolucion Ministerial 242-2024-MINSA.pdf
 
LA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENO
LA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENOLA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENO
LA MEDICINA GRECORROMANA HIPOCRATES, HEROFILO Y GALENO
 
Uso Racional del medicamento prescripción
Uso Racional del medicamento prescripciónUso Racional del medicamento prescripción
Uso Racional del medicamento prescripción
 
Resumen de tejido Óseo de Histología texto y atlas de Ross.pptx
Resumen de tejido Óseo de Histología texto y atlas de Ross.pptxResumen de tejido Óseo de Histología texto y atlas de Ross.pptx
Resumen de tejido Óseo de Histología texto y atlas de Ross.pptx
 
Anticoncepcion actualización 2024 según la OMS
Anticoncepcion actualización 2024 según la OMSAnticoncepcion actualización 2024 según la OMS
Anticoncepcion actualización 2024 según la OMS
 
HELICOBACTER PYLORI y afectacion norman.pptx
HELICOBACTER PYLORI  y afectacion norman.pptxHELICOBACTER PYLORI  y afectacion norman.pptx
HELICOBACTER PYLORI y afectacion norman.pptx
 
Manejo adecuado del bulto de ropa quirugico
Manejo adecuado del bulto de ropa quirugicoManejo adecuado del bulto de ropa quirugico
Manejo adecuado del bulto de ropa quirugico
 
Generalidades de fisiología del equilibrio-Medicina.pptx
Generalidades de fisiología del equilibrio-Medicina.pptxGeneralidades de fisiología del equilibrio-Medicina.pptx
Generalidades de fisiología del equilibrio-Medicina.pptx
 
Nutrición para el control de hipercolesterolemia e hiper trigliceridemia- Nut...
Nutrición para el control de hipercolesterolemia e hiper trigliceridemia- Nut...Nutrición para el control de hipercolesterolemia e hiper trigliceridemia- Nut...
Nutrición para el control de hipercolesterolemia e hiper trigliceridemia- Nut...
 
TEXTO PRN 8VA ESPAÑOL.pdf reanimacion neonatal
TEXTO PRN 8VA ESPAÑOL.pdf reanimacion neonatalTEXTO PRN 8VA ESPAÑOL.pdf reanimacion neonatal
TEXTO PRN 8VA ESPAÑOL.pdf reanimacion neonatal
 
Psorinum y sus usos en la homeopatía y la dermatología
Psorinum y sus usos en la homeopatía y la dermatologíaPsorinum y sus usos en la homeopatía y la dermatología
Psorinum y sus usos en la homeopatía y la dermatología
 
Histología del pelo o cabello-Medicina.pptx
Histología del pelo o cabello-Medicina.pptxHistología del pelo o cabello-Medicina.pptx
Histología del pelo o cabello-Medicina.pptx
 
glucólisis anaerobia.pdf
glucólisis                 anaerobia.pdfglucólisis                 anaerobia.pdf
glucólisis anaerobia.pdf
 
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
(2024-05-06)Sesion Anticoncepción desde atencion primaria (DOC)
 
Diabetes Mellitus 2024 y fisiologia y datos.pdf
Diabetes Mellitus 2024 y fisiologia y datos.pdfDiabetes Mellitus 2024 y fisiologia y datos.pdf
Diabetes Mellitus 2024 y fisiologia y datos.pdf
 

DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN. Bioestadística. LolaFFB

  • 1. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 1 PRUEBA DE PREPARACIÓN Nº2 DIAGRAMAS DE DISPERSIÓN, CORRELACIÓN Y REGRESIÓN A lo largo de este tema cada vez que hablemos de variables, supondremos que se tratan de variables de carácter cuantitativo y discreto, todas tomadas de una misma población. El hecho de que sean rasgos de una misma población nos hará preguntarnos si existe una posible dependencia o relación entre los mismos. Dependencia funcional y estadística de una variable estadística bidimensional (X,Y) Decimos que existe dependencia funcional de Y sobre X cuando a cada valor xi se le asigna un único valor yj (y = f(x)), es decir, que el valor de una de las variables determina exactamente en valor de la otra. Según como se encuentren los puntos la relación será lineal, exponencial, parabólica… Las variables X e Y serán independientes si el valor de una variable no influye sobre la otra, sino que sus distribuciones coinciden. El resto de casos se trata de dependencia o relación estadística, que será más o menos intensa según si el diagrama de puntos que formen se aproxime más o menos a la representación imaginaria de una función. Las relaciones pueden ser: o directa, si cuando crece o decrece la una, hace lo mismo la otra, o inversa, si cuando crece o decrece la una, la otra hace lo contrario. Diagrama de dispersión Para descubrir estas relaciones entre variables (X e Y) usamos frecuentemente el diagrama de dispersión o “nube de puntos”, por ser capaz de informarnos de la clase de dependencia que poseen. Considerando que: xi toma los valores x1, x2,…, xr. yj toma los valores y1, y2,…, yp. Entonces definimos nij como el número de individuos que toman el valor xi (para X) y el valor yj (para la variable Y).
  • 2. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 0.2 0.4 0.6 0.8 Dependencia lineal funcional (directa) Todos estos datos se organizan fácilmente en tablas de doble entrada. Así representaremos en el plano cartesiano cada uno de los puntos (xi, yj) con frecuencia no nula. Los valores de la variable X estarán situados en el eje de abscisas y los de Y en el de ordenadas. En realidad, en abscisas procuraremos colocar de las dos variables, la “explicativa” o independiente, siempre que esto se cumpla. 0 0.1 0.2 0.3 0.4 0.5 0 0.2 0.4 0.6 Dependencia lineal estadística débil (directa) 0 0.1 0.2 0.3 0.4 0.5 0.6 0 0.2 0.4 0.6 Dependencia lineal estadística débil (inversa) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 0.2 0.4 0.6 0.8 Dependencia lineal funcional (inversa) 0 0.1 0.2 0.3 0.4 0.5 0.6 0 0.2 0.4 0.6 0.8 Dependencia lineal estadística fuerte (directa) 0 0.2 0.4 0.6 0.8 1 1.2 0 0.5 1 Dependencia lineal estadística fuerte (inversa)
  • 3. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 3 Antes de sacar conclusiones, debemos tener en cuenta si: Las variables definidas nos hacen intuir la existencia de una posible relación. Existen numerosos datos y la nube de puntos sugiere alguna clase de dependencia. Los valores observados se han obtenido de la población o de una muestra. Existen posibles influencias de otras variables sobre las estudiadas. No olvidemos que causalidad implica correlación, pero no al revés. Es decir: una relación causa-efecto tiene, por ende, que deberse a una relación entre las variables; sin embargo, dos variables dependientes no tienen que tener una relación causa- efecto. Covarianza Para estudiar la relación entre dos variables se calcula la denominada covarianza (Sxy), que nos indica el grado de variación conjunta de ambas variables así como el sentido de la misma: directa o positiva (ambas varían en el mismo sentido). inversa o negativa (varían conjuntamente pero en sentido contrario). En resumen, nos permite cuantificar la dependencia estadística entre las variables. Covarianza poblacional: Covariancia muestral: La varianza, al ser una suma de valores al cuadrado, tiene siempre valores positivos. En cambio, la covarianza puede tener resultados negativos ya que en el producto de dos diferencias, si una es negativa, el producto final será también negativo. Este es el caso de multiplicar valores de X por encima de la media (+) por valores de Y por debajo
  • 4. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 4 de la misma (-). Existen otros casos en los que los valores positivos compensan a los negativos haciendo que el valor de la covarianza tienda a cero. Entonces tenemos que la covarianza tendrá: Valores positivos si la relación entre las variables es directa. Valores negativos si la relación de las variables es inversa. De cero si no existe relación entre las variables o la que la relación que la explica no es ninguna de las estudiadas. La covarianza depende pues de: La intensidad de la relación (el valor absoluto de la covarianza será mayor cuanto mayor sea la intensidad de la misma). Las unidades de medida usadas. Al variar la unidad de medida de la varianza, ésta cambia exponencialmente. Por otro lado, si alteramos las unidades de la covarianza, el resultado cambia proporcionalmente. La varianza de las dos variables estudiadas. Coeficiente de correlación lineal de Pearson El coeficiente de correlación lineal (r) mide la intensidad de la relación entre X e Y. ; Características: Sólo en relaciones de tipo lineal. Se nombra con ρ cuando pertenece a la población, y r si pertenece a una muestra. No tiene unidades: el cambio de las unidades de medida, al contrario que la varianza y la covarianza, no afecta a su resultado. Su valor oscila entre 1 y -1. o 1 cuando la correlación es perfecta y directa. o 0 cuando no existe correlación. o -1 cuando es perfecta e inversa. Pruebas de hipótesis: relación entre dos variables cuantitativas Normalmente en el estudio usamos una muestra de la población (r), es decir, una estimación del valor auténtico, de la relación real (ρ). Por ello debemos construir las siguientes hipótesis:
  • 5. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 5 H0: ρ=0. No existe relación entre las variables. H1: ρ≠0 (ρ <0 ó ρ >0). Existe relación entre las variables. Se sabe que siguen una distribución “t” de Student-Fischer con n-2 grados de libertad si las dos variables siguen la ley normal y no están relacionadas. Entonces, según el valor de “t” obtenido: Si t ≤ tαν, no se puede rechazar la hipótesis de independencia de las dos variables en la población origen de la muestra. Si t > tαν, se afirma la hipótesis de que existe relación entre las dos variables en la población origen de la muestra. Regresión Para predecir los valores de una de las variables a partir de la otra utilizamos las rectas de regresión: de Y sobre X, para hallar los valores de Y conocida X. de X sobre Y, para hallar los valores de X conocida Y. En algunos casos, un valor de X se corresponde a un único valor de Y (modelo lineal). En ellos α representa un valor constante que sitúa la recta, y β es la pendiente de la misma. En otros casos, a un mismo valor de X no siempre le corresponde un único valor de Y, sino un intervalo de los mismos. Pero, para ambos casos, podemos recurrir a la misma expresión ya que nos permite simplificar, comprender y predecir la relación existente entre las variables: y = α + βx Con esto deducimos que habrá un cierto margen de error en la aproximación de la nube de puntos a una sola recta. Por ello flexibilizamos la fórmula de la siguiente forma: y = α + βx + e. “e” se corresponde a la parte de la variable Y no explicable por la variable X, debido a la acción de otras variables auxiliares. Entonces “e” se considera un efecto residual. y = α + βx + e
  • 6. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 6 Este modelo combina el efecto científico, esperable, determinista de la variable con el efecto aleatorio, azaroso, debido a la combinación de variables desconocidas o no medidas que ejercen su influencia. Para hallar una recta que se adapte adecuadamente a los valores observados es necesario estimar α y β poblacionales, que serán sustituidos respectivamente por a y b. y = a + bx + e Tenemos entonces los valores reales “y” y los ajustados “y*”. La diferencia entre ambos “e” se corresponde a la discrepancia, el margen de error o valor residual para un individuo entre el valor observado y el calculado: y = y* + e Ahora debemos utilizar el método de los mínimos cuadrados para minimizar la suma de los residuos al cuadrado. A partir de esta expresión obtenemos las estimaciones de a y b. Este último equivale al coeficiente de regresión. ; Una vez hallados ambos valores, hay que contrastar la recta de regresión mediante el coeficiente de correlación o averiguar si el coeficiente de regresión “b” es semejante al especificado por la hipótesis nula. H0: β=0. No existe relación. H1: β≠0. Existe relación. Si H0 es cierta, entonces seguirá la distribución “t” de Student-Fisher, por lo que podremos resolver la prueba de hipótesis con normalidad.
  • 7. BIOESTADÍSTICA: TEORÍA PP2 Lola Fernández de la Fuente Bursón Página 7 Cálculo de la recta de regresión Consiste en la sustitución de la nube de puntos por una función que represente la relación existente entre las variables. Representatividad de la recta de regresión Es necesario buscar un criterio para evaluar la representatividad de la recta de regresión (función) que hemos hallado, evaluar la corrección del ajuste realizado. Si la varianza de los valores residuales es pequeña, el ajuste será bueno, próximo a la realidad. Sin embargo, si la varianza es grande, la representatividad de la recta será escasa. A partir de la definición anterior: y = y* + e, obtenemos que: Sy 2 = Sy* 2 + Se 2 Coeficiente de determinación El coeficiente de determinación “R2 ” es una medida de la proporción en que la variación total medida por Sy 2 viene explicada por su componente Sy* 2 , es decir, mide la representatividad que la recta de regresión tiene de la realidad. Características: Su valor es siempre positivo (<0). Su valor se sitúa entre 0 y 1. o Si R2 = 1, la relación entre las variables es perfecta, y la representatividad de la recta es máxima. No existen valores residuales. o Si R2 = 0, la recta de regresión no explica en absoluto la relación entre las variables. No posee unidades. Equivale al cuadrado del coeficiente de correlación lineal de Pearson (R2 = r2 ).