INFORME FINAL_ESTADISTICA APLICADA AL SECTOR SALUD.docx

INFORME FINAL_ESTADISTICA APLICADA AL SECTOR SALUD

MAESTRÍA EN GERENCIA DE INSTITUCIONES DE SALUD
MATERIA:
ESTADÍSTICAAPLICADA SECTOR SALUD
TAREA:
INFORME FINAL
DOCENTE:
ING. SALOMÒN QUITO GUACHAMIN
ÍNDICE
REGRESIÓN SIMPLE ..............................................................................3
Frecuencias de la variable..........................................................................3
Estadísticos de la variable..........................................................................3
Representación gráfica...............................................................................3
Comparación de estadísticos......................................................................4
Descriptivos, valores atípicos y percentiles...............................................5
Diagrama de Tukey. ...................................................................................6
Tabla de contingencias (dos variables). .....................................................6
Tabla de contingencias (segmentada) ........................................................7
REGRESIÓN MÚLTIPLE.........................................................................8
Determinación de una muestra aleatoria de casos. ....................................8
Análisis de regresión lineal simple. Cálculo de la ecuación de regresión.
Variabilidad. ...............................................................................................9
..................................................................................................................10
Análisis de regresión lineal múltiple. Desarrollo de diagramas de
dispersión. ................................................................................................10
Análisis de región lineal simple. Ecuación de regresión. ........................ 11
DISTRIBUCIÓN NORMAL....................................................................12
Análisis de varianza. ................................................................................13
Comparaciones múltiples post hoc o comparaciones a posterior ............15
Interacciones. Gráfico de perfil................................................................15
REGRESIÓN SIMPLE
Por favor calcule e interprete los procedimientos correspondientes al archivo de SPSS
“Datos de empleados” en el análisis descriptivo de los datos que se indican. Utilice los
apuntes de la asignatura o lo que usted considere necesario.
Frecuencias de la variable
a. Frecuencias de la variable “Categoría laboral”.
Estadísticos de la variable
b. Estadísticos de la variable anterior (media, mediana, moda, desviación típica,
asimetría y curtosis).
Representación gráfica
c. Represente un gráfico de “Salario actual” (con curva normal).
Comparación de estadísticos
d. Comparación de estadísticos indicados de la variable de la primera pregunta con
la variable “Nivel educativo”.
En la categoría laboral podemos observar que de 474 colaboradores de la
empresa que equivale al 100%, 363 personas que equivale al 76,6% se
encuentran en el área administrativa, 27 que corresponden al 5,7% están en el
área de seguridad y 84 que representan al 17,7% se encuentran en el área
directiva.
Mientras que en la categoría de nivel académico tenemos que del 100% de los
colaboradores el 0,2%, siendo el porcentaje más bajo, pertenece al grupo de
colaboradores que tienen 21 años de estudio y el 40% que corresponde al
porcentaje más alto de esta categoría, representa a los colaboradores que tienen
12 años de estudio.
Descriptivos, valores atípicos y percentiles
e. Por favor calcule los estadísticos del procedimiento “Explorar” utilizando la
variable “Experiencia previa” como dependiente y la variable “Sexo” como
factor. Identifique: descriptivos, valores atípicos y percentiles. Identifique:
Descriptivos, valores atípicos y percentiles
Diagrama de Tukey.
f. Represente el gráfico (diagrama de caja) para las variables “Salario inicial” y
“Salario actual” (dependientes) y la variable “Sexo” (factor). Marcar la opción
“Dependientes juntas” del recuadro “Diagramas de caja”.
Tabla de contingencias (dos variables).
g. Construya una “Tabla de contingencias” con la variable “Sexo” (fila) y la
variable “Categoría laboral” (columna). Represente las variables sexo y
categoría laboral en un único gráfico.
Tabla de contingencias (segmentada)
h. Obtenga una tabla de contingencias (segmentada) manteniendo “Sexo” y
“Categoría laboral” como variables fila y columna, respectivamente. Utilizar
como variable de segmentación “Clasificación de minorías”.
REGRESIÓN MÚLTIPLE
Por favor calcule e interprete los procedimientos correspondientes en el análisis de los
datos que se indican. Utilice los apuntes de la asignatura o lo que usted considere
necesario.
Determinación de una muestra aleatoria de casos.
a.“Seleccione casos” de una muestra aleatoria de la variable “Fecha de nacimiento”
(95% de todos los casos). Archivo de SPSS “Datos de empleados”, Datos,
Seleccionar casos.
b.Realice un análisis de regresión lineal simple (simple=una variable
independiente) con las especificaciones que el programa tiene establecidas por
defecto (véase la opción Regresión lineal del menú Analizar). Seleccionar la
variable “Salario” (dependiente) y “Salini” (independiente). Calcule la ecuación
de regresión mediante la determinación de los coeficientes de regresión parcial.
Determine a través del “Resumen del modelo” la variabilidad del “Salario
actual” sabiendo que R2 es el porcentaje de mejora en los pronósticos (R2
expresa la proporción de varianza de la variable dependiente que está explicada
por la variable independiente; Coeficiente de determinación). Considerar que en
el ejemplo R (coeficiente de correlación múltiple) toma un valor muy alto (su
máximo es 1) y R2 indica que el x% de la variabilidad del “Salario actual” está
explicada por, depende de, o está asociada al “Salario inicial”.
Análisis de regresión lineal simple. Cálculo de la ecuación de regresión.
Variabilidad.
c. En un análisis de regresión lineal múltiple (múltiple=más de una variable
independiente), la ecuación de regresión ya no define una recta en un plano, sino
un hiperplano en un espacio multidimensional. En un modelo con, por ejemplo,
dos variables independientes, el diagrama de dispersión adopta la forma de un
plano en un espacio tridimensional. Considerando lo anterior, por
favor represente con “Salario” como variable dependiente y “Salini” (salario
inicial) y “Expprev” (experiencia previa) como variables independientes,
el diagrama de dispersión aproximado (intuido) correspondiente (no utilice
SPSS). ¿Se puede sacar algún supuesto de la representación obtenida?
ECUACIÓN DE REGRESIÓN
Salario Actual= 1872,85 + 1,91 * Salario Inicial
LA BONDAD DE AJUSTE ES DE 79,5%
Análisis de regresión lineal múltiple. Desarrollo de diagramas de dispersión.
GRÁFICO
DE
DISPERSIÓN
Análisis de región lineal simple. Ecuación de regresión.
d.Lleve a cabo un análisis de regresión múltiple con Regresión lineal del menú
Analizar, seleccionando la variable “Salario” (dependiente) y las variables
“Salini, Expprev y Educ” como independientes. Determine el “Resumen del
modelo” y la ecuación de regresión correspondiente.
Considerando que el resumen del ANOVA ofrece el nivel crítico (Sig.; si es
<0,05 indicará la existencia de relación lineal significativa), ¿sabría indicar si el
hiperplano definido por la ecuación de regresión ofrece un buen ajuste a la nube
de puntos?, ¿y si las tres variables utilizadas contribuyen de forma significativa
al ajuste del modelo? (Tabla de coeficientes de regresión parcial).
LA PROYECCIÓN TIENE UN ALTO NIVEL DE EXACTITUD DEL 80,3%
EL RESULTADO DE LA SIGNIFICANCIA INDICA QUE LA REGRESIÓN SI ES
APROPIADA PARA REALIZAR UN PRONÓSTICO
ECUACIÓN
SALARIO ACTUAL= 3881 + 1,74 * SALARIO INICIAL - 16,417 * EXPERIENCIA PREVIA + 757,270 *
NIVEL EDUCATIVO
DISTRIBUCIÓN NORMAL
Por favor calcule e interprete los procedimientos correspondientes en el análisis de los
datos que se indican. Utilice los apuntes de la asignatura, el material de la plataforma
Moodle o lo que usted considere necesario. Preste especial atención a responder lo que se
solicita en las partes sin completar o texto subrayado.
Los modelos factoriales de análisis de varianza (factorial=más de un factor) sirven para
evaluar el efecto individual y conjunto de dos o más factores (variables independientes
categóricas) sobre una variable dependiente cuantitativa. En un modelo de dos factores,
los efectos de interés son tres: los dos efectos principales (uno por cada factor) y el efecto
de la interacción entre ambos factores. El procedimiento “univariante” incluye todos estos
modelos factoriales de ANOVA. Pero, además, ofrece la posibilidad de trabajar tanto con
factores de efectos fijos como con factores de efectos aleatorios. También permite llevar
a cabo análisis de covarianza y de regresión, y utilizar modelos aleatorizados en bloques
y modelos jerárquicos o con factores anidados.
En un análisis de varianza factorial existe una hipótesis nula por cada factor y por cada
posible combinación de factores. La hipótesis nula referida a un factor afirma que las
medias de las poblaciones definidas por los niveles del factor son iguales. La hipótesis
referida al efecto de una interacción afirma que tal efecto es nulo. Para contrastar esta
hipótesis, el ANOVA factorial se sirve de estadísticos F. Así pues, para cada efecto existe
una hipótesis y para cada hipótesis un estadístico F que permite contrastarla. El nivel
crítico asociado a cada estadístico F es el que permite decidir si se puede mantener o se
debe rechazar una hipótesis. En un ANOVA factorial se trabaja con tantas poblaciones
como casillas resultan de la combinación de todos los niveles de los factores involucrados.
Análisis de varianza.
a. Por favor lleve a cabo un análisis de varianza de más de un factor. Seleccione la
opción “Modelo lineal general, univariante” del menú “Analizar”, utilizando el
archivo de SPSS “Datos de empleados”. Para obtener un ANOVA factorial
emplee las especificaciones que el procedimiento “univariante” tiene establecidas
por defecto.
Estudie si los grupos definidos por la variable catlab (categoría laboral), por un
lado, y los grupos definidos por la variable minoría (clasificación étnica), por
otro, difieren en la variable salario (salario actual). Para ello en el cuadro de
diálogo “univariante” seleccione la variable salario y trasládela al cuadro
dependiente. Seleccionar las variables catlab y minoría y trasládelas a la lista
Factores fijos.
El resumen del ANOVA muestra en la fila Modelo corregido el nivel crítico
asociado al estadístico F (p= 0,000 < 0,05) indicando que el modelo explica una
parte significativa de la variación observada en la variable dependiente (salario).
El valor R2 indica que los tres efectos incluidos en el modelo (catlab, minoría y
catlab*minoría) están explicando el 65,1% de la varianza de la variable
dependiente salario.
La fila intersección se refiere a la constante del modelo. Las dos filas siguientes
recogen los efectos principales. Los niveles críticos (Sig.) indican que, mientras
los grupos definidos por la variable catlab poseen salarios medios
significativamente diferentes (Sig.= 0,000 < 0,05), los salarios medios de los
grupos definidos por la variable minoría no difieren (Sig. = 0,127 > 0,05).
La siguiente fila contiene información sobre el efecto de la interacción
catlab*minoría. El estadístico F correspondiente a este efecto tiene asociado un
nivel crítico de 3,9%, lo que indica que el efecto de la interacción es significativo.
Solo con este dato, ya se puede anticipar que las diferencias salariales que se dan
entre las distintas categorías laborales no son las mismas en los dos grupos étnicos
considerados.
La fila error ofrece información referida a la fuente de variación error o residual.
b. Si alguno de los estadísticos F asociados a los efectos principales resulta
significativo, puede interesar efectuar compasiones post hoc. Los estadísticos F
del ANOVA solo permiten contrastar la hipótesis general de que los promedios
comparados son iguales. Al rechazar esa hipótesis se sabe que existen diferencias,
pero no se sabe dónde están.
Para averiguar qué media en concreto difiere de qué otra es necesario utilizar un
tipo particular de contrastes denominados comparaciones múltiples post hoc o
comparaciones a posteriori. Estas comparaciones permiten controlar la tasa de
error al efectuar varias comparaciones utilizando las mismas medias, es decir,
permiten controlar la probabilidad de cometer errores tipo I al tomar varias
decisiones.
Pulse el botón Post hoc del cuadro de diálogo Univariante para acceder al
subcuadro de diálogo Univariante: Comparaciones múltiples post hoc. Aunque
no todos los métodos disponibles se basan en la misma lógica, todos ellos se
obtienen e interpretan de la misma forma; de modo que basta con marcar uno o
dos para estudiar los resultados que genera.
En el cuadro de diálogo Univariante, trasladar la variable salario al cuadro
Dependiente y las variables catlab y minoría a la lista Factores fijos. Seleccionar
la variable catlab en la lista Factores y trasladarla a la lista Contrastes post hoc
para. Marcar la opción Tukey del recuadro Asumiendo varianzas iguales y la
opción Games- Howell del recuadro No asumiendo varianzas iguales. En el
cuadro comparaciones múltiples post hoc se puede observar el resultado obtenido
con los dos métodos solicitados y que las conclusiones a las que se llega con
ambos procedimientos son idénticas.
La tabla Subgrupos homogéneos (basado en el método Tukey) ofrece un resumen
en el que los grupos cuyas medias no difieren entre sí están agrupados en el
mismo subconjunto. ¿Cuántos subconjuntos existen? Existen dos ¿podría
interpretarlos según su significación?. Señalar que la clasificación en subgrupos
homogéneos no está disponible con todas las pruebas post hoc, sino solo con
algunas; y a pesar de que no es posible asumir varianzas poblacionales iguales la
clasificación en subgrupos homogéneos se ha realizado utilizando el método de
Tukey en lugar del de GamesHowell.
Comparaciones múltiples post hoc o comparaciones a posterior
c. Las comparaciones múltiples post hoc suelen proporcionar toda la información
necesaria para poder interpretar correctamente un efecto principal significativo.
Pero no ocurre lo mismo con los efectos de las interacciones. La interpretación
correcta de una interacción suele requerir la ayuda de un gráfico de líneas,
también llamado gráfico de perfil.
En un gráfico de perfil sobre la interacción entre dos factores, en el eje de
ordenadas se representa la escala de las medias de la variable dependiente; en el
eje de abscisas se representan los niveles del primer factor; y las líneas del gráfico
representan los niveles del segundo factor.
Por favor obtenga un gráfico de perfil para el efecto de la interacción entre dos
factores: catlab y minoría. En el cuadro de diálogo Univariante, trasladar la
variable salario al cuadro Dependiente y las variables catlab y minoría a la lista
Factores fijos. Trasladar la variable catlab al cuadro Eje horizontal y la variable
minoría al cuadro Líneas distintas.
Interacciones. Gráfico de perfil.
Un servidor se atrevería a decir que una rápida inspección de las líneas aclararía el
significado de esta interacción: en principio, tanto en el grupo de blancos (minoría=no)
como en el de no blancos (minoría=sí), el salario medio parece mayor en los agentes de
seguridad que en los administrativos, y mayor todavía en los directivos que en los agentes
de seguridad; sin embargo, mientras en los grupos de administrativos y de agentes de
seguridad no parecen existir diferencias entre los dos grupos de clasificación étnica, en
el grupo directivos las diferencias entre los dos grupos de clasificación étnica parecen
evidentes. Por tanto, las diferencias en salario entre los dos grupos de clasificación étnica
parecen no ser la misma a lo largo de todas las categorías laborales.

Recommandé

EVALUACIÓN 3 RESOLUCION DE CASOS Y ELABORACION DE INFORME ANALISIS DE VARIANZ... par
EVALUACIÓN 3 RESOLUCION DE CASOS Y ELABORACION DE INFORME ANALISIS DE VARIANZ...EVALUACIÓN 3 RESOLUCION DE CASOS Y ELABORACION DE INFORME ANALISIS DE VARIANZ...
EVALUACIÓN 3 RESOLUCION DE CASOS Y ELABORACION DE INFORME ANALISIS DE VARIANZ...AnalexisHidalgo
24 vues6 diapositives
Diagrama de dispersión.pdf par
Diagrama de dispersión.pdfDiagrama de dispersión.pdf
Diagrama de dispersión.pdfAwitadePozol
134 vues23 diapositives
Investigación tema 5 par
Investigación tema 5Investigación tema 5
Investigación tema 5CarmenAlonzo7
273 vues13 diapositives
Tema IV Tecnicas de Pronostico Grupo 6.pptx par
Tema IV Tecnicas de Pronostico Grupo 6.pptxTema IV Tecnicas de Pronostico Grupo 6.pptx
Tema IV Tecnicas de Pronostico Grupo 6.pptxosdalysmar
4 vues24 diapositives
REPASO MODELOS ECONOMETRICOS.pdf par
REPASO MODELOS ECONOMETRICOS.pdfREPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdfLADYYADIRAGUERREROMO
17 vues33 diapositives
REPASO MODELOS ECONOMETRICOS.pdf par
REPASO MODELOS ECONOMETRICOS.pdfREPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdfLADYYADIRAGUERREROMO
20 vues33 diapositives

Contenu connexe

Similaire à INFORME FINAL_ESTADISTICA APLICADA AL SECTOR SALUD.docx

Regresion simple 1 estadistica par
Regresion simple 1   estadisticaRegresion simple 1   estadistica
Regresion simple 1 estadisticaJhon Fredy Tchc
623 vues15 diapositives
Regresion y correlacion.docx par
Regresion y correlacion.docxRegresion y correlacion.docx
Regresion y correlacion.docxPedroJuam
108 vues9 diapositives
Analisis de regresion (2) par
Analisis de regresion (2)Analisis de regresion (2)
Analisis de regresion (2)Michael Zambrana
3K vues50 diapositives
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP... par
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...AnalexisHidalgo
14 vues5 diapositives
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP... par
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...AnalexisHidalgo
14 vues5 diapositives
Unidad 3- paso 4 - Descripcion de la informacion.docx par
Unidad 3- paso 4 - Descripcion de la informacion.docxUnidad 3- paso 4 - Descripcion de la informacion.docx
Unidad 3- paso 4 - Descripcion de la informacion.docxyency yasnith niño rosas
4.7K vues22 diapositives

Similaire à INFORME FINAL_ESTADISTICA APLICADA AL SECTOR SALUD.docx(20)

Regresion y correlacion.docx par PedroJuam
Regresion y correlacion.docxRegresion y correlacion.docx
Regresion y correlacion.docx
PedroJuam108 vues
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP... par AnalexisHidalgo
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...
AnalexisHidalgo14 vues
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP... par AnalexisHidalgo
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...
RESOLUCIÓN DE CASOS Y ELABORACIÓN DE INFORME_REGRESIÓN LINEAL SIMPLE Y MÚLTUP...
AnalexisHidalgo14 vues
Coeficientes determinacion y correlacion par Janneth Zepeda
Coeficientes determinacion y correlacionCoeficientes determinacion y correlacion
Coeficientes determinacion y correlacion
Janneth Zepeda61.2K vues
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR... par JOSUEELIASLOPEZHERNA
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
CLASE 1 Conceptos de interpolación y ajuste de curvas METODO DE MINIMOS CUADR...
Trabajo investigación estadística par Marita Alvarez
Trabajo investigación estadísticaTrabajo investigación estadística
Trabajo investigación estadística
Marita Alvarez275 vues
Presentacion 5 diapost_regresion-upg par Edgar López
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
Edgar López232 vues
Paso 4 descripción de la información. par MarlyTenorio
Paso 4 descripción de la información.Paso 4 descripción de la información.
Paso 4 descripción de la información.
MarlyTenorio966 vues
diagnosis de la regresion par carlosjardon
diagnosis de la regresiondiagnosis de la regresion
diagnosis de la regresion
carlosjardon3.4K vues
Tecnicas cuantitativas de gestion.pptx par PedroJuam
Tecnicas cuantitativas de gestion.pptxTecnicas cuantitativas de gestion.pptx
Tecnicas cuantitativas de gestion.pptx
PedroJuam103 vues

Dernier

AGA.pdf par
AGA.pdfAGA.pdf
AGA.pdfFernandaPro
5 vues14 diapositives
ENFERMEDADES DE TRANSMISION SEXUAL.pptx par
ENFERMEDADES DE TRANSMISION SEXUAL.pptxENFERMEDADES DE TRANSMISION SEXUAL.pptx
ENFERMEDADES DE TRANSMISION SEXUAL.pptxederfabian806
9 vues15 diapositives
Cálculo de personal .pdf par
Cálculo de personal .pdfCálculo de personal .pdf
Cálculo de personal .pdfLindaGonzalez93
5 vues3 diapositives
Psicologia forense .pptx par
Psicologia forense .pptxPsicologia forense .pptx
Psicologia forense .pptxTeffTesfaye
6 vues9 diapositives
(2023-30-11) Manejo de la hiponatremia (ptt).pptx par
(2023-30-11) Manejo de la hiponatremia (ptt).pptx(2023-30-11) Manejo de la hiponatremia (ptt).pptx
(2023-30-11) Manejo de la hiponatremia (ptt).pptxUDMAFyC SECTOR ZARAGOZA II
15 vues19 diapositives
CD HISTO II (2) 1.ppt par
CD HISTO II (2) 1.pptCD HISTO II (2) 1.ppt
CD HISTO II (2) 1.pptDubreykaValdezserran
5 vues94 diapositives

Dernier(20)

ENFERMEDADES DE TRANSMISION SEXUAL.pptx par ederfabian806
ENFERMEDADES DE TRANSMISION SEXUAL.pptxENFERMEDADES DE TRANSMISION SEXUAL.pptx
ENFERMEDADES DE TRANSMISION SEXUAL.pptx
ederfabian8069 vues
CRISIS HIPERTENSIVAS.pptx par HermesVJ
CRISIS HIPERTENSIVAS.pptxCRISIS HIPERTENSIVAS.pptx
CRISIS HIPERTENSIVAS.pptx
HermesVJ7 vues

INFORME FINAL_ESTADISTICA APLICADA AL SECTOR SALUD.docx

  • 1. MAESTRÍA EN GERENCIA DE INSTITUCIONES DE SALUD MATERIA: ESTADÍSTICAAPLICADA SECTOR SALUD TAREA: INFORME FINAL DOCENTE: ING. SALOMÒN QUITO GUACHAMIN
  • 2. ÍNDICE REGRESIÓN SIMPLE ..............................................................................3 Frecuencias de la variable..........................................................................3 Estadísticos de la variable..........................................................................3 Representación gráfica...............................................................................3 Comparación de estadísticos......................................................................4 Descriptivos, valores atípicos y percentiles...............................................5 Diagrama de Tukey. ...................................................................................6 Tabla de contingencias (dos variables). .....................................................6 Tabla de contingencias (segmentada) ........................................................7 REGRESIÓN MÚLTIPLE.........................................................................8 Determinación de una muestra aleatoria de casos. ....................................8 Análisis de regresión lineal simple. Cálculo de la ecuación de regresión. Variabilidad. ...............................................................................................9 ..................................................................................................................10 Análisis de regresión lineal múltiple. Desarrollo de diagramas de dispersión. ................................................................................................10 Análisis de región lineal simple. Ecuación de regresión. ........................ 11 DISTRIBUCIÓN NORMAL....................................................................12 Análisis de varianza. ................................................................................13 Comparaciones múltiples post hoc o comparaciones a posterior ............15 Interacciones. Gráfico de perfil................................................................15
  • 3. REGRESIÓN SIMPLE Por favor calcule e interprete los procedimientos correspondientes al archivo de SPSS “Datos de empleados” en el análisis descriptivo de los datos que se indican. Utilice los apuntes de la asignatura o lo que usted considere necesario. Frecuencias de la variable a. Frecuencias de la variable “Categoría laboral”. Estadísticos de la variable b. Estadísticos de la variable anterior (media, mediana, moda, desviación típica, asimetría y curtosis). Representación gráfica c. Represente un gráfico de “Salario actual” (con curva normal).
  • 4. Comparación de estadísticos d. Comparación de estadísticos indicados de la variable de la primera pregunta con la variable “Nivel educativo”. En la categoría laboral podemos observar que de 474 colaboradores de la empresa que equivale al 100%, 363 personas que equivale al 76,6% se encuentran en el área administrativa, 27 que corresponden al 5,7% están en el área de seguridad y 84 que representan al 17,7% se encuentran en el área directiva. Mientras que en la categoría de nivel académico tenemos que del 100% de los colaboradores el 0,2%, siendo el porcentaje más bajo, pertenece al grupo de colaboradores que tienen 21 años de estudio y el 40% que corresponde al porcentaje más alto de esta categoría, representa a los colaboradores que tienen 12 años de estudio.
  • 5. Descriptivos, valores atípicos y percentiles e. Por favor calcule los estadísticos del procedimiento “Explorar” utilizando la variable “Experiencia previa” como dependiente y la variable “Sexo” como factor. Identifique: descriptivos, valores atípicos y percentiles. Identifique: Descriptivos, valores atípicos y percentiles
  • 6. Diagrama de Tukey. f. Represente el gráfico (diagrama de caja) para las variables “Salario inicial” y “Salario actual” (dependientes) y la variable “Sexo” (factor). Marcar la opción “Dependientes juntas” del recuadro “Diagramas de caja”. Tabla de contingencias (dos variables). g. Construya una “Tabla de contingencias” con la variable “Sexo” (fila) y la variable “Categoría laboral” (columna). Represente las variables sexo y categoría laboral en un único gráfico.
  • 7. Tabla de contingencias (segmentada) h. Obtenga una tabla de contingencias (segmentada) manteniendo “Sexo” y “Categoría laboral” como variables fila y columna, respectivamente. Utilizar como variable de segmentación “Clasificación de minorías”.
  • 8. REGRESIÓN MÚLTIPLE Por favor calcule e interprete los procedimientos correspondientes en el análisis de los datos que se indican. Utilice los apuntes de la asignatura o lo que usted considere necesario. Determinación de una muestra aleatoria de casos. a.“Seleccione casos” de una muestra aleatoria de la variable “Fecha de nacimiento” (95% de todos los casos). Archivo de SPSS “Datos de empleados”, Datos, Seleccionar casos. b.Realice un análisis de regresión lineal simple (simple=una variable independiente) con las especificaciones que el programa tiene establecidas por defecto (véase la opción Regresión lineal del menú Analizar). Seleccionar la variable “Salario” (dependiente) y “Salini” (independiente). Calcule la ecuación de regresión mediante la determinación de los coeficientes de regresión parcial. Determine a través del “Resumen del modelo” la variabilidad del “Salario actual” sabiendo que R2 es el porcentaje de mejora en los pronósticos (R2 expresa la proporción de varianza de la variable dependiente que está explicada por la variable independiente; Coeficiente de determinación). Considerar que en el ejemplo R (coeficiente de correlación múltiple) toma un valor muy alto (su máximo es 1) y R2 indica que el x% de la variabilidad del “Salario actual” está explicada por, depende de, o está asociada al “Salario inicial”.
  • 9. Análisis de regresión lineal simple. Cálculo de la ecuación de regresión. Variabilidad. c. En un análisis de regresión lineal múltiple (múltiple=más de una variable independiente), la ecuación de regresión ya no define una recta en un plano, sino un hiperplano en un espacio multidimensional. En un modelo con, por ejemplo, dos variables independientes, el diagrama de dispersión adopta la forma de un plano en un espacio tridimensional. Considerando lo anterior, por favor represente con “Salario” como variable dependiente y “Salini” (salario inicial) y “Expprev” (experiencia previa) como variables independientes, el diagrama de dispersión aproximado (intuido) correspondiente (no utilice SPSS). ¿Se puede sacar algún supuesto de la representación obtenida? ECUACIÓN DE REGRESIÓN Salario Actual= 1872,85 + 1,91 * Salario Inicial LA BONDAD DE AJUSTE ES DE 79,5%
  • 10. Análisis de regresión lineal múltiple. Desarrollo de diagramas de dispersión. GRÁFICO DE DISPERSIÓN
  • 11. Análisis de región lineal simple. Ecuación de regresión. d.Lleve a cabo un análisis de regresión múltiple con Regresión lineal del menú Analizar, seleccionando la variable “Salario” (dependiente) y las variables “Salini, Expprev y Educ” como independientes. Determine el “Resumen del modelo” y la ecuación de regresión correspondiente. Considerando que el resumen del ANOVA ofrece el nivel crítico (Sig.; si es <0,05 indicará la existencia de relación lineal significativa), ¿sabría indicar si el hiperplano definido por la ecuación de regresión ofrece un buen ajuste a la nube de puntos?, ¿y si las tres variables utilizadas contribuyen de forma significativa al ajuste del modelo? (Tabla de coeficientes de regresión parcial). LA PROYECCIÓN TIENE UN ALTO NIVEL DE EXACTITUD DEL 80,3% EL RESULTADO DE LA SIGNIFICANCIA INDICA QUE LA REGRESIÓN SI ES APROPIADA PARA REALIZAR UN PRONÓSTICO ECUACIÓN SALARIO ACTUAL= 3881 + 1,74 * SALARIO INICIAL - 16,417 * EXPERIENCIA PREVIA + 757,270 * NIVEL EDUCATIVO
  • 12. DISTRIBUCIÓN NORMAL Por favor calcule e interprete los procedimientos correspondientes en el análisis de los datos que se indican. Utilice los apuntes de la asignatura, el material de la plataforma Moodle o lo que usted considere necesario. Preste especial atención a responder lo que se solicita en las partes sin completar o texto subrayado. Los modelos factoriales de análisis de varianza (factorial=más de un factor) sirven para evaluar el efecto individual y conjunto de dos o más factores (variables independientes categóricas) sobre una variable dependiente cuantitativa. En un modelo de dos factores, los efectos de interés son tres: los dos efectos principales (uno por cada factor) y el efecto de la interacción entre ambos factores. El procedimiento “univariante” incluye todos estos modelos factoriales de ANOVA. Pero, además, ofrece la posibilidad de trabajar tanto con factores de efectos fijos como con factores de efectos aleatorios. También permite llevar a cabo análisis de covarianza y de regresión, y utilizar modelos aleatorizados en bloques y modelos jerárquicos o con factores anidados. En un análisis de varianza factorial existe una hipótesis nula por cada factor y por cada posible combinación de factores. La hipótesis nula referida a un factor afirma que las medias de las poblaciones definidas por los niveles del factor son iguales. La hipótesis referida al efecto de una interacción afirma que tal efecto es nulo. Para contrastar esta hipótesis, el ANOVA factorial se sirve de estadísticos F. Así pues, para cada efecto existe una hipótesis y para cada hipótesis un estadístico F que permite contrastarla. El nivel crítico asociado a cada estadístico F es el que permite decidir si se puede mantener o se debe rechazar una hipótesis. En un ANOVA factorial se trabaja con tantas poblaciones como casillas resultan de la combinación de todos los niveles de los factores involucrados.
  • 13. Análisis de varianza. a. Por favor lleve a cabo un análisis de varianza de más de un factor. Seleccione la opción “Modelo lineal general, univariante” del menú “Analizar”, utilizando el archivo de SPSS “Datos de empleados”. Para obtener un ANOVA factorial emplee las especificaciones que el procedimiento “univariante” tiene establecidas por defecto. Estudie si los grupos definidos por la variable catlab (categoría laboral), por un lado, y los grupos definidos por la variable minoría (clasificación étnica), por otro, difieren en la variable salario (salario actual). Para ello en el cuadro de diálogo “univariante” seleccione la variable salario y trasládela al cuadro dependiente. Seleccionar las variables catlab y minoría y trasládelas a la lista Factores fijos. El resumen del ANOVA muestra en la fila Modelo corregido el nivel crítico asociado al estadístico F (p= 0,000 < 0,05) indicando que el modelo explica una parte significativa de la variación observada en la variable dependiente (salario). El valor R2 indica que los tres efectos incluidos en el modelo (catlab, minoría y catlab*minoría) están explicando el 65,1% de la varianza de la variable dependiente salario. La fila intersección se refiere a la constante del modelo. Las dos filas siguientes recogen los efectos principales. Los niveles críticos (Sig.) indican que, mientras los grupos definidos por la variable catlab poseen salarios medios significativamente diferentes (Sig.= 0,000 < 0,05), los salarios medios de los grupos definidos por la variable minoría no difieren (Sig. = 0,127 > 0,05). La siguiente fila contiene información sobre el efecto de la interacción catlab*minoría. El estadístico F correspondiente a este efecto tiene asociado un nivel crítico de 3,9%, lo que indica que el efecto de la interacción es significativo. Solo con este dato, ya se puede anticipar que las diferencias salariales que se dan entre las distintas categorías laborales no son las mismas en los dos grupos étnicos considerados. La fila error ofrece información referida a la fuente de variación error o residual. b. Si alguno de los estadísticos F asociados a los efectos principales resulta significativo, puede interesar efectuar compasiones post hoc. Los estadísticos F del ANOVA solo permiten contrastar la hipótesis general de que los promedios comparados son iguales. Al rechazar esa hipótesis se sabe que existen diferencias, pero no se sabe dónde están. Para averiguar qué media en concreto difiere de qué otra es necesario utilizar un tipo particular de contrastes denominados comparaciones múltiples post hoc o comparaciones a posteriori. Estas comparaciones permiten controlar la tasa de error al efectuar varias comparaciones utilizando las mismas medias, es decir, permiten controlar la probabilidad de cometer errores tipo I al tomar varias decisiones.
  • 14. Pulse el botón Post hoc del cuadro de diálogo Univariante para acceder al subcuadro de diálogo Univariante: Comparaciones múltiples post hoc. Aunque no todos los métodos disponibles se basan en la misma lógica, todos ellos se obtienen e interpretan de la misma forma; de modo que basta con marcar uno o dos para estudiar los resultados que genera. En el cuadro de diálogo Univariante, trasladar la variable salario al cuadro Dependiente y las variables catlab y minoría a la lista Factores fijos. Seleccionar la variable catlab en la lista Factores y trasladarla a la lista Contrastes post hoc para. Marcar la opción Tukey del recuadro Asumiendo varianzas iguales y la opción Games- Howell del recuadro No asumiendo varianzas iguales. En el cuadro comparaciones múltiples post hoc se puede observar el resultado obtenido con los dos métodos solicitados y que las conclusiones a las que se llega con ambos procedimientos son idénticas.
  • 15. La tabla Subgrupos homogéneos (basado en el método Tukey) ofrece un resumen en el que los grupos cuyas medias no difieren entre sí están agrupados en el mismo subconjunto. ¿Cuántos subconjuntos existen? Existen dos ¿podría interpretarlos según su significación?. Señalar que la clasificación en subgrupos homogéneos no está disponible con todas las pruebas post hoc, sino solo con algunas; y a pesar de que no es posible asumir varianzas poblacionales iguales la clasificación en subgrupos homogéneos se ha realizado utilizando el método de Tukey en lugar del de GamesHowell. Comparaciones múltiples post hoc o comparaciones a posterior c. Las comparaciones múltiples post hoc suelen proporcionar toda la información necesaria para poder interpretar correctamente un efecto principal significativo. Pero no ocurre lo mismo con los efectos de las interacciones. La interpretación correcta de una interacción suele requerir la ayuda de un gráfico de líneas, también llamado gráfico de perfil. En un gráfico de perfil sobre la interacción entre dos factores, en el eje de ordenadas se representa la escala de las medias de la variable dependiente; en el eje de abscisas se representan los niveles del primer factor; y las líneas del gráfico representan los niveles del segundo factor. Por favor obtenga un gráfico de perfil para el efecto de la interacción entre dos factores: catlab y minoría. En el cuadro de diálogo Univariante, trasladar la variable salario al cuadro Dependiente y las variables catlab y minoría a la lista Factores fijos. Trasladar la variable catlab al cuadro Eje horizontal y la variable minoría al cuadro Líneas distintas. Interacciones. Gráfico de perfil.
  • 16. Un servidor se atrevería a decir que una rápida inspección de las líneas aclararía el significado de esta interacción: en principio, tanto en el grupo de blancos (minoría=no) como en el de no blancos (minoría=sí), el salario medio parece mayor en los agentes de seguridad que en los administrativos, y mayor todavía en los directivos que en los agentes de seguridad; sin embargo, mientras en los grupos de administrativos y de agentes de seguridad no parecen existir diferencias entre los dos grupos de clasificación étnica, en el grupo directivos las diferencias entre los dos grupos de clasificación étnica parecen evidentes. Por tanto, las diferencias en salario entre los dos grupos de clasificación étnica parecen no ser la misma a lo largo de todas las categorías laborales.