1. AUTORES
Msc. JORGE ACOSTA PISCOYA. Licenciado En Estadística
Msc. DEBORA MEJIA PACHECO. Licenciado En Estadística
DOCENTES ASCRITOS AL DEPARTAMENTO DE ESTADISTICA
DE LA UNPRG – LAMBAYEQUE
2010
ACARGO DE LA ASIGNATURA DE:
ESTADÍSTICA
2. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
2
BASE DE DATOS
N°
SEXO ESC.PROF
MARCA DE
CELULAR
EDAD TALLA PESO
INGR
MENSUAL
EGR.
MENSUAL
N° DE
HIJOS
1 F MATEMAT LG 40 1,52 58 450 420 5
2 M COMPUT NOKIA 25 1,75 59 630 600 3
3 F ELECTRON NOKIA 38 1,55 59 500 500 2
4 M ESTADÍSTI SONY 28 1,69 68 750 720 1
5 F FISICA LG 31 1,56 60 750 720 5
6 F FISICA NOKIA 30 1,61 57 600 580 4
7 F MATEMAT MOTOROLA 24 1,52 56 650 600 4
8 M COMPUT MOTOROLA 32 1,72 67 800 750 7
9 M ESTADISTI LG 34 1,75 70 1000 850 3
10 M FISICA NOKIA 36 1,82 69 850 800 2
11 M MATEMAT SANSUNG 40 1,69 72 750 750 1
12 F COMPUT ALCATEL 28 1,56 60 750 700 2
13 M ELECTRON SANSUNG 35 1,68 70 950 750 4
14 M ESTADÍSTI LG 36 1,80 68 1000 800 5
15 F FISICA NOKIA 30 1,62 72 600 600 3
16 M FISICA MOTOROLA 48 1,78 55 1200 1000 4
17 F MATEMAT LG 40 1,58 54 850 800 6
18 F COMPUT NOKIA 32 1,54 67 700 680 3
19 M ESTADISTI NOKIA 35 1,75 69 950 920 3
20 M FISICA SONY 36 1,71 52 1250 1050 2
21 F MATEMAT LG 42 1,57 54 550 540 1
22 F COMPUT NOKIA 48 1,58 69 700 700 2
23 M ELECTRON MOTOROLA 39 1,69 68 850 830 3
24 M ESTADÍSTI MOTOROLA 40 1,73 73 950 900 3
25 M FISICA LG 38 1,77 75 850 800 2
26 M FISICA NOKIA 32 1,54 45 1250 1000 2
27 F MATEMAT SANSUNG 34 1,65 66 800 600 4
28 M COMPUT ALCATEL 32 1,64 56 785 700 5
29 M ESTADISTI SANSUNG 45 1,68 66 828 800 5
30 M FISICA LG 44 1,65 54 560 500 4
31 M MATEMAT NOKIA 32 1,67 58 1220 1200 6
32 F COMPUT NOKIA 42 1,68 75 1380 1000 5
33 M ELECTRON SONY 38 1,72 72 490 450 2
34 F ESTADÍSTI LG 36 1,78 78 660 600 3
35 F FISICA NOKIA 44 1,85 79 920 800 4
36 F FISICA MOTOROLA 58 1,66 45 660 600 1
37 F MATEMAT MOTOROLA 55 1,78 65 890 800 2
38 F COMPUT LG 48 1,45 48 1200 1000 3
39 M ESTADISTI NOKIA 36 1,66 46 1300 1000 3
40 M FISICA SANSUNG 28 1,69 48 1325 1200 2
41 F MATEMAT ALCATEL 31 1,56 60 750 720 5
42 F COMPUT SANSUNG 30 1,61 57 600 580 4
43 F ELECTRON LG 24 1,52 56 650 600 4
44 M ESTADÍSTI NOKIA 32 1,72 67 800 750 7
45 M FISICA MOTOROLA 34 1,75 70 1000 850 3
46 M FISICA LG 36 1,82 69 850 800 2
47 M MATEMAT NOKIA 40 1,69 72 750 750 1
48 F COMPUT NOKIA 28 1,56 60 750 700 2
49 M ESTADISTI SONY 35 1,68 70 950 750 4
50 M FISICA LG 36 1,80 68 1000 800 5
3. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
3
Primero creamos la base de datos que se presenta en spss ver.17
Cada columna contendrá una variable y cada fila los datos de cada unidad de análisis
observada la hoja de cálculo del spss, presenta dos ventanas.
La primera corresponde a la de vista de variables, es donde se declaran todas las variables
que se van ingresar en la base de datos, como se muestra :
4. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
4
Si estamos ingresando una variable cualitativa, podemos etiquetar las categorías de la
variable, como se muestra
Para recodificar una variable, se selecciona transformar y hacemos clic en recodificar en
distinta variable, aparece la siguiente pantalla:
Para nuestro caso hemos seleccionada la variable ESC.PROF y le vamos a cambiar por
CARRERA, y le damos clic en cambiar, luego le damos clic en valores antiguos y nuevos, y
aparece la siguiente pantalla:
5. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
5
Podemos los valores antiguos y valores nuevos como se muestra, luego le hacemos clic en
continuar y luego clic en aceptar
Por defecto aparece en la última columna la variable recodificada, para comparar si coincide
los valores antiguos con los nuevos, con el botón izquierdo del mouse arrastramos la variable
CARRERA, para ponerla a lado de la variable ESC.PROF
6. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
6
Luego procedemos a etiquetar
La Segunda ventana es una de vista de datos donde se ingresa cada uno de los valores de la
variable en estudio
7. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
7
Con la base de datos concluida se procede hacer el análisis descriptivo, seleccionamos el
menú analizar, seleccionamos Estadísticos Descriptivos y seleccionamos la opción
frecuencias
8. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
8
Aparece la siguiente ventana:
Seleccionamos la variable que queremos trabajar, por ejemplo ESC.PROF, como se trata de
una variable cualitativa en escala nominal, no podemos seleccionar la opción Estadísticos,
pero si la opción Gráficos:
Clic en continuar y luego clic en aceptar y aparece los resultados:
La primera tabla nos esta indicando que son 50 datos que se tienen y no hay ningún valor
perdido, esto se presenta cuando por error dejamos de ingresar algún valor o la persona
encuestada no lleno toda la información que se le pidió en la encuesta.
9. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
9
Estadísticos
ESC.PROF
N Válidos 50
Perdidos 1
La segunda tabla nos muestra la tabla de distribución de frecuencias, la cual puede ser
editada para darle una mejor presentación
ESC.PROF
Frecuencia Porcentaje Porcentaje válido
Porcentaje
acumulado
Válidos MATEMATICA 10 19,6 20,0 20,0
COMPUTACION 10 19,6 20,0 40,0
ELECTRONICA 5 9,8 10,0 50,0
ESTADÍSTICA 10 19,6 20,0 70,0
FISICA 15 29,4 30,0 100,0
Total 50 98,0 100,0
Perdidos Sistema 1 2,0
Total 51 100,0
El gráfico que hemos seleccionado es el gráfico de sectores que puede ser editada para darle
una mejor presentación
10. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
10
Seleccionamos el menú analizar y luego clic en frecuencias para trabajar una variable
cuantitativa, por defecto aparece
Clic en restablecer y seleccionamos una variable cuantitativa, por ejemplo la variable talla:
Esta variable si nos permite trabajar la opción estadísticos, seleccionamos todos los
estadígrafos que deseamos calcular:
11. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
11
Seleccionamos continuar y luego clic en aceptar y aparece todas las medidas descriptivas
pedidas:
Estadísticos
TALLA
N Válidos 50
Perdidos 1
Media 1,6670
Mediana 1,6800
Moda 1,69
Desv. típ. ,09562
Varianza ,009
Asimetría -,159
Error típ. de asimetría ,337
Curtosis -,776
Error típ. de curtosis ,662
Rango ,40
Mínimo 1,45
Máximo 1,85
Suma 83,35
Percentiles 10 1,5400
20 1,5600
25 1,5775
30 1,6100
40 1,6540
50 1,6800
60 1,6900
70 1,7200
75 1,7500
80 1,7500
82 1,7664
90 1,7980
13. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
13
Clic en continuar y luego clic en aceptar:
Como podemos observar la información que nos presenta la tabla de distribución de
frecuencia no están agrupados en intervalos, si queremos agrupar en intervalos tenemos
que hacer una recodificación
14. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
14
Seleccionamos la variable TALLA y le vamos a llamar ESTATURA, y luego clic en cambiar
clic en valores antiguos y nuevos, seleccionamos la opción rangos dado que se trata de una
variable cuantitativa y hacemos los cambios respectivos
15. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
15
Como se puede apreciar lo hemos agrupado en 7 intervalos, si utilizamos la regla de Sturges
para determinar el número de intervalos nos da 6.61, dado a que el número de intervalos es una
variable discreta procedemos a redondearlo a 7.
Clic en continuar y luego clic en aceptar
16. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
16
Luego editamos la variable Estatura, nos vamos a la ventana vista de variables y
seleccionamos etiquetas enla variable estatura:
Clic en aceptar y nos vamos a la vista de datos:
Seleccionamos analizar y luego clic en frecuencias, seleccionamos la variable estatura y le
pedimos que nos construya la tabla de distribución de frecuencias
17. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
17
ESTATURA
Frecuencia Porcentaje Porcentaje válido
Porcentaje
acumulado
Válidos 1,44 - 1,49 1 2,0 2,0 2,0
1,50 - 1,55 6 12,0 12,0 14,0
1,56 - 1,61 9 18,0 18,0 32,0
1,62 -1,67 7 14,0 14,0 46,0
1,68 - 1,73 14 28,0 28,0 74,0
1,74 - 179 8 16,0 16,0 90,0
1,80 - 1,85 5 10,0 10,0 100,0
Total 50 100,0 100,0
Para este caso no pidamos las medidas descriptivas por que el software les va calcular pero de
los códigos de la etiqueta, esto solo nos permite darle una mejor presentación de la tabla, mas
no puede ser utilizado para hacer cálculos.
Seleccionamos Analizar, estadísticos descriptivos, clic en Descriptivo y aparece la siguiente
pantalla.
Seleccionamos una variable que sea cuantitativa, clic en opciones y aparece la siguiente
ventana:
18. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
18
Donde seleccionamos las estadísticas descriptivas que deseemos calcular y luego clic en
continuar en la pantalla de resultado se visualiza:
Estadísticos descriptivos
N Rango Mínimo Máximo Media Desv. típ. Varianza Asimetría Curtosis
Estadí
stico
Estadíst
ico
Estadís
tico
Estadíst
ico
Estadíst
ico
Error
típico
Estadísti
co
Estadísti
co
Estadí
stico
Error
típico
Estadísti
co
Error
típico
PESO 50 34 45 79 63,02 1,254 8,870 78,673 -,357 ,337 -,740 ,662
N válido
(según lista)
50
Seleccionamos Analizar, estadísticos descriptivos, clic en Explore y aparece la siguiente
pantalla.
Seleccionamos la variable que deseemos analizar, en este caso en la Lista de dependiente
hemos seleccionado la variable ingreso y en la lista de factores Genero, en la opción visualizar
si seleccionamos ambos nos da las Estadísticas descriptivas y gráficos, si solo queremos una
sola opción seleccionamos la que se dese analizar y luego clic en aceptar.
La primera pantalla que nos presenta l avista de resultados es el resumen:
Resumen del procesamiento de los casos
GENERO
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
INBRESO FEMENINO 22 100,0% 0 ,0% 22 100,0%
MASCULINO 28 100,0% 0 ,0% 28 100,0%
19. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
19
La segunda Pantalla es las estadísticas Descriptivas.
Descriptivos
GENERO Estadístico Error típ.
INBRESO FEMENINO Media 743,64 45,601
Intervalo de confianza para la
media al 95%
Límite inferior 648,80
Límite superior 838,47
Media recortada al 5% 725,25
Mediana 700,00
Varianza 45748,052
Desv. típ. 213,888
Mínimo 450
Máximo 1380
Rango 930
Amplitud intercuartil 213
Asimetría 1,627 ,491
Curtosis 3,270 ,953
MASCULINO Media 924,57 41,206
Intervalo de confianza para la
media al 95%
Límite inferior 840,02
Límite superior 1009,12
Media recortada al 5% 925,75
Mediana 900,00
Varianza 47541,810
Desv. típ. 218,041
Mínimo 490
Máximo 1325
Rango 835
Amplitud intercuartil 211
Asimetría ,205 ,441
Curtosis -,371 ,858
20. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
20
Luego nos presenta el grafico de tallos y hoja
INBRESO Stem-and-Leaf Plot for
GENERO= FEMENINO
Frequency Stem & Leaf
1,00 4 . 5
2,00 5 . 05
7,00 6 . 0005566
6,00 7 . 005555
3,00 8 . 059
1,00 9 . 2
2,00 Extremes (>=1200)
Stem width: 100
Each leaf: 1 case(s)
Luego tenemos el diagrama de cajas:
Si seleccionamos analizar, Estadísticos Descriptivos y selecionamos una variable en la lista
de dependiente:
21. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
21
Clic en aceptar y aparece un resumen de los datos procesados:
Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
INBRESO 50 100,0% 0 ,0% 50 100,0%
Descriptivos
Estadístico Error típ.
INBRESO Media 844,96 32,874
Intervalo de confianza para la
media al 95%
Límite inferior 778,90
Límite superior 911,02
Media recortada al 5% 837,84
Mediana 800,00
Varianza 54033,958
Desv. típ. 232,452
Mínimo 450
Máximo 1380
Rango 930
Amplitud intercuartil 303
Asimetría ,614 ,337
Curtosis -,235 ,662
23. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
23
Para construir tablas de contingencia seleccionamos: Analizar, Estadísticas Descriptivas y
tablas de contingencia
Si seleccionamos la opción Estadísticos, seleccionamos la opción chi-cuadrado:
24. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
24
Clic en continuar, luego seleccionamos la opción casillas, que nos permite seleccionar el
valor observado, el porcentaje total
clic en continuar y clic en aceptar :
Tabla de contingencia MARCA DE CELULAR * GENERO
GENERO
TotalFEMENINO MASCULINO
MARCA DE CELULAR ALCATEL Recuento 2 1 3
% del total 4,0% 2,0% 6,0%
LG Recuento 7 6 13
% del total 14,0% 12,0% 26,0%
MOTOROLA Recuento 3 5 8
% del total 6,0% 10,0% 16,0%
NOKIA Recuento 8 8 16
% del total 16,0% 16,0% 32,0%
SANSUNG Recuento 2 4 6
% del total 4,0% 8,0% 12,0%
SONY Recuento 0 4 4
% del total ,0% 8,0% 8,0%
Total Recuento 22 28 50
% del total 44,0% 56,0% 100,0%
25. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
25
Pruebas de chi-cuadrado
Valor gl
Sig. asintótica
(bilateral)
Chi-cuadrado de Pearson 4,928
a
5 ,425
Razón de verosimilitudes 6,425 5 ,267
N de casos válidos 50
a. 8 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es 1,32.
Esto nos indica que con las variables seleccionadas no podemos realizar la prueba chi
cuadrado dado a que se tiene que tener un 75% de frecuencias esperadas mayores o
iguales a 5.
Si queremos trabajar solo los estudiantes que siguen la carreta profesional de Estadística,
seleccionamos en el menú Datos:
Clic en selección de casos y aparece la siguiente pantalla:
26. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
26
Seleccionamos la variable Esc.Prof, si no nos acordamos con que valor hemos etiquetada la
carrera profesional de estadística: hacemos clic con el botón derecho del mouse
27. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
27
Hacemos clic en información de la variable y aparece la siguiente pantalla que nos permite
identificar la etiqueta de valor de la variable:
Seleccionamos la opción 4
Clic en aceptar y luego aparece la siguiente pantalla donde se selecciona la variable
ESC.PROF, y realizamos una operación lógica como se muestra:
28. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
28
Clic en aceptar y se seleciona la categoría seleccionada como se muestra :
Luego realizamos el análisis estadístico:
Los resultados de las variables seleccionadas nos indican :
29. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
29
Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ. Varianza
TALLA 10 1,66 1,80 1,7240 ,04648 ,002
EDAD 10 28 45 35,70 4,498 20,233
N válido (según lista) 10
Solo 10 estudiantes encuestados pertenecen a la Escuela Profesional de Estadística, los
cuales tienen una estatura mínima de 1,66 mt. Y una estatura máxima de 1,80; siendo su
estatura promedio de 1,72 mt. Los cuales se dispersan en 0,04648 mt. Con respecto a la
estatura promedio.
Luego para dejarla base de datos a su estado original seleccionamos el menú datos, clic en
seleccionar casos y luego clic en restablecer.
Para hacer un aálisis de Regresión Lineal, nos vamos al menú análisis, seleccionamos la
opción regresión Lineal como se muestra:
Seleccionamos la variable dependiente y la variable independiente como se muestra:
30. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
30
Seleccionamos la opción Estadístico;
Clic en continuar y aceptar, luego aparece el siguiente reporte en la vista de resultados:
31. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
31
Variables introducidas/eliminadas
b
Modelo
Variables
introducidas
Variables
eliminadas Método
1 INBRESO
a
. Introducir
a. Todas las variables solicitadas introducidas.
b. Variable dependiente: EGRESO
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
1 ,945
a
,893 ,891 57,828
a. Variables predictoras: (Constante), INBRESO
El cual nos da un coeficiente de correlación de 0.945 es decir existe una alta correlación entre
el ingreso y egreso de los encuestados, el coeficiente de determación es 0.891, el cual nos
indica que el 89.1% de los egresos están explicados por los ingresos que tiene las personas
encuestadas.
Coeficientes
a
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados
t Sig.B Error típ. Beta
1 (Constante) 156,005 31,123 5,013 ,000
INBRESO ,713 ,036 ,945 20,054 ,000
a. Variable dependiente: EGRESO
El modelo de Regresión Lineal que sale es:
iXY 713,0005,156ˆ
Para construir el diagrama de dispersión, nos vamos al menú gráficos, seleccionamos cuadro
de diálogos antiguos, dispersión de Puntos:
32. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
32
Seleccionamos dispersión simple, clic en definir, sale la siguiente ventana donde ingresamos
la variable Y y la variable X, como se muestra:
Para ponerle titulo seleccionamos la opción y ponemos el titulo que corresponde:
33. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
33
Clic en continuar y clic en aceptar y en la vista de resultados aparece el grafico pedido
Otra forma de construir el diagrama de dispersión con la recta estimada se, selecciona el
menú analizar, regresión y estimación curvilínea:
34. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
34
Aparece la siguiente ventana donde hay que ingresar las variables correspondientes, como se
muestra:
Clic en aceptar y en la ventana de resultados se visualiza, una tabla de Resumen y el
diagrama de dispersión con la recta estimada:
35. Autor: Jorge Acosta Piscoya & Débora Mejía Pacheco
35
Resumen del modelo y estimaciones de los parámetros
Variable dependiente:EGRESO
Ecuación
Resumen del modelo Estimaciones de los parámetros
R cuadrado F gl1 gl2 Sig. Constante b1
Lineal ,893 402,155 1 48 ,000 156,005 ,713
La variable independiente esINBRESO.