3. Objetivos
Que deberían saber al terminar esta clase:
o Que es la Estadística.
o Que entendemos por estadística descriptiva e inferencial.
o Que es una población y que una muestra.
o Que es una variable, el dato y los datos.
3
4. Estadística es la ciencia de:
0 Recolectar
0 Describir
0 Organizar Datos
0 Interpretar
para transformarlos en información, para la toma mas
eficiente de decisiones.
4
5. La Estadística es la ciencia cuyo objetivo es reunir una
información cuantitativa concerniente a
individuos, grupos, series de hechos, etc. y deducir de
ello gracias al análisis de estos datos unos significados
precisos o unas previsiones para el futuro.
La estadística, en general, es la ciencia que trata de la
recopilación, organización presentación, análisis e
interpretación de datos numéricos con el fin de
realizar una toma de decisión más efectiva.
5
6. 0 La Ciencia se ocupa en general de fenómenos observables.
0 La Ciencia se desarrolla observando hechos, formulando leyes
que los explican y realizando experimentos para validar o
rechazar dichas leyes.
0 Los modelos que crea la ciencia son de tipo determinista o
aleatorio (estocástico).
0 La Estadística se utiliza como tecnología al servicio de las
ciencias donde la variabilidad y la incertidumbre forman parte
de su naturaleza.
6
7. 0 Organismos oficiales.
0 Diarios y revistas.
0 Políticos.
0 Deportes.
0 Marketing.
0 Control de calidad.
0 Administradores.
0 Investigadores científicos.
0 Médicos
0 etc.
7
8. Estadística
Estadística Estadística
Descriptiva Inferencial
Describe un conjunto de Obtiene información
datos con indicadores (variables e indicadores)
estadísticos o de una muestra
estadígrafos. representativa
de población.
8
9.
10. 0 ESTADÍSTICA DESCRIPTIVA: Método de
recolectar, organizar, resumir, analizar e interpretar los datos.
Ejemplo 1: Los datos del Censo de población.
Ejemplo 3: La cantidad de pacientes atendidos en el IMSS en
el último año.
Mencionamos algunos procedimientos:
Tablas de distribuciones de frecuencia.
Gráficos de distribución de frecuencias.
Diagramas de cajas.
Diagramas de tallos y hojas.
Estadísticos de posición.
Estadísticos de dispersión.
Estadísticos de asociación.
10
11.
12. ESTADÍSTICA INFERENCIAL: Métodos usados para determinar algo
acerca de la población, basado en una muestra.
0 Población(1) es la colección, o conjunto, de individuos, objetos o
eventos cuyas propiedades serán analizadas.
0 Muestra es un subconjunto de la población de interés.
0 (1) Algunos autores utilizan Universo como sinónimo
La estadística inferencial comprende dos áreas importantes:
Estimación puntual y por intervalos.
Prueba de hipótesis estadística
12
13.
14. 0 Unidad de Análisis:
Es el objeto del cual se desea obtener información. Muchas veces nos
referimos a las unidades de análisis con el nombre de elementos. En
estadística, un elemento o unidad de análisis puede ser algo con existencia
real, como un automóvil o una casa, o algo más abstracto como la temperatura
o un intervalo de tiempo. Dada esta definición, puede redefinirse población
como el conjunto de unidades de análisis.
0 Ejemplo: Cada uno de los alumnos matriculados en el curso de
Estadística I.
14
15. 0 Parámetro: Valor numérico que resume todos los datos de una población
completa. Se utilizan letras griegas para simbolizar un
parámetro como ser y .
0 Ejemplos: La calificación “promedio” del secundario en el momento de
admisión de todos los estudiantes que han asistido alguna vez a la
Universidad de Lujan o la “proporción” de estudiantes cuyo lugar de
origen era distinto del partido de Lujan.
Se
0 Estadística: Valor numérico que resume los datos de una muestra.
utilizan letras del alfabeto español para simbolizarlas como
ser x y s .
0 Ejemplo: La edad “promedio” registrada en una encuesta de 150
consumidores de choripanes.
15
17. Población: Es el conjunto de todos los individuos o elementos
(unidad de análisis) que son el objetivo de nuestro interés.
La Población, según su número de elementos puede ser:
Población Finita Población
Infinita
Ejemplo: Ejemplo:
- Alumnos de la Pece. - Peces del mar.
- Trabajadores de una empresa. - Bacterias.
- Camiones de carga pesada. - Flores Silvestres.
- Clientes de un empresa comercial. - Productos fallados.
NOTA: EN LA PRÁCTICA CUANDO UNA POBLACIÓN TIENE UN NUMERO MUY GRANDE O
INDETERMINADO DE ELEMENTOS SE LE CONSIDERA POBLACIÓN INFINITA. 17
18. Muestra: Es una parte o un subconjunto de una
población. Tiene la característica fundamental de
ser representativa de la población.
La selección y estudio de una muestra facilita la
inferencia de conclusiones válidas para la población
de donde se obtuvo la muestra.
Ejemplos:
– Grupo de bolsas de azúcar que se extraen
sistemáticamente de una línea de envasado.
– Grupo de tasas que se extrae para llevar a cabo el control
de calidad.
18
19. 0 Ejemplo 1: De acuerdo con una encuesta
desarrollada por Apoyo sobre telefonía residencial
en el 2007, el gasto mensual promedio por cliente es
de $ 500.00 a nivel nacional.
0 Ejemplo 2: El INEI informó que la Encuesta
Permanente de Hogares (EPH) del mes de mayo de
2008 reporto la tasa mas alta de desempleo que
ascendió al 24.3% a nivel nacional
19
20.
21. VARIABLES Y SUS TIPOS
La definición de una Población y sus
Características dependerán (Variables) de
sus unidades elementales que deben ser
observadas y dependiendo de la naturaleza
del problema planteado.
21
22. 0 Variable: Característica de interés sobre cada elemento
individual de una población o muestra.
0 Dato: Valor de la variable asociada a un elemento de la
población o muestra. Este valor puede ser un número, una
palabra o un símbolo.
0 Ejemplo: La familia González tiene “4” miembros, sus
ingresos mensuales son de “US$ 685.00”, “2” son de
sexo femenino y “2” masculino.
22
23. 1-7
0 Cualitativa o de Atributos Clasifica o describe un elemento de
la población. Los valores que puede asumir no constituyen un
espacio métrico, por lo tanto las operaciones
aritméticas, como sumar y obtener promedios, no son
significativas.
0 Ejemplos: Sexo, Nacionalidad, Marcas de auto, Grado
de Satisfacción con la Universidad, etc..
23
24. • Cuantitativa o Numérica Cuantifica un elemento de
la población. Los valores que puede asumir
constituyen un espacio métrico, por lo tanto las
operaciones aritméticas, como sumar y obtener
promedios, son significativas.
• Ejemplos: Cantidad de Habitaciones, Número de
hijos, Kilómetros recorridos, Tiempo de
vuelo, Ingreso, etc.
24
25. 1-9
0 Las variables cuantitativas se pueden clasificar a su vez en
discretas o continuas.
0 Cuantitativas Discretas: solo pueden asumir ciertos valores y
normalmente hay huecos entre ellos. Son conteos
normalmente.
0 Ejemplo1: cantidad de materias aprobadas.(1, 2,3 ......)
0 Ejemplo2: cantidad de hijos (1, 2, 3,4...)
25
26. 1-9
0 Las variables cuantitativas se pueden clasificar a su vez en
discretas o continuas.
0 Cuantitativas Continuas: puede asumir cualquier valor dentro
del rango de medición. Normalmente se miden magnitudes
como ser longitud, superficie, volumen, peso, tiempo, dinero
0 Ejemplo 1: Peso al nacer.
0 Ejemplo 2: Salario de un empleado
0 Ejemplo 3: Tiempo de viaje en ómnibus entre Lima e
Ica.
26
27. CENSO =>Estadística MUESTREO =>
Descriptiva Estadística Inferencial
• Se emplea cuando el número de • Se emplea cuando el número
unidades de análisis no es grande de unidades de análisis es
(n< 40 aproximadamente) grande pero no se necesita
• Si el número de unidades de información a detalle de áreas
análisis es grande y se necesita una geográficas menores.
amplia cobertura de información en
áreas menores, como distritos, Características
Comunidades nativas o CCPP. • Mayor rapidez y viabilidad
Rurales • Mayor exactitud en la obtención
de información
Características • Reduce los costos
• Costoso • No tiene cobertura en áreas
• Errores de Medición (de obtener la menores.
información 27
30. Tipos Característica Ejemplos
NOMINAL Valores que se agrupan en •Genero (sexo)
categorías disjuntas y •Color de pelo
exhaustivas. •Religión
ORDINAL Hay un orden entre las Clase social
categorías. Preferencias
Educación
DE •Hay orden •Temperatura
INTERVALO •Hay distancia •Coeficiente Intelectual
•Hay un cero convencional
•Hay orden •Edad
DE RAZON •Hay distancia •Producción
•Hay un cero natural •Ingresos
30
31. 1-12
• Las variables cualitativas se miden en escala
nominal o ordinal.
• Nominal: los elementos solo pueden ser
clasificados en categorías pero no se da un
orden o jerarquía.
• Ejemplo 1: Barrio de residencia de los alumnos .
• Ejemplo 2: Color de ojos
• Ejemplo 3: Simpatizante de un club de futbol
31
32. •Los valores de las Variables (datos) sólo se pueden
clasificar exhaustivamente en categorías mutuamente
.
excluyentes y no se pueden ordenar.
•Exhaustivo: Cada persona u objeto o artículo debe
clasificarse en al menos una categoría.
•Mutuamente Excluyente; Un individuo (objeto o
artículo) al ser incluido en una categoría debe excluirse
de las demás, o sea no debe ser incluido en otro nivel.
32
33. 1-12
• Las variables cualitativas se miden en escala
nominal o ordinal.
• Ordinal: los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores no se pueden
realizar o no son significativas.
• Ejemplo 1: Grado de satisfacción en el uso de un
servicio público .
• Ejemplo 2: Ocupación
33
34. • Los valores de las Variables (datos) se pueden
ordenar pero no es posible determinar la diferencia
aritmética (o distancias) entre ellos.
0 Ejemplo: Resultados del sabor de tres bebidas A, B, C
0 X = Sabor.
0 La bebida C clasifico 1 ( o 1º)
0 La bebida B clasifico 2 ( o 2º)
0 La bebida A clasifico 3 ( o 3º)
0 Valores de x : 1, 2, 3 o (1º) (2º) (3º)
34
35. • Las variables cuantitativas se miden en
escala de intervalo o razón.
• Intervalo: los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores se pueden realizar y
son significativas. La diferencia entre dos
valores consecutivos es de tamaño constante
y no existe el 0 absoluto.
• Ejemplo: Temperatura en grados Celsius
35
36. 0 Similar al nivel ordinal con la propiedad adicional de
que se pueden determinar cantidades significativas
(distancias iguales) de las diferencias entre los
valores. No existe un punto cero natural sino
Convencional.
• Temperatura en escala de Grados Celsius.
• Talla de camisas ( zapatos, ternos etc.)
36
37. • Las variables cuantitativas se miden en escala de
intervalo o razón.
• Razón: los elementos son clasificados en categorías
que tienen un orden o jerarquía, la diferencia entre
valores se pueden realizar y son significativas. Existe
el 0 absoluto, es decir la ausencia de la variable
medida.
• Ejemplo 1: Tiempo de vuelo.
• Ejemplo 2: Ingresos familiares
37
38. Es aquella con un punto cero inicialmente inherente. Las
diferencias y razones (cocientes) son significativas.
• Ejemplo:
a) Producción
b) Ingresos Mensuales Dinero.
c) Altura de los jugadores del equipo de fútbol de Osorno
38
39. Variable
Cuantitativa
Cualitativa o
o
Atributo
Numérica
Escala de Escala de Escala de Escala de
Medición Medición Medición Medición
Nominal Ordinal Discreta Continua
39
40. Variable Cuantitativa Variable Cualitativa
(Numérica) (No numérica )
Continua Discreta Ordinal Nominal
Se caracteriza por
Puede tomar Toma sólo Tienen No tienen
cualquier valor ciertos un orden un orden
en un intervalo valores. predeter- predeter-
dado. (procesos de minado: minado:
(Procesos de contar)
medición) Ejemplos -Nivel de Sexo,
Educación, ocupación,
Nº de trabajadores estrato Condición de
Ingreso, talla, por oficina, socioeconómico, empleo
nº de alumnos categoría de (nombrado o
peso etc. 40
por curso etc. ocupación. contratado)
41. Variable: corresponde a la característica de la Unidad de Análisis
TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Tipos de escala
Intervalo o Razón
Toma valores enteros Característica o cualidad
cuyas categorías no tienen
Ejemplos: Número de Hijos, Número de
un orden preestablecido.
empleados de una empresa, Número de
asignaturas aprobadas en un semestre, etc. Ejemplos: Sexo, Deporte
Favorito, etc.
Toma cualquier valor dentro de un intervalo
Característica o cualidad cuyas
Ejemplos: Peso (escala de Razón); Estatura (escala de categorías tienen un orden
Razón); Temperatura (Escala de Intervalo), etc. preestablecido.
Escala de Razón: Tiene un cero absoluto, el cambio de unidad de medida no Ejemplos: Calificación (S, N, A);
afecta la descripción de la variable. Escala Intervalo: Tiene un cero arbitrario y
al cambiar de unidad de medida cambia la descripción de la variable. Grado de Interés por un tema, etc.
41
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
42.
43. • No todos los temas disponen de datos publicados. En esos
casos , la información deberá recolectarse y analizarse. Esto
se llama “Fuente Primaria”.
• Una forma de recolectar datos es mediante las encuestas.
• Hay dos posibilidades:
0 a) Encuestas Muestrales ( En Muestras).
0 b) Encuestas Censales (En poblaciones).
43
44. • Los problemas que se estudian o se
investigan se adquieren de datos
empíricos ( de la realidad) publicados u
obtenidos.
• Se pueden encontrar datos (estadísticas)
relacionadas en artículos
publicados, tesis, revistas y periódicos.
Estos se llaman “Fuentes secundarias
44
45.
46. Ejemplo
Título y Subtítulo
mill US$ 420
Año Ventas
1 1997 120 350
2 1998 145 280
3 1999 165
4 2000 178 210
5 2001 201 140
6 2002 320
70
7 2003 350
8 2004 355 0
1996 1998 2000 2002 2004 2006
Nº valores del 0.60 x 8 Fuente: ……..
eje vertical = = 4.8 = 5
Primer valor del 355 = 71 = 70
eje vertical = 46
5
48. 1.a Gráficos Lineales Compuestos :
3000
2500 Renta Fija
Aciones
2000
1500
1000
500
0
8 o et ct ov c
Di e 9
5 b ar br
l 8 Ag S O N Fe M A
Ju En
48
Fuente : Bolsa de Valores de Lima.
49. 2. Gráficos de Barras Simple
PERU: POBLACIÓN SEGÚN NIVEL DE EDUCACIÓN : 1998
(Cifras Porcentuales)
%
40.00
35.00
30.00
25.00
20.00
15.00
10.00
5.00
-
Sin Nivel Inicial Secundaria Sup. No Sup. Especial
Univer. Univer.
49
Fuente : Instituto Nacional de Estadística e Informática - ENAHO 1998
50. 2a. Gráficos de Barras Compuesto
PERU: POBLACIÓN SEGÚN NIVEL DE EDUCACIÓN POR SEXO : 1998
(Porcentajes)
%
45.00
40.00
35.00
30.00
25.00
HOMBRE
20.00
MUJER
15.00
10.00
5.00
0.00
Sin Nivel Inicial Secundaria Sup. No Sup. Univer. Especial
Univer.
50
Fuente : Instituto Nacional de Estadística e Informática - ENAHO 1998
51. 2a. Gráficos de Barras Compuesto
PERU: POBLACIÓN SEGÚN NIVEL DE EDUCACIÓN POR SEXO : 1998
(Porcentajes)
%
120.00
100.00
80.00
MUJER
60.00
HOMBRE
40.00
20.00
-
ia
l
.
ial
l
er.
e
r
a
r
ive
iv
ici
da
c
iv
pe
nN
In
Un
Un
un
Es
c
Si
p.
Se
No
Su
p.
Su
51
Fuente : Instituto Nacional de Estadística e Informática - ENAHO 1998
53. 3. Gráfico Circular
29%
35%
36%
Lima Metrpolitana
Resto Urbano
Rural
53
Fuente : Instituto Nacional de Estadística e Informática - ENAHO 1998
54. 3. Gráfico Circular
VOLUMEN NEGOCIADO EN LA BOLSA DE VALORES DE
LIMA: DIC. 1999 (miles US$)
INSTRUMENTOS
DE DEUDA
39%
OPERACIONES
DE REPORTE
14%
RENTA VARIABLE
47%
Fuente: Bolsa de Valores de Lima 54
62. Gráfico: Pictograma
Mujeres en el Mundo: 1990-95
62
Fuente: Roberto Avila Acosta - Estadística Elememtal
63.
64. 1-9
0 Se denomina muestra al subconjunto de ese universo
y del cual se recopilarán los datos. Es necesario que
esa muestra sea debidamente representativa.
0 Por ejemplo, se quiere saber el número de hijos por
matrimonio de una ciudad. Para este propósito, se
elige una muestra representativa
de 50 matrimonios de ella. Se obtienen los
siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2, , 3 ,
0,5,1,4,3,2,4,1,5,2,1,2,4,0,3,3,2,6,1,5,4,2,
0,3,2,4,3,1.
0 El número total de datos se representa con la
letra n. En nuestro ejemplo n = 50.
64
65. 1-9
TABLA
0 La frecuencia absoluta es el xi fi
número de veces que 0 4
aparece un valor (x i) en 1 9
los datos obtenidos. 2 12
0 En nuestro ejemplo, la 3 10
frecuencia absoluta indica 4 8
el número de familias que 5 4
tienen esa cantidad de hijos: 6 2
7 1
65
69. 1-9
0La frecuencia absoluta acumulada indica
cuantos elementos de la lista de datos son
menores o iguales a un valor dado. Es la suma
de las frecuencias absolutas desde la primera
fila hasta la fila elegida.
0Por ejemplo, sabemos que hay 25
matrimonios de la muestra que tienen a lo
más 2 hijos: 69
70. 1-9
TABLA
xi fi Fi
0 4 4
1 9 13
2 12 25
3 10 35
4 8 43
5 4 47
6 2 49
7 1 50 70
73. 1-9
FRECUENCIA RELATIVA ( hi )
0 La frecuencia relativa es el cociente entre la frecuencia
absoluta (f i) y el número total de datos (n). En nuestro
ejemplo n = 50:
TABLA
xi fi Fi hi Hi
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
73
7 1 50 0,02 1,00
76. FRECUENCIA RELATIVA
1-9
ACUMULADA (Hi)
0 La frecuencia relativa acumulada es el cuociente entre la
frecuencia absoluta acumulada (F i) y el número total de
datos (n). En nuestro ejemplo, n = 50:
TABLA
xi fi Fi hi Hi
0 4 4 0,08 0,08
1 9 13 0,18 0,26
2 12 25 0,24 0,50
3 10 35 0,20 0,70
4 8 43 0,16 0,86
5 4 47 0,08 0,94
6 2 49 0,04 0,98
7 1 50 0,02 1,00 76
86. ORGANIZACION Y PRESENTACION
DE DATOS UNIDIMENSIONALES
a) Frecuencia Absoluta (fi)
Es el número de veces que se presenta un valor o
categoría de una variable. Se representa por fi.
f1 + f2 + f3 + …………….……fk = n
b) Frecuencia Absoluta Acumulada (Fi)
Es el número de datos igual o inferior (“menor o
igual que”) al valor considerado de la variable o la
suma de las frecuiencias absolutas menor o igual
que el valor considerado de la variable. Es decir:
F1 = f1
F2 = f1 + f2
-----------------------------
Fk = f1 + f2 + ……….+ fk 86
87. ORGANIZACION Y PRESENTACION
DE DATOS UNIDIMENSIONALES
c) Frecuencia Relativa (hi)
Es igual a la frecuencia absoluta sobre el numero de
observaciones.
h1 =f1/n
b) Frecuencia Relativa Acumulada (Hi)
Es el resultado de cada frecuencia absoluta
acumulada dividida entre el numero total de
observaciones.
H1 = F1/n
H2 = F2/n
-----------------------------
87
Hk = Fk/n
88. DISTRIBUCION DE FRECUENCIAS
1-9
PARA VARIABLES CUANTITATIVA
1.Identificar el tipo de variable cuantitativo discreto o
continuo.
2.Determinar el mayor (Xmax) y el menor (Xmin).
3.Calcular R donde R = Xmax – Xmin.
4.Si la variable es cuantitativa discreta
0 El rango es pequeño, entonces trabajar con los valores
originales ordenados de las variables.
0 Si el rango es grande entonces trabajar con los datos ordenados
agrupados en intervalo de clase (ver Sturges).
88
89. DISTRIBUCION DE FRECUENCIAS
1-9
PARA VARIABLES CUANTITATIVA
5.Si la variable es cuantitativa continua:
0 Determinar el numero de intervalos (entre 5 y 20).
0 Utilizar la regla de Sturge: m = 1 + 3,322log n
0 Si n = 50
0 m = 1 + 3,322log(50) = 6,6439
0 Se redondea a m = 7 intervalos de clase.
0 Intervalo cerrado por la izquierda y abierto por la derecha.
0 El menor del intervalo izquierdo =X`min =(Xmin) – menor
unidad/2.
0 Marca de clase= (xmax 1er intervalo - X`min )/2
89
90. Problemas
0 Si la variable es cuantitativa continua:
0 Determinar el numero de intervalos (entre 5 y 20).
0 Utilizar la regla de Sturge: m = 1 + 3,322log n
0 Si n = 50
0 m = 1 + 3,322log(50) = 6,6439
0 Se redondea a m = 7 intervalos de clase.
0 Intervalo cerrado por la izquierda y abierto por la derecha.
0 El menor del intervalo izquierdo =X`min =(Xmin) – menor
unidad/2.
0 Marca de clase= (xmax 1er intervalo - X`min )/2
90
91.
92. DIAGRAMA DE PUNTOS
(herramienta útil para pocos datos)
Ejemplo: Datos de resistencia a la
tensión de muestras de mortero
Portland (Kg/cm2) con polímero
agregado:
016.85 16.40 17.21 16.35 16.52
017.04 16.96 17.15 16.59 16.57
Mortero Portland sin modificar:
017.50 17.63 18.25 18.00 17.86
0 17.75 18.22 17.90 17.96 18.15
93. DIAGRAMA DE PUNTOS
(herramienta útil para pocos datos)
* * ** * * ** * * + + + + + ++ +
+ +
16.0 16.5 17.0 17.5 18.0 18.5
* = Mortero modificado
+ = Mortero sin modificar