2. Introducción
La Estadística es una ciencia
que facilita la solución de
problemas en los cuales
necesitamos conocer
características sobre el
comportamiento de algún
suceso o evento. Nos permite inferir el
comportamiento de sucesos
iguales o similares sin necesidad
de que estos ocurran.
3. Esto nos da la posibilidad de
tomar decisiones acertadas y a
tiempo, así como realizar
proyecciones del
comportamiento del suceso.
Sólo se realizan los cálculos y el
análisis con los datos obtenidos
de una muestra de la población
y no con toda la población.
4. Actualmente el INEGI es el encargado de
concentrar y publicar la información
estadística del estado y del país.
5. Conceptos básicos
Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
después obtener conclusiones. Se divide
en
Estadística Descriptiva y Estadística
Inferencial. Estadística descriptiva:
Se encarga de la
recolección, organización,
presentación y análisis de
los datos de una
población.
6. Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a
conocer, con determinado grado de
confianza, a la población. Lo que nos
permite tomar decisiones.
7. Población:
Conjunto definido de TODOS los
INDIVIDUOS, de donde se observa cierta
característica.
Al número de integrantes de la población se
llama tamaño de la población y se representa
con la letra N.
Las poblaciones pueden ser finitas o infinitas.
8. Población Estadística:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medición de una
variable en los elementos de una población.
Muestra:
Subconjunto de una población, que intenta
reflejar las características de la población lo
mejor posible.
El número de individuos que integran la
muestra, llamado tamaño de la muestra se
representa con la letra n.
9. Individuo:
Es el elemento de la población o de la
muestra que aporta información sobre lo que
se estudia. Variable:
Característica o propiedad de los individuos
que se desea estudiar y se puede medir o
calificar; cambia o varía con el tiempo en un
individuo dado, o cambia o varía de elemento
a elemento.
Ej. Edad, peso, sexo, estado civil, número de
10. Dato:
Valor que se obtiene al realizar la medición de
la característica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
11. Datos Cuantitativos
(números):
Valores obtenidos al medir
peso, estatura, temperatura,
número de hijos.
Datos Cualitativos
(categorías):
Se obtienen al calificar la
característica en cuestión
como el sexo, estado civil,
grado máximo de estudios.
12. Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1,
hombre – mujer, bueno – malo, encendido –
apagado).
En la variable CUANTITATIVA se pueden
distinguir dos tipos: continua y discreta.
13. Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un
individuo.
14. Escalas de Medición
Escala
Nominal
Escala
Ordinal
Escala de
Intervalo
Escala de
Razón
15. Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritméticas entre sus
valores, pues éstos son únicamente
ETIQUETAS.
Ejemplo: sexo, código postal, estado civil,
número telefónico, número al correr en un
maratón, deporte favorito, carrera a estudiar,
etc.
16. Escala Ordinal:
Los valores de la variable que tienen un
ORDEN con un nivel específico, pero no se
pueden hacer operaciones aritméticas entre
ellas.
Ejemplo:
Pésimo – Malo – Regular – Bueno –
Excelente
Primaria – Secundaria – Preparatoria -
17. Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y además una NOCIÓN DE
DISTANCIA aunque no se puedan realizar
operaciones.
El cero o punto de inicio no es único, es más
bien un punto de referencia.
Ejemplo: Escalas de temperatura, la edad de
la Tierra, la línea del tiempo de la humanidad.
18. Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el
cero absoluto, existe orden, se puede
determinar cuántas veces es mayor uno que
otro.
Ejemplo: peso, estatura, edad, distancia,
dinero, etc.
19. Fuentes de información
Encuesta:
Recopilar los datos mediante el
uso de cuestionarios o
entrevistas.
Experimento:
Procedimiento utilizado en la
investigación científica para
obtener información que permita
conocer el comportamiento de
algún proceso.
20. Fuentes de Información
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
21. Redondeo de datos, notación
científica y cifras significativas.
Redondeo:
El redondeo de datos es un
procedimiento que consiste en
escribir un número que representa a
una cantidad con menos cifras de las
que tiene realmente para tener una
idea rápida de la cantidad.
22. Notación Científica
Es una manera de escribir en forma breve
cifras muy grandes o pequeñas. La forma
general es
a x 10 , en donde “a” es un número entre 1 y
9, “n” es un número entero.
Ejemplo:
El número 25 000 se escribe 2.5 x 10 , o el
número 0.00025 se escribe como 2.5 x 10 .
n
4
- 4
23. Cifras Significativas
A los dígitos exactos que se utilizan para
escribir una cifra, a parte de los ceros para
localizar el punto decimal, se les llama cifras
significativas.
Ejemplos:
3.22 tiene 3 cifras significativas.
0.0032 = 3.2 x 10 tiene 2 cifras significativas.
0.00320 = 3.20 x 10 tiene 3 cifras significativas.
- 3
- 3
24. La cifra 3.22 se encuentra realmente entre
3.215 y 3.225.
La cifra 0.0032 es un valor que se encuentra
entre 0.00315 y 0.00325.
La cifra 0.00320 se encuentra entre las cifras
0.003195 y 0.003205
25. Orden de datos
La ordenación es el proceso mediante el cual
los datos están acomodados de tal manera
que se establece un orden (ascendente o
descendente) entre ellos.
Hay dos métodos comunes:
• Listado en orden
ascendente• Método de tallo y hojas
26. Ejemplo
Considera que la variable de estudio es el
peso de 25 estudiantes. Los pesos se
encuentran en la siguiente tabla:
Peso de 25 estudiantes (en kg)
40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
27. Listado en orden ascendente
El proceso consiste en ordenarlos de menor a
mayor
Peso de 25 estudiantes (en kg)
42 40 48 51 49
56 44 43 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 55
55 5656 57 58
59 62 63 63 66
28. Método de tallo y hojas
Si los números de los datos están
formados por dos dígitos, se hace una
columna con el primer dígito (decenas) y
a la derecha de cada uno de ellos se
escribe, en fila, sólo el segundo dígito
(unidades) de cada uno de los datos que
tengan el mismo primer dígito.
29. Datos sin ordenar:
Datos ordenados:
4
5
6
4
5
6
0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8,9
2,3,3,6
Peso de 25 estudiantes (en kg)
42 40 48 51 49
56 44 43 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
2,0,8,9,4,3,4,5
1,6,5,2,2,0,9,0,6,5,7,1,8
2,3,6,3
30. Doble tallo
Una variante de este método es en lugar de
dividir en un grupo las decenas, se divide en
dos grupos. El primero abarcando los dígitos
del 0 al 4 y el segundo del 5 al 9.
El ejemplo anterior
queda:
4 0,2,3,4,4
4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
31. Caso de variables cualitatitivas
El procedimiento es:
Se identifican todos los valores diferentes y se
acomodan en columna.
Se agrega una segunda columna en donde se
van registrando, mediante una línea vertical,
la veces que aparece el valor dado.
32. Ejemplo
Considera que la variable de estudio es el
color de playera de 25 estudiantes.
Los colores se encuentran en la siguiente
tabla:
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
33. rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Color Frecuencia
Azul
Blanco
Café
Gris
Negro
Rosa
Verde
I I I I
I I I I I
II I I
I I I I
I I
I I I I
I
34. Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los
datos, se acomodan en la “Tabla de
distribució n de fre cue ncias o tabla de
fre cue ncias”.
La tabla es básicamente una tabla de
valores x-y, dónde “x” representa el dato y
“y” representa la frecuencia.
35. La frecuencia es el número de veces que
aparece cada dato.
Hay dos clases de tablas de frecuencias:
Para datos NO agrupados.
Para datos agrupados.
36. Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia
absoluta o frecuencia observada.
37. Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 55
55 5656 57 58
59 62 63 63 66
xi f
40
42
43
44
45
48
49
50
51
xi f
52
55
56
57
58
59
62
63
66
Total
1
1
1
2
1
1
1
2
2
2
2
2
1
1
1
1
2
1
25
38. Frecuencia relativa y
acumulada
Por lo regular, se agregan dos columnas: la
de la frecuencia relativa “fr” y la de la
frecuencia acumulada “fa”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es fr= f/n.
La frecuencia acumulada se obtiene sumando
las frecuencias anteriores a las frecuencias de
un dato dado.
39. Ejemplo
xi f fr fa
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
xi f fr fa
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Tot
al
25
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.04
0.08
0.08
0.08
0.08
0.08
0.08
0.08
1/25
2/25
1
2
3
5
6
7
8
10
12
14
16
18
19
20
21
22
24
25
1
Siempre
es el
número
total
Siempre es 1
40. Intervalo de clase
En ocasiones es conveniente acomodar
los datos en pequeños grupos de igual
tamaño, llamados intervalos de clase.
El punto medio o marca de clase “xi”, se
obtiene con:
El tamaño del intervalo se obtiene
mediante la diferencia de los límites
Marca de clase
=
Límite inferior + límite
superior 2
42. Límite verdadero del intervalo
Frontera de clase o límite verdadero del
intervalo:Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
42.5 – 47.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
40 – 2.5 40 + 2.5
43. Tabla de intervalos con
límites verdaderos
Usando símbolos de
desigualdad
Usando paréntesis
y corchetes
Intervalo de
clase
Punto
medio
“xi”
37.5 ≤ x < 42.5 40
42.5 ≤ x < 47.5 45
47.5 ≤ x < 52.5 50
52.5 ≤ x < 57.5 55
57.5 ≤ x < 62.5 60
62.5 ≤ x < 67.5 65
Intervalo de
clase
Punto
medio
“xi”
[37.5 , 42.5) 40
[42.5 , 47.5) 45
[47.5 , 52.5) 50
[52.5 , 57.5) 55
[57.5 , 62.5) 60
[62.5 , 67.5) 65
Está incluido No está incluido Está incluido No está incluido
El tamaño del intervalo es de
44. Si por alguna razón no es fácil decidir el
ancho del intervalo y el número de ellos, se
pueden utilizar las siguientes fórmulas:
K = 1 + 3.3 log (n)
Donde K = número aproximado de clases
n = número de datos.
Amplitud de los intervalos = Rango / K
Donde Rango = diferencia entre el dato
mayor y el dato
menor.
45. Ejemplo
Para el ejemplo de los datos de los pesos de
25 alumnos, el valor de K:
Y la amplitud de los intervalos sería:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.
Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.
Aproximadamente 5 unidades es la amplitud
de los intervalos.
46. Tabla de distribución de
frecuencias para datos
agrupados
Se elabora con los intervalos de clase, sus
puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.xi f
40 1
42 1
43 1
44 2
45 1
48 1
49 1
50 2
51 2
52 2
55 2
56 2
57 1
58 1
59 1
62 1
63 2
66 1
Total 25
Datossinagrupar
Intervalo
de clase
Punto medio
“xi”
f
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 - 67 65
Total
Datos agrupados
2
4
8
5
3
3
25
47. Se agregan las columnas de frecuencia
relativa “fr” y frecuencia acumulada “fa”:
Intervalo
de clase
Punto
medio “xi”
f fr Fa
38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63- 68 65 3
Total 25
0.08
0.16
0.32
0.20
0.12
0.12
1
2
6
14
19
22
25
2/25
4/25
8/25
48. Por último se agregan las columnas:
Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
Frecuencia relativa acumulada “fra”, se
obtiene sumando las frecuencias relativas
anteriores a un dato dado.
Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias
porcentuales acumuladas a un dato dado.
49. Tablas de frecuencias absoluta,
relativa y acumulada
Intervalo
de clase
Punto
medio “xi”
f fr f% fa fra f%a
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
8
16
32
20
12
12
100
0.08
0.24
0.56
0.76
0.88
1
8
24
56
76
88
100
0.08 x
100
2/25
0.08 x
100
50. Gráfica de Datos
Existen dos tipos de gráficas mas
usuales:
Polígono de Frecuencias
Histograma
Otros gráficos:
Gráfica de barras
Pictograma
Gráfico Circular o de pastel.
51. Polígono de Frecuencias
Es la representación mediante un gráfico
de línea. En él se muestra la distribución
de frecuencias y está formado por
segmentos de línea que unen los puntos
correspondientes a la frecuencia de cada
una de las clases.
El eje “x” representa el dato “xi”
y el eje “y” las frecuencias.
0
10
2 0
3 0
4 0
50
6 0
55. Histograma
Es la representación gráfica de
los datos mediante una sucesión
de rectángulos.
Está formado por rectángulos cuya
anchura representa a cada uno de los
intervalos y la altura corresponde a la
frecuencia.
En el eje “x” estarán los límites
verdaderos, los puntos medios y en el eje
“y” las frecuencias.
0.95 2.95 4.95
0
2
4
6
8
10
12
14
59. Pirámide Poblacional
Una variante en el histograma es colocar
en el eje “x” de tal manera que las
columnas quedarán en forma horizontal,
es muy común en datos poblacionales.
60. Ojiva
Es la representación gráfica de las
frecuencias acumuladas mediante un
gráfico de línea. Se muestra la
distribución de frecuencias acumuladas
de los datos.
En el eje “x” estarán los puntos medios y
en el eje “y” las frecuencias acumuladas.
61. Ejemplo
Intervalo
de clase
Punto
medio “xi”
f fr fa
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
62.
63. Usando la frecuencia acumulada y la
frecuencia porcentual.
Intervalo
de clase
Punto
medio “xi”
f fr f% fa fra f%a
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
64.
65.
66. Gráfico Circular
También es llamado gráfico de pastel.
Sólo se representan datos de frecuencias
relativas o frecuencias porcentuales.
Se debe dividir el área del círculo de manera
proporcional a las frecuencias. 13%
17%
57%
13%
PERRO
PAJARO
HAMSTER
GATO
67. Agregaremos una columna a nuestra
tabla de frecuencias “Frecuencia relativa
al círculo”, multiplicando (fr)(360°), para
mostrar la parte proporcional de círculo
medida en grados que corresponde a
cada intervalo.
68. Ejemplo 1
Intervalo
de clase
Punto
medio “xi”
f fr (fr)
(360°)
38 – 42 40 2 0.08
43 – 47 45 4 0.16
48 – 52 50 8 0.32
53 – 57 55 5 0.20
58 – 62 60 3 0.12
63- 68 65 3 0.12
Total 25 1
28.8°
0.08 x
360°
0.16 x
360°
57.6°
115.2°
72°
43.2°
43.2°
360°
69.
70. Ejemplo 2
Color Frecuencia Conteo
Azul 4
Blanco 7
Café 3
Gris 4
Negro 2
Rosa 4
Verde 1
I I I I
I I I I I
II I I
I I I I
I I
I I I I
I
71. Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se
dibujan separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos.
0
10
20
30
40
50
60
PERRO PAJARO HAMSTER GATO
Frecuenciaabsoluta