Blog, conceptos de programación y métodos estadísticos
Introducción a la Estadística
1. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
I. Generalidades
Antes de comenzar propiamente este curso habrá que preguntarse:
1. ¿Para qué me puede servir la Estadística en mi desempeño profesional?
2. ¿Por qué es útil la organización de la información?
3. ¿Qué tipos de problemas podemos resolver mediante el uso de conceptos de
Estadística?
I.1.- ¿Qué es la estadística?
Estadística
Ciencia que proporciona técnicas precisas para obtener información (recolección y
presentación de datos), así como métodos para el análisis, validación y presentación de
ésta.
La Estadística se divide en dos ramas que son:
Estadística descriptiva
Contiene la recolección, organización, presentación y resumen de una serie de datos en
forma tabular, gráfica o numérica. El análisis se limita en sí mismo a los datos
recolectados y no se puede realizar inferencia (generalización) alguna acerca de la
población de donde provienen esos datos.
Ejemplo: Analizar el comportamiento del diámetro de un lote de 100 piezas de un
balero.
Estadística inferencial
Hace posible la estimación de una característica de una población o la toma de una
decisión referente a una población, fundamentándose sólo en los resultados de la
muestra.
Ejemplo: Conocer la tendencia electoral con base en una encuesta realizada en las
principales ciudades del país.
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 1
2. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Definiciones básicas:
• Experimentación
Proceso de generar datos.
• Población
Conjunto de observaciones en las cuales se está interesado.
• Muestra
Subconjunto de una población. Debe ser representativa, es decir que todas las
características de una población estén representadas.
• Muestra aleatoria
Aquella en la cual todos los elementos de una población tienen la misma oportunidad
(probabilidad) de ser seleccionados.
Datos
Característica medible, contable o apreciable en cada elemento de una muestra.
• Datos cualitativos (por atributos)
Características no medibles de un elemento de la muestra.
Ejemplo: Calidad en un artículo (bueno/malo)
Sazón de una comida (salada/desabrida)
• Datos cuantitativos (variables)
Condiciones medibles o contables en un elemento de la muestra.
Ejemplo: Contenido de una lata de refresco
Número de estudiantes foráneos en un salón
• Datos variables discretos
Números enteros. Resultan de un conteo.
Ejemplo: 21 artículos defectuosos
15 alumnos aprobados
• Datos variables continuos
Pueden tomar su valor dentro de un rango continuo de valores. Resultan de una medición.
Ejemplo: 1.67 metros
3.568 litros
Los conceptos que se presentaron serán útiles para el resto de este y otros cursos más
avanzados, tanto en el área de estadística como en otras ramas como Investigación de
operaciones y Control de calidad.
Reflexiona y responde las siguientes preguntas:
• ¿Qué es Estadística?
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 2
3. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
• ¿Cuáles son las ramas de la Estadística?
• ¿Para qué me sirve un muestreo aleatorio?
• ¿Por qué es necesario el estudio de la Estadística descriptiva?
I.2.- Aplicaciones en el ámbito general de las ciencias sociales
Para la gente común y corriente la estadística significa números. En el periódico de la
mañana se pueden encontrar las estadísticas más reciente sobre los delitos de la ciudad:
número de asesinatos, de robos de automóviles, de asaltos y demás delitos que hayan
sido denunciados en determinado período de tiempo; o las más recientes estadísticas
acerca de la mano de obra en el país: por ejemplo el número de desempleados; o las
últimas estadísticas sobre el número de nacimientos y muertes que han ocurrido durante
cierto período de tiempo; o, en relación con el deporte, el número de partidos ganados y
perdidos por los equipos favoritos de !a localidad.
Aunque estos ejemplos realmente forman parte del concepto total de "estadística", la
palabra tiene un sentido más amplio para aquellas personas cuyo trabajo requiere un
conocimiento (si bien a veces mínimo) de los aspectos más técnicos de la estadística.
Para estas personas, la palabra "estadística" tiene relación con aquellos conceptos y
técnicas que se emplean en la recopilación, organización, resumen, análisis, interpretación
y comunicación de información numérica. Naturalmente, dichos conceptos y técnicas
juegan un papel importante en las actividades que cumplen los profesionales de todas las
ciencias.
Generalmente se diseña una serie de trabajos estadísticos para alcanzar uno de los dos
siguientes objetivos, o ambos:
1 Describir cuantitativamente una serie de personas, lugares o cosas.
2 Dar información de la que se pueda sacar conclusiones acerca de un grupo grande de
personas, lugares o cosas, por medio de la observación de solo una pequeña parte del
conjunto total.
Las actividades estadísticas encaminadas a lograr la primera meta se denominan
estadística descriptiva y las que tienen por objeto alcanzar la segunda se llaman
estadística inferencial.
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 3
4. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
I. 3.- Aplicaciones en el sector público y privado.
La mayoría de los lectores del presente texto no van a ser expertos en estadística. Cabe
preguntar entonces para qué hay que estudiada. La razón estriba, en pocas palabras, en
que los conceptos y las, técnicas de la estadística se utilizan actualmente en un gran
número de ocupaciones. Las ideas estadísticas constituyen una parte integral de las
actividades investigativas, de las encuestas para recopilar datos y del análisis de los datos
que se originan en las actividades que desarrollan las instituciones y organizaciones.
Es posible que un trabajador no necesite conocer de la estadística sino aquello que lo
faculte para saber cuándo se requieren los servicios de un experto y para poderse
comunicar eficazmente con él cuando trabajen juntos en la planeación, dirección e
interpretación de los resultados de una actividad que requiere la metodología de esta
ciencia.
La persona que comprenda los conceptos estadísticos y su metodología sacará mejor
provecho de ellos. Esta persona estará más preparada para evaluar los resultados de una
investigación y demás informaciones que se obtengan.
El profesional que entienda de estadística podrá leer con mayor inteligencia la literatura
que, sobre su campo de acción, va día a día apareciendo.
Finalmente, vamos a descubrir que los conocimientos de estadística son de gran ayuda
para las demás asignaturas. Muchos textos correspondientes a otras asignaturas se han
escrito sobre la base de que el estudiante tiene por los menos un conocimiento elemental
de las ideas y técnicas de la estadística y, además, muchos cursos superiores tienen esta
materia como requisito previo.
Áreas de aplicación de la metodología estadística.
Ya hemos observado que los conceptos y la metodología de la estadística se emplean en
muchos campos. A continuación mencionaremos algunas áreas solamente en donde ella
se utiliza.
Agricultura. Las técnicas estadísticas se emplean en actividades tales como experimentos
sobre la reproducción de plantas y animales, estudios de la bondad relativa de diversos
fertilizantes, insecticidas, etc. y estudios de métodos para aumentar el rendimiento de las
cosechas.
Biología. En biología se emplean los métodos estadísticos para estudiar las reacciones de
las plantas y los animales ante diferentes presiones ambientales y para investigar la
herencia.
Negocios. Utilizando la estadística, los hombres de negocios pueden predecir los
volúmenes de ventas, medir las reacciones de los consumidores ante los nuevos
productos, tomar decisiones en cuanto a la forma de invertir el presupuesto para
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 4
5. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
publicidad y determinar el mejor método para utilizar las habilidades y aptitudes de sus
empleados.
Salud y medicina. Los resultados que se obtienen en las investigaciones sobre fármacos
se analizan por medio de los métodos estadísticos. Los técnicos de la salud la utilizan para
planear la localización y el tamaño de los hospitales y de otras dependencias de salud.
Los médicos investigadores se ayudan del análisis estadístico para evaluar la efectividad
de diversos tratamientos.
Industria. La mayor parte de los industriales utilizan algún control de calidad y los
conceptos y técnicas estadísticas constituyen la base de casi todos estos programas.
Psicología. Los psicólogos se valen de los conceptos y técnicas de la estadística para
medir y comparar la conducta, las actitudes, la inteligencia y las aptitudes del hombre.
Sociología. En la sociología, las técnicas estadísticas se emplean en los estudios
comparativos de diferentes grupos socioeconómicos y culturales y en el estudio del
comportamiento y las actitudes de grupo.
I.4.- Interpretación en las ciencias sociales en el sector público y privado.
I. 5.- Distribuciones de frecuencia.
En toda empresa que desee iniciar un programa de calidad, debe seguir una
metodología basada en herramientas estadísticas básicas. Los encargados del proceso
deben obtener una gran cantidad de información tanto descriptiva como numérica de la
variable que se desee estudiar de su producto. El problema ahora es cómo presentar esa
información de modo que nos permita un análisis.
En procesos naturales, sociales o industriales es común que se genere una gran
cantidad de información en forma de datos, por lo que debemos ser capaces de ordenarla
y procesarla de modo que en unas cuantas cantidades, tablas o gráficos podamos ver y
comprender cómo se comporta un fenómeno. El objetivo es utilizar esa información ya
procesada como una útil herramienta de decisión. Dentro de la Estadística descriptiva
existen las distribuciones de frecuencias, que nos servirán para tal efecto.
Ahora debemos preguntarnos:
• ¿Para qué me sirve la Estadística descriptiva?
• ¿Cómo se resume una gran cantidad de información sin perder de vista el objetivo
del análisis?
• ¿Qué herramientas puedo manejar para esos análisis?
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 5
6. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Distribución de frecuencias
Existen de dos tipos:
a) de frecuencia simple, cuando los datos no varían mucho, y se repiten
Frecuencia: es el número de veces que se repite un dato o clase.
Conteo: es un proceso gráfico que sirve para registrar una serie de valores y sus
repeticiones.
Ejemplo de formas de conteo:
Frecuencia Método Método alternativo
común
1
2
3
4
5
6
7
8
9
10
etcétera
Datos de 30 calificaciones de una persona en el salón de clase x de la escuela y fecha z.
8, 8, 7, 9, 8, 6, 5, 9, 10, 10, 8, 8, 6, 6, 6, 5, 6, 7, 7, 9, 9, 6, 6, 6, 8, 8, 8, 8, 7, 10,
1º Coloque en una tabla los datos diferentes ordenados de menor a mayor o lo contrario
(en este caso será de menor a mayor) y en la primera columna sin repetir, llamada x o
clase.
2º Realice el conteo según uno de los métodos descritos anteriormente, esto se debe
hacer en el orden en que aparece cada dato y poniendo una marca según corresponda
hasta terminar con los datos.
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 6
7. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
3º Anotar con número al final del conteo en la otra columna (frecuencia) el total de veces
que se repitió cada dato y sumar la columna de valores de frecuencia de tal forma que
debe dar como resultado el mismo número que el de datos totales de lo contrario se
deberá revisar que todos los datos hayan sido contados y no repetidos por error.
30 calificaciones de una persona
X(dato) Conteo Frecuencia
en el salón de clase x de la escuela y fecha z.
EJERCICIOS.
Para cada caso elaborar un cuadro como el anterior:
1) Calificaciones de un grupo de segundo semestre en la materia de Matemáticas II.
5 7 8 9 10 5 8 7 7 6
8 8 7 5 6 6 8 10 7 8
9 9 9 6 7 8 5 5 5 7
2) Número de horas de la jornada de trabajo de un conjunto de trabajadores:
6 7 8 4 3 3 8 8 5 6
8 8 7 8 2 3 4 10 8 8
9 9 6 6 5 8 8 8 5 12
3) Número de hijos de personas.
0 2 2 1 1 1 3 5 3 0
0 0 1 1 2 2 3 2 0 1
0 0 2 2 2 1 3 3 2 4
3 3 2 0 0 1 1 1 2 2
4) Número de horas por semana que descansa en horario de trabajo un profesor.
0 2 2 1 1 1 3 5 3 0
0 0 1 1 2 2 3 2 0 1
0 0 2 2 2 1 3 3 2 4
3 3 2 0 0 1 1 1 2 2
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 7
8. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
5) Días de trabajo de un grupo de vendedores ambulantes: 7, 8, 7, 6, 7, 5, 4, 3, 2, 6, 7, 8,
4, 3, 1, 2, 5, 3, 6, 4, 5, 4, 5, 6, 7, 6, 8, 6, 5, 4, 4, 3, 5, 3, 4, 1, 2, 1, 2, 4, 3, 5.
b) de frecuencia agrupada, cuando varían mucho y casi no se repiten.
Se define como una disposición tabular de los n datos de una muestra por clases junto con
las correspondientes frecuencias de clase. De este modo, los datos organizados en clases
se llaman datos agrupados.
• Una tabla de distribución de frecuencias más o menos se vería de la siguiente manera:
(1) Clases ( k): categorías en las cuales se divide la información. Una regla de uso común
establece que k= n Donde n es el número total de datos de la muestra.
Existen otros criterios para establecer k.
(2) Límite Real Inferior ( LRI): cota inferior de la i –ésima clase
(3) Límite Real Superior ( LRS): cota superior de la i –ésima clase
(4) Ancho de clase ( A): diferencia LRS– LRI
(5) Marca de clase ( xi): punto medio de la i -ésima clase.
(6) Frecuencia absoluta de la i -ésima clase: número de observaciones que caen dentro de
esa clase
(7) Frecuencia acumulada hasta la i -ésima clase: sumatoria de frecuencias absolutas
desde k= 1 hasta k= i
(8) Frecuencia relativa de la i -ésima clase ( h): porcentaje de observaciones que caen
dentro de esa clase
(9) Frecuencia acumulada relativa hasta la i -ésima clase ( H): porcentaje acumulado de
observaciones desde k= 1 hasta k= i
Distribución de frecuencias agrupadas: es la elaboración de cuadros con datos que varían
mucho y se deben reunir en grupos llamados intervalos de clase o simplemente intervalos.
Ejemplo:
Datos de estaturas de 30 personas que pasaron en la calle x el día y
1.58, 1.25, 1.56, 1.72, 1.24, 1.80, 1.64, 1.69, 1.48, 1.30, 1.71, 1.52, 1.54, 1.56, 1.65, 1.66,
1.68,1.45, 1.53, 1.78, 1.54, 1.57, 1.65, 1.66, 1.68, 1.48, 1.18, 1.56, 1.70, 1.04,
Completar la tabla propuesta con los valores anteriores
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 8
9. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Estaturas de 30 personas
Intervalos Conteo Frecuencia
1.00 a 1.29
1.30 a 1.39
1.40 a 1.49
1.50 a 1.59
1.60 a 1.69
1.70 a 1.79
1.80 a 1.89
personas de paso en la calle x el día y.
DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS
Para la confección de tablas de frecuencias agrupadas es importante saber el número de
intervalos que se harán y por convención o norma no se tomarán mas de 15 intervalos
pues sería una tabla muy grande si se rebasa este número; además se tomará un número
impar de intervalos de preferencia.
Ejemplo para la confección de tabla desde los valores desordenados este es un método
que siempre resultará en la elaboración:
1. Con los datos siguientes que representan los artículos vendidos por día de un puesto de
dulces en el centro de Xalapa en el mes de enero del año 2002 elaborar una tabla con 9
intervalos.
29 30 26 32 44 37 27 40 40 51 57 28 46 35 26 37 42 59 61 60
34 27 52 44 46 54 35 36 41 31 45 54 33 35 37 39 42 59 60 37
36 55 39 31 36 43 49 29 38 40 28 52 35 49 32 38 43 54 59 37
1º Buscar el dato mayor (DM) el dato menor(Dm).
DM = Dm =
2º Calcular el ancho de los intervalos. Con la formula Ancho de intervalo =
D M − Dm
númerode int ervalos
Ancho de intervalo = = __________
* Si en lugar de darnos el número de intervalos nos dieran el ancho de intervalos la
D M − Dm
formula cambia de la siguiente manera: número de intervalos =
anchode int ervalo
3º Escribir los intervalos en la tabla desde el primer valor hasta el último. Por conteo se
encuentran los valores inferior y superior.
4º Se procede con el conteo y las frecuencias como en la distribución de frecuencias
simple
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 9
10. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Artículos vendidos por día de un puesto de dulces
Intervalos Conteo Frecuencia
1
2
3
4
5
6
7
8
9
Puesto de dulces en el centro de Xalapa en el mes de enero del año 2002
Distribución de Frecuencias Agrupadas (Ejercicios).
Elabore según el método descrito anteriormente las tablas con los intervalos o anchos de
intervalos propuestos
1. Con los datos siguientes que representan las horas de estudio que dedican los
estudiantes fuera de clase. Elabore un cuadro con 7 intervalos.
3 2 5 8 2 5 11 21 7 1 11 4 3 15 4 5 16 6 13 10
8 9 20 4 3 12 1 12 23 11 22 6 17 5 2 13 8 1 10 3
7 4 2 15 6 4 14 5 12 10 5 2 10 17 9 2 1 6 16 1
3 18 18 3 6 1 6 11 4 12
2. El precio de un paquete de pañales de una marca determinada fue indagado por una
persona y encontró los siguientes resultados. Construye una distribución de frecuencias
agrupada con 5 intervalos.
60 75 82 77 65 70 67 65 78 73 69 66 72 66 68 74 61 66 74 79
67 74 80 75 70 66 76 78 79 75 72 79 69 70 74 72
3. Los datos siguientes representan las edades de los empleados de una sucursal de
supermercados. Elaborar una tabla con intervalos cuya amplitud sea de 3 años.
20 22 26 19 21 23 21 19 23 28 21 23 18 23 22 26 22 26 25 27
20 26 25 24 29 24 18 21 22 21 24 26 25 21 22 23 24 22 28 27
21 25 36 23 24 31 23 29 22 20 23 19 25 24 25 22 26 25 26 22
24 28 30 32 30 18 29 21 24 23 26 23 22 24 25 21 19
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 10
11. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Ejercicios
1).- Con los datos que representan litros de leche vendidos diariamente por un pequeño
comerciante durante un bimestre (Junio-Julio de 1990). Construye una distribución
agrupada de 9 intervalos:
29 , 30 , 26 , 32 , 44 , 37 , 27 , 40 , 40 , 51 , 57 , 28 , 46 , 35 , 26 , 37 , 42 , 59 , 61 , 60
34 , 27 , 52 , 44 , 46 , 54 , 35 , 36 , 41 , 31 , 45 , 54 , 33 , 35 , 37 , 39 , 42 , 59 , 60 , 37
36 , 55 , 39 , 31 , 36 , 43 , 49 , 29 , 38 , 40 , 28 , 52 , 35 , 49 , 32 , 38 , 43 , 54 , 59 , 37
Intervalo conteo f
2).- Con los datos siguientes que representan los días de zafra en cada unos de los
Ingenios azucareros de la República Mexicana en el ciclo 89/90.Construye una distribución
agrupada cuya amplitud sea de 9 días.
178 , 122 , 161 , 137 , 166 , 136 , 147 , 163 , 142 , 151 , 144 , 192 , 155 , 172 , 152
208 , 168 , 170 , 156 , 142 , 178 , 141 , 112 , 157 , 149 , 171 , 177 , 147 , 158 , 136
160 , 141 , 152 , 153 , 150 , 155 , 149 , 150 , 177 , 116 , 140 , 141 , 170 , 101 , 124
182 , 138 , 148 , 146 , 124 , 156 , 172 , 180 , 136 , 136 , 173 , 146 , 138 , 139 , 177
164 , 204 , 135
3).- Con los siguientes datos que representan el tiempo dedicado al estudio fuera de
clases en horas semanarias por estudiantes universitarios, Construye una distribución de
datos agrupados de 7 intervalos:
3 , 2 , 5 , 8 , 11 , 21 , 7 , 1 , 11 , 4 , 3 , 15 , 4 , 5 , 16 , 6 , 13 , 10 , 8 , 9 , 20 , 4 , 3
12 , 1 , 12 , 23 , 11 , 22 , 6 , 17 , 5 , 2 , 13 , 8 , 1 , 10 , 33 , 33 , 7, 4 , 2 , 15 , 6 , 4 , 14
5 , 12 , 10 , 5 , 2 , 10 , 10 , 17 , 9 , 2 , 1 , 6 , 16 , 1 , 3 , 18 , 18 , 3 , 6 , 1 , 6 , 11 , 4 , 12
4).- Con los datos siguientes que representan las edades de los empleaos del sexo
masculino del supermercado X en Julio de 1994. Construye una distribución de datos
agrupados cuya amplitud real sea de 3 años:
20 , 22 , 26 , 19 , 21 , 23 , 21 , 19 , 23 , 28 , 21 , 23 , 18 , 23 , 22 , 26 , 22 , 26 , 25 , 27
20 , 26 , 25 , 24 , 29 , 24 , 18 , 21 , 22 , 21 , 24 , 26 , 25 , 21 , 22 , 23 , 24 , 22 , 28 , 27
21 , 25 , 36 , 23 , 24 , 31 , 23 , 29 , 22 , 20 , 23 , 19 , 25 , 24 , 25 , 22 , 26 , 22 , 26 , 25
24 , 28 , 30 , 32 , 30 , 18 , 29 , 21 , 24 , 23 , 26 , 23 , 22 , 24 , 25 , 21 , 19
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 11
12. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
5).- En el examen de matemáticas, de un total de 50 reactivos los 48 alumnos del
segundo semestre de la escuela de Bachilleres Ángel carvajal de la ciudad de Xalapa, Ver
obtuvieron los siguientes resultados: Construye una distribución de 4 datos de amplitud.
25 41 18 35 28 43 30 33 24 29 28 22 36 15 44 31
21 14 49 24 20 42 33 37 27 49 26 22 34 28 25 29
26 30 38 25 30 45 44 19 38 32 39 22 35 40 33 22
Las distribuciones de frecuencias nos permiten ordenar la información para presentarla en
forma de tablas que muestren, de manera ordenada, el comportamiento de una muestra
de datos; también permiten ver las posibles relaciones que existan entre ellos. Además,
partiendo de tales tablas podremos calcular algunas medidas que muestren
numéricamente dichas relaciones.
¿Para qué sirve una distribución de frecuencias?
I.6.- Medidas de centralización.
Contesta las siguientes preguntas:
• ¿Para qué me sirven indicadores numéricos o estadísticos?
• ¿Qué comportamientos se pueden observar en una muestra de datos?
• ¿Cómo saber si un proceso industrial tiene un buen desempeño basándose en
estos estadísticos?
• ¿Cuándo saber si es necesario agrupar la información y después calcular los
estadísticos de tendencia central y dispersión?
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 12
13. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Medidas de tendencia central y de dispersión.
Si se tiene una muestra aleatoria de n datos, entonces hay dos medidas del
comportamiento de los datos que es interesante analizar: tendencia central y dispersión.
Tendencia central
Disposición de los datos para acercarse a un valor (generalmente el centro)
Dispersión
Grado en que los datos se alejan del ese valor
Cuando se tienen pocos datos (digamos n < 20) es posible hacer cálculos de medidas de
tendencia central usando fórmulas abreviadas.
• Las medidas de tendencia central más comúnmente usadas son el promedio, la moda y
la mediana.
• Vamos a repasar cada una de ellas, junto con un ejemplo.
Promedio
∑
n
xi
• Se define como x= 1
n
• Donde: x es el promedio de la muestra
n es el tamaño de la muestra
xi son cada uno de los elementos de la muestra
Ejemplo del promedio
• Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93 calcula el promedio.
Mediana
• Se define como el valor central de una serie ordenada de n datos.
• Si esta cantidad n es impar, se toma el valor central. x = xn +1
2
• Si esta cantidad n es par se toman los dos valores centrales y se obtiene su promedio.
xn + xn
+1
x= 2 2
2
Ejemplo de mediana. Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93 calcula la
mediana. Antes de todo, ordena los datos de menor a mayor: 9, 27, 40, 9, 70, 84, 84, 93
xn + xn
+1
Como n es par se calcula: x= 2 2
2
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 13
14. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Moda
La moda se define como el valor que más se repite en una serie de datos.
Puede darse el caso de que no exista moda o que exista más de una moda.
¡Ojo! se pone el dato, no el número de veces que éste se repite.
Ejemplo de la moda
• Para la serie de datos 27, 84, 9, 40, 49, 84, 70, 93 calcula la moda.
• No es necesario ordenar de menor a mayor los datos.
• Se observa que el número 84 se repite dos veces, por lo tanto la moda es igual a 84.
ˆ
x =84
Media Aritmética
1.- Es una medida totalmente numérica o sea sólo puede calcularse en datos de
características cuantitativas.
2.- En su cálculo se toman en cuenta todos los valores de la variable.
3.- Es lógica desde el punto de vista algebraico.
4.- La media aritmética es altamente afectada por valores extremos.
5.- No puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
6.- La media aritmética es única, o sea, un conjunto de datos numéricos tiene una y solo
una media aritmética.
Mediana
1.- En su cálculo no se incluyen todos los valores de la variable.
2.- La Mediana no es afectada por valores extremos.
3.- Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4.- No es lógica desde el punto de vista algebraico.
Moda
1.- En su cálculo no se incluyen todos los valores de la variable.
2.- El valor de la moda puede ser afectado grandemente por el método de designación de
los intervalos de clases.
3.- No está definida algebraicamente.
4.- Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5.- No es afectada por valores extremos.
Media Geométrica
1.- Se toman en cuenta todos los valores de la variable
2.- Es afectada por valores extremos aunque en menor medida que la media aritmética.
3.- La media geométrica de un número y su recíproco será siempre igual a uno.
4.- No puede ser calculada en distribuciones con clase abiertas.
5.- Es mayormente usada para promediar tazas de cambio, razones y valores que
muestren una progresión geométrica.
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 14
15. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
MEDIDAS DE TENDENCIA CENTRAL RESUMEN.
Media aritmética.- es el promedio de todos los datos que se tengan. x
Mediana.- es el dato que se encuentra justamente a la mitad de todos los datos. ~
x
Moda.- es el dato que se repite más veces o que tiene la frecuencia más alta. x ˆ
a) Media, moda y mediana para datos no agrupados o distribución simple
Datos de estaturas de 10 personas en una muestra en el salón de clase x de la escuela y
fecha z.
1.56 1.68 1.58 1.69 1.71 1.59 1.61 1.61 1.60 1.65
Media o promedio.
1. ¿Cómo calculamos el promedio?
2. ¿Cómo se sustituye esta formula? x=
∑X
N
Moda
3. ¿Cuál es el dato que más se repite?
xˆ
Mediana
4. ¿Cuál es el dato que se encuentra a la mitad de todos los datos?
~
x
EJEMPLO :
Calcular las medidas de tendencia central Media mediana y moda:
X = 3,5,5,6,4,4,4,4,7,7,7
__
X = Me= Mo =
EJERCICIOS
Determinar las medidas de tendencia central media, mediana y moda en las siguientes
distribuciones:
1).- 3 , 4 , 5 , 7 , 6 , 4 , 2 , 3 , 4
2).- 1 , 3 , 5 , 2 , 3 , 4 , 6 , 7
3).- 50 , 55 , 53 , 57 , 52 , 55 , 54 , 54 , 54 , 56 , 54
4).- 20 , 30 , 30 , 30 , 40 , 20 , 30 , 10 , 40 , 50
5).- 13 , 33 , 44 , 22 , 33 , 33 , 44 , 55 , 66 , 44
6).- 5 , 5 , 4 , 7 , 9 , 10 , 3 , 5 , 6 ,8
7).- 8 , 9 , 6 , 8 , 4 , 5 , 7 , 3 , 10 , 8
8).- 11 , 15 , 8 , 9 , 14 , 10 , 10 , 13 , 13 , 12
9).- 6,6,5,3,2,5,6,4
10).- 10 , 15 , 10 , 10 , 11 , 11 , 12 , 13 , 14
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 15
16. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
I.7.- Medidas de dispersión.
Una medida de tendencia central no describe por si sola ni sintetiza adecuadamente
una distribución de datos, para esto es necesario tener un indicador que de cuenta del
grado de heterogeneidad o dispersión con que se distribuyen los datos de la variable. Una
medida de dispersión indica cuanto se desvían los datos con respecto a las centrales y
se tienen los siguientes:
Medidas de dispersión para datos no agrupados
Cuando se tienen pocos datos (digamos n < 20) es posible hacer cálculos de medidas de
dispersión usando fórmulas abreviadas.
Las medidas de dispersión más comúnmente usadas son el rango, la varianza, la
desviación estándar y el coeficiente de variación.
Vamos a repasar cada una de ellas, junto con un ejemplo.
Rango
• En una serie de datos se define como la diferencia entre el mayor y el menor de los
datos. R = xM − xm
Donde Xm es el dato mayor de la muestra
R es el rango
Xm es el dato menor de la muestra
Ejemplo de rango
• Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93 calcula el rango.
Varianza
• Se define como el promedio del cuadrado de las diferencias de cada observación xi
∑ x −x
n
( i )2
respecto al promedio muestral. s =
2 i =1
n −1
• Donde: x es el promedio de la muestra
x es cada uno de los elementos de la muestra
n es el tamaño de la muestra
s2 varianza
Ejemplo de varianza
• Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93 calcula la varianza.
• Sabemos que el promedio de esta serie de datos es 57, por lo tanto
Desviación estándar
∑
n
( xi − x ) 2
• Se define como la raíz cuadrada positiva de la varianza, es decir: s = i =1
n −1
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 16
17. INSTITUTO DE ESTUDIOS SUPERIORES DE XALAPA. “I. E. S.”
Clase número: _________ Fecha: ______________ Materia: Estadística I
Nombre del alumno: _______________________________ Grupo o modalidad:_________
Ejemplo de desviación estándar
• Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93 calcula la desviación estándar.
• Sabemos que la varianza de esta serie de datos es 925.71, por lo tanto la desviación
estándar es:
Coeficiente de variación
s
• Se define como CV =
x
• Donde: x es el promedio de la muestra
s es la desviación estándar
• El coeficiente de variación explica la dispersión relativa en una muestra. La desviación
estándar, en contraparte, indica la dispersión absoluta.
Ejemplo del coeficiente de variación
• Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93 calcula su coeficiente de variación.
• Sabemos que
s = 30.4255
x= 57
Por lo tanto CV= 30.4255/57 = 0.534
Diseño: Lic. Enrique Corona Alarcón. Unidad I Página 17