1. Tabla de Distribución de Frecuencia
Profesor: Bachiller:
Pedro Beltrán Gustavo Lemus
C.l: 25.812.663
Sección: CV
Barcelona, Junio 2016
2. se le llama distribución de frecuencias a la agrupación de datos en
categorías mutuamente excluyentes que indican el número de observaciones en
cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La
distribución de frecuencias presenta las observaciones clasificadas de modo que se
pueda ver el número existente en cada clase.
Las distribuciones de frecuencias son tablas en que se dispone las
modalidades de la variable por filas. En las columnas se dispone el número de
ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en
frecuencias es facilitar la obtención de la información que contienen los datos.
3. Los intervalos son los límites a los extremos a los que llega una función. Son
utilizados a modo de resumen cuando la cantidad de datos es muy grande. Los límites
extremos de cada clase se les llaman Límite Inferior y Superior de clase respectivamente.
Los intervalos de clase se emplean si las variables toman un número grande de valores o
la variable es continua, es el Rango utilizado para dividir el conjunto de posibles valores
numéricos al trabajar con grandes cantidades de datos. Por ejemplo, si los valores están
entre 1 y 100,se podrían definir grupos por medio de los intervalos 1-25, 26-50, 51-75,
76-100 cuando el intervalo de la clase es 25
Se agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente
Ejemplo:
4. No. De clases (Regla de Sturges): 1 + 3.332 log N
Para obtener un valor aproximado, podemos emplear la regla de ¨STURGES¨.
k = 1 + 3,3logN
donde N es el número de elementos de la muestra.
5. La distribución de frecuencias simple es una tabla que se construye con base en
los siguientes datos: clase o variable (valores numéricos) en orden descendente o
ascendente, tabulaciones o marcas de recuento y frecuencia.
Frecuencia simple absoluta: es el número de veces que se observa en un
mismo ítem o la cantidad de datos que caen en un mismo intervalo.
Frecuencia simple relativa: es la razón geométrica entre la frecuencia absoluta
y el total de datos, es decir el cociente de dividir el número de veces que
aparece un dato de un intervalo entre la totalidad de datos que conforma la
muestra de que se trate. Su máximo será la unidad y su mínimo será el cero.
La distribución de frecuencias agrupadas o acumulada es una tabla que contiene
las columnas siguientes: intervalo de clase, puntos medios, tabulación frecuencias y
frecuencias agrupadas. Frecuencia acumulada, es la suma de la frecuencia de
un intervalo de clases con todas las frecuencias de los intervalos que la
preceden.
Frecuencia acumulada absoluta: es la evaluación o suma de todas las frecuencias
absolutas hasta el intervalo de la clase considerado inclusive.
Frecuencia acumulada relativa: viene a ser la acumulación de todas las frecuencias
relativas hasta el mismo intervalo considerado inclusive.
7. La medidas de Tendencia Central son:
Media aritmética: La media es el valor promedio de la distribución.
Mediana: La mediana es la puntuación de la escala que separa la mitad superior de
la distribución y la inferior, es decir divide la serie de datos en dos partes iguales.
Moda: La moda es el valor que más se repite en una distribución.
8. Ejemplo:
MODA (PARA DATOS NO AGRUPADOS)
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la serie de datos:
Xi: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la máxima, la distribución es bimodal, si son tres las que mas se
repiten será trimodal y cuando se mayo a cuatro el número de Mo, generalizaremos
diciendo que es multimodal o polimodal, es decir, que tiene varias modas.
Yi: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9 (trimodal)
Nota: Cuando todas las puntuaciones de un grupo tienen la misma
frecuencia, no hay moda.
Zi: 2, 2, 3, 3, 6, 6, 9, 9
9. Cálculo de la moda para datos agrupados
Debemos considerar que todos los intervalos tienen la misma amplitud. Por tal
motivo y para efectos de nuestro curso, consideraremos que la Mo es el punto medio
(xi) del intervalo que presente la mayor frecuencia. considerando también el caso en
que la mayor frecuencia puede presentarse en mas de un intervalo (como ocurría
para los datos no agrupados) en cuyo caso una distribución pudiera presentar mas
de una mida.
Clases fi
72 – 73 8
69 – 71 27
66 – 68 42
63 – 65 18
60 – 62 5
100
El intervalo en el que se encuentra la mayor frecuencia es en 66 - 68, donde
fi es 42, para determinar la moda de esta distribución será necesario calcular el
punto medio de ese intervalo:
Xi = (66 + 68) / 2 = 67
Xi =67
por tanto, la moda de esta distribución es Mo = 67
10. MEDIANA
Es el valor que ocupa el lugar central de todos los datos cuando éstos
están ordenados de menor a mayor. Es decir divide a la serie en dos partes iguales
en la que el 50% de los datos están por debajo de la Md y el otro 50% está por
encima de ella.
La mediana se representa por Md.
La mediana se puede hallar sólo para variables cuantitativas.
Cálculo de la mediana
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es la puntuación
central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Md= 5
3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las
dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Md= 9.5
11. Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega
hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre el 50% de los
datos.
Ejemplo
Calcular la mediana de una distribución estadística que viene dada por la
siguiente tabla:
Clases fi Fac
72 – 74 8 100
69 – 71 27 92
66 – 68 42 65
63 – 65 18 23
60 – 62 5 5
100
El procedimiento es igual al utilizado para calcular el Percentil cincuenta
(Pc 50). para ello debemos determinar el 50% de los datos.
el 50% de los 100 datos es 50, entonces debemos hallar la puntuación que
deja por debajo de ella al 50 % de los datos (el otro 50% está por encima)
12.
13. Definición de media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.
µx es el símbolo de la media aritmética para población.
es el símbolo de la media aritmética para población.
Su fórmula estará dada por la siguiente ecuación:
NOTA. Mientras no digamos lo contrario supondremos que estamos
trabajando con una muestra.
14. Calculo de media aritmética para datos NO agrupados:
Ejemplo
Los tiempos de diez vehículos en hacer un determinado recorrido son: 39, 29, 43, 52, 39,
44, 40, 31, 44, 35 minutos. Hallar el tiempo medio.
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de
la media es:
= ( ∑ xi . fi ) / N
= (x1f1 + x2f2 + x3f3 +....+xnfn) / N
15. Las medidas de tendencia central tienen como objetivo el sintetizar los datos
en un valor representativo, las medidas de dispersión nos dicen hasta que punto
estas medidas de tendencia central son representativas como síntesis de la
información. Las medidas de dispersión cuantifican la separación, la dispersión, la
variabilidad de los valores de la distribución respecto al valor central. Distinguimos
entre medidas de dispersión absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirán comparar varias muestras.
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la
moda sólo nos revelan una parte de la información que necesitamos acerca de las
características de los datos. Para aumentar nuestro entendimiento del patrón de los
datos, debemos medir también su dispersión, extensión o variabilidad.
La dispersión es importante porque:
• Proporciona información adicional que permite juzgar la confiabilidad de la
medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la
posición central es menos representativa de los datos.
• Ya que existen problemas característicos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presentan esa dispersión antes de abordar
esos problemas.
16. Medidas de tendencia central
• MEDIA: Media Aritmética, es la que se
obtiene sumando los datos y
dividiéndolos por el número de ellos. Se
aplica por ejemplo para resumir el
número de pacientes promedio que se
atiende en un turno. Otro ejemplo, es el
número promedio de controles
prenatales que tiene una gestante.
• MEDIANA: Corresponde al percentil
50%. Es decir, la mediana divide a la
población exactamente en dos. Por
ejemplo el número mediana de hijos en
el centro de salud “X” es dos hijos. Otro
ejemplo es el número mediana de
atenciones por paciente en un
consultorio.
• MODA: Valor o (valores) que aparece(n)
con mayor frecuencia. Una distribución
unimodal tiene una sola moda y una
distribución bimodal tiene dos. Útil como
medida resumen para las variables
nominales. Por ejemplo, el color del
uniforme quirúrgico en sala de
operaciones es el verde; por lo tanto es
la moda en colores del uniforme
quirúrgico.
Medidas de dispersión
DESVIACIÓN ESTÁNDAR:
Llamada también desviación típica; es
una medida que informa sobre la
media de distancias que tienen los
datos respecto de su
media Aritmética, expresada en las
mismas unidades que la variable.
LA VARIANZA: Es el valor de la
desviación estándar al cuadrado; su
utilidad radica en que su valor es
requerido para todos los
procedimientos estadístico.
ERROR TÍPICO: Llamado
también error estándar de la media.
Se refiere a una medida d variabilidad
de la media; sirve para calcular cuan
dispersa estaría la media de realizar
un nuevo calculo.