Distribución de frecuencia de datos agrupados y no agrupados
1. DATOS AGRUPADOS Y DATOS NO AGRUPADOS
Introducción:
Una de las ramas de la Estadística más accesible a la mayoría de la población es la descriptiva. Esta
parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para
su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos
parámetros útiles para la explicación de la información.
La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se
enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la
información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de
presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no
quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible
a la mayoría de la población humana, resulta de suma importancia considerar para así evitar
malentendidos, tergiversaciones o errores.
Descripción de datos:
Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos
menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar
clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la población de donde fue
tomada.
Datos agrupados:
Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella distribución en la que la
disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de
cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase.
Datos no agrupados:
Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución que indica las
frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese
conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha
elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados,
siguiendo un orden lógico con sus respectivas frecuencias.
Nota:
No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos
no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior a 20,
se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de
distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia
o la ojiva. La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar
mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos.
Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información
obtenida de una investigación sea manejable con mayor facilidad.
2. DATOS NO AGRUPADOS.
Tendencia central: la tendencia central se refiere al punto medio de una distribución. Las medidas de
tendencia central se conocen como medidas de posición.
Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al grado en que las
observaciones se distribuyen.
DATOS AGRUPADOS.
Conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para
obtener información directamente de ellos.
Medidas de Dispersión, Se llaman medidas de dispersión aquellas que permiten retratar la distancia de
los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los
datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.
Medidas de Tendencia central, La estadística busca entre otras cosas, describir las características típicas
de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de
promedios. Se les llama medidas de tendencia central porque generalmente la acumulación más alta de
datos se encuentra en los valores intermedios.
Las medidas de tendencia central comúnmente empleadas son:
Media aritmética Media geométrica
Mediana Media armónica
Moda Los cuánticos
PARA LOS AGRUPADOS.
Histograma: Está formado por rectángulos cuya base es la
amplitud del intervalo y tiene la característica que la superficie
que corresponde a las barras es representativa de la cantidad
de casos o frecuencia de cada tramo de valores, puede
construirse con clases que tienen el mismo tamaño o diferente
(intervalo variable). La utilización de los intervalos de amplitud
variable se recomienda cuando en alguno de los intervalos, de
amplitud constante, se presente la frecuencia cero o la
frecuencia de alguno o algunos de los intervalos sean mucho
mayores que la de los demás, logrando así que las
observaciones se hallen mejor repartidas dentro del intervalo.
OJIVAS:
Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es
posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estándar, la
frecuencia relativa. La ojiva representa gráficamente la forma en que se acumulan los datos y permiten
ver cuántas observaciones se hallan por arriba o debajo de ciertos valores. Es útil para obtener una
medida de los cuartiles, deciles, percentiles.
3. POLÍGONO DE FRECUENCIAS:
Se puede obtener uniendo cada punto medio (marca de clase) de
los rectángulos del histograma con líneas rectas, teniendo cuidado
de agregar al inicio y al final marcas de clase adicionales, con el
objeto de asegurar la igualdad del áreas.
DIAGRAMAS DE BARRAS:
Son similares a los gráficos de sectores. Se representan tantas
barras como categorías tiene la variable, de modo que la altura de
cada una de ellas sea proporcional a la frecuencia o porcentaje de
casos en cada clase. Estos mismos gráficos pueden utilizarse
también para describir variables numéricas discretas que toman
pocos valores.
EN LOS GRÁFICOS DE SECTORES:
También conocidos como diagramas de "tartas", se divide un
círculo en tantas porciones como clases tenga la variable, de modo
que a cada clase le corresponde un arco de círculo proporcional a
su frecuencia absoluta o relativa. Un ejemplo se muestra en la.
Como se puede observar, la información que se debe mostrar en
cada sector hace referencia al número de casos dentro de cada
categoría y al porcentaje del total que estos representan.
Si el número de categorías es excesivamente grande, la imagen proporcionada por el gráfico de sectores
no es lo suficientemente clara y por lo tanto la situación ideal es cuando hay alrededor de tres
categorías. En este caso se pueden apreciar con claridad dichos subgrupos.
OTROS EJEMPLOS:
Datos agrupados y no agrupados o series agrupadas y no agrupadas (que es lo mismo) se refiere al
hecho de que estén ordenados, clasificados y contados, por ejemplo:
Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen los 20 niños y así
como te dan la edad así la anotas
2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,… (Total 20 niños)
Estos son datos no agrupados por qué no los has clasificado y contado
1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,… (Total 20 niños)
Los datos no agrupados también los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no
están contabilizados ni clasificados solamente están ordenados
Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos niños había de
cada año. (Y siguen siendo 20 niños)
4. Edad....Frecuencia
1..................2
2..................4
3..................7
4..................4
5..................2
6..................1
Total............20
O también los puedes agrupar (Serie agrupada) en clases, rangos, grupos o intervalos por ejemplo de 2
años para este caso (y siguen siendo 20)
Edad..........Frecuencia
1-2...............6
3-4...............11
5-6...............3
Total.............20
Es decir, fíjate bien, son datos agrupados cuando tienen FRECUENCIA (quiere decir que están contados y
clasificados y DATOS NO AGRUPADOS cuando no tienen frecuencia o que no estaban contabilizados o
clasificados.
Las medidas de tendencia central (media, moda y mediana) y las Medidas de dispersión (desviación
estándar, varianza, cuartiles, percentiles, entré otros se CALCULAN DIFERENTE cuando se trata de datos
agrupados y de datos no agrupados que es lo que tú has encontrado.
Datos no agrupados.
Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos
menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar
clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
Distribución de frecuencia para datos no Agrupados (n<20): Es aquella distribución que indica las
frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese
conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha
elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados,
siguiendo un orden lógico con sus respectivas frecuencias.
Ejemplo:
Vas a investigar la edad a un grupo de 20 Niños en datos no agrupados (es decir, vienen los 20 niños y así
como te dan la edad así la anotas
2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,… (Total 20 niños)
Estos son datos no agrupados por qué no los has clasificado y contado, también se pueden ordenar de la
edad menor a mayor.
Datos agrupados
Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la población de donde fue
tomada.
5. Distribución de frecuencia de clase o de datos Agrupados (n>20): Es aquella distribución en la que la
disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de
cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para
formar un intervalo de clase.
Ejemplo:
Retomamos el ejemplo anterior:
Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuántos niños había de
cada año. (y siguen siendo 20 niños)
Edad..........Frecuencia
1..................2
2..................4
3..................7
4..................4
5..................2
6..................1
Total............20
CIBERGRAFÍA:
http://www.vitutor.com/estadistica/descriptiva/a_2.html (2009).
http://recursostic.educacion.es/descartes/web/materiales_didacticos/unidimensional_lbarrios/index.htm (2008).
http://www.uaq.mx/matematicas/estadisticas/xu3.html (2007).
http://es.wikipedia.org/wiki/Mediana_(estad%C3%ADstica) (2005).
Equipo:
Responsable: Yvonne Emile de la Torre JaureguiberryAL12524375
Manuel Castillejos Antonio AL12524103
Jesús Soto Ruíz AL12523968
Javier Ramirez Alvarado AL12523651
Javier ChavezGarcia AL12523671