Este documento describe diferentes medidas de dispersión para datos no agrupados, incluyendo rango, desviación media, varianza, desviación estándar y coeficiente de variación. Define cada medida y proporciona fórmulas para calcularlas. Luego, aplica estas medidas a un conjunto de datos de ejemplo para ilustrar cómo se calculan.
2. MEDIDAS DE DISPERSIÓN
¿Recuerdas con que otro nombre se conoce estas
medidas?, ¿menciona cuáles son? La característica
más importante para describir a un conjunto de datos
es su dispersión. La dispersión se refiere a la variación o
distribución de los datos de la muestra. Al manejar
datos numéricos no es suficiente su análisis únicamente
con medidas descriptivas que indiquen su promedio,
también se debe analizar la dispersión o distribución
que existe entre los datos de la muestra. Para su análisis
e interpretación, se dividen en dos tipos, de acuerdo al
número de datos que agrupan: datos no agrupados y
agrupados.
3. RANGO
El rango en un conjunto de datos ordenados ascendentemente, es una
medida que nos indica su dispersión en una muestra. Sin embargo, como
depende únicamente de los datos extremos de la población, no proporciona
información real de la dispersión entre ellos. Si trabajamos con datos no
agrupados, primero se ordenan y el Rango se calcula con la siguiente
formula.
mMR
Donde:
R = Rango
XM = Dato mayor de la muestra
Xm = Dato menor de la muestra
4. DESVIACIÓN MEDIA
En un conjunto de datos la desviación media se obtiene de la diferencia de
cada uno de los datos con respecto a la media aritmética; si consideramos
los datos reales de estas desviaciones, no obtenemos la dispersión de los
datos, por lo que debemos considerar su valor absoluto. El valor absoluto de
una cantidad es igual a la misma cantidad sin considerar el signo. Si el
conjunto de datos es no agrupado, la desviación media se calcula con la
siguiente fórmula:
n
xx
Dm
Donde:
Dm = Desviación media
(sigma) = sumatoria
// = Valor absoluto
x = datos de la muestra
x (“x” testada) = media aritmética
5. VARIANZA
Representa el promedio de las desviaciones medias de un conjunto de datos.
Si se trabaja con un conjunto de datos no agrupados la varianza se calcula
con la siguiente formula.
1
2
2
2
S
Donde:
S2 = Varianza
(sigma) = sumatoria
x = datos de la muestra
n = total de datos de la muestra
6. DESVIACIÓN ESTANDAR
Se define como la raíz cuadrada de la varianza y es particularmente útil para
muchos fines prácticos, ya que se expresa en las mismas unidades que las de
los datos de la muestra. Si se analiza un conjunto de datos no agrupados, se
calcula aplicando la siguiente formula.
2
Ds
Donde:
Ds = Desviación estándar
S2 = Varianza
7. COEFICIENTE DE VARIACIÓN
Es una medida relativa que nos permite calcular el porcentaje de variación
de los datos en un conjunto dado. Se utiliza para comparar las variaciones de
dos o más conjunto de datos, ya que el porcentaje obtenido representa
como se distribuyen los datos alrededor de la media. Para un conjunto de
datos no agrupados, se calcula con la siguiente formula.
100*
Ds
Cv
Donde:
Cv = Coeficiente de variación
Ds = Desviación estándar
x = Media Aritmética
8. EJEMPLO
Calcular las medidas descriptivas del siguiente conjunto de datos no
agrupados:
15 19 20 17 20 16 15 17 17 16 18 18 18 17 16
Resolución
Lo primero es ordenar los datos del menor al mayor, es decir, realizar el orden
de rango.
ORDEN DE RANGO
15 16 17 18 19
15 16 17 18 20
16 17 17 18 20
13. COEFICIENTE DE VARIACIÓN
Conclusión: de acuerdo al resultado del
coeficiente de variación, 9.09 %, se puede
concluir que la dispersión de los datos es muy
reducida, es decir, que no existe una variación
amplia entre los datos del problema; lo que se
traduce en un conjunto de datos estable y
compacto.