Este documento describe diferentes medidas estadísticas de tendencia central y dispersión de datos. Explica la media, mediana y moda como medidas de tendencia central, y el rango, desviación estándar y varianza como medidas de dispersión. También define conceptos como máximo, mínimo, distribución, sesgo y curtosis.
1. Medidas de tendencia central
En estadística se conocen tres diferentes, llamadas medidas de tendencia central,
cuya utilización varía de acuerdo con lo que se desee del conjunto de datos
recolectados. Esas tres medidas de tendencia central son la media, la mediana y
la moda.
Cada una de ellas se estudiará en dos partes: primero, cuando los datos están
organizados en tablas de distribución de frecuencias simples y, segundas, cuando
están organizados en intervalos. Además, a veces difieren las fórmulas para calcular
alguna de ellas si se trata de poblaciones o demuestras. En caso de que no se diga
nada, deberá entenderse que la fórmula es la misma para ambas.
Moda:
La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia.
Un grupo de datos puede no tener moda, tener
Una moda (unimodal), dos modas (bimodal) o más de dos modas (multimodal).
Mediana:
La media, llamada también media aritmética, es la medida de tendencia central
conocida popular-mente como “promedio”.
En ocasiones se le llama media posicional, porque queda exactamente en la mitad
de un grupo de datos, luego de que los datos se han colocado de forma ordenada.
En este caso la mitad (50%) de los datos estará por encima de la mediana y la otra
mitad (50%) estará por debajo de ella. La mediana es el valor intermedio cuando los
Valores de los datos se han ordenado.
La Mediana (Me) para datos no agrupados:
1. Primero se ordenan los datos.
2. Luego se calcula la posición de la mediana con la siguiente formula: (n+1) ÷2
Donde, n es el número de datos.
Media:
Es una medida de localización central. Datos no agrupados
Es la suma de los valores de todas las observaciones divididas entre el número de
observaciones realizadas. Su fórmula es:
Donde:
= sumatoria del valor
x1, x2, x3,..., xi
n = número de observaciones
Suma:
La suma o adición. La suma o adición es la operación matemática que resulta al
reunir en unas solas varias cantidades. Los números que se suman se llaman
sumandos y el resultado suma o total.
2. Medidas de dispersión:
Las principales medidas de dispersión son tres: El rango, la desviación media y la
desviación estándar. De manera semejante a las medidas de tendencia central, las
medidas de dispersión deben considerarse en sus dos opciones: cuando no están
agrupados los datos y cuando están por intervalos.
Desviación estándar:
Se llama desviación estándar, porque con ella se pueden estandarizar en todos los
casos, todas las desviaciones de datos recolectados.
Desviación estándar se simboliza con la letra griega σsi se trata de una población y
con la letra s si se trata de una muestra.
Aquí el truco para quitar los valores negativos de la resta de es, aproximadamente,
elevar x x− al cuadrado y luego regresar con una raíz cuadrada.
Varianza:
La varianza (que es el cuadrado de la desviación estándar: σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:
1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la
diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.
Rango:
El rango de una función es equivalente al dominio, solamente que mientras éste es
sobre el eje de las x, el rango es sobre el eje de las y.
Analizado la función desde su gráfica, aunque de manera no muy formal se puede
decir que el dominio es el intervalo de valores de la x en la que existe su gráfica,
mientras que el rango es el intervalo de valores de la
Y en la que existe su gráfica.
Máximo:
En un punto en el que la derivada se anule y antes sea positiva y después del punto
negativo, se dice que la función tiene un máximo relativo. Es decir, que F'(xo) = 0 y
en ese punto, la función, pase de creciente a decreciente. En x = a la función tiene
un máximo relativo y se observa que su derivada se anula en ese punto, pasando
de positiva a negativa. (Se anula y cambia de signo). Máx en (a,f(a)).
3. Mínimo:
En un punto en el que la derivada se anule y antes sea negativa y después del punto
positiva, se dice que la función tiene un mínimo relativo. Es decir, que F'(xo) = 0 y
en ese punto, la función, pase de decreciente a creciente. En x = b la función tiene
un mínimo relativo y se observa que su derivada se anula en ese punto, pasando
de negativa a positiva. Mín en (b,f(b).
Para que una función tenga máximo o mínimo no es suficiente con que su derivada
se anule (debe, además, cambiar de signo).
Media de error:
Distribución:
Una distribución de probabilidad indica toda la gama de valores que pueden
representarse como resultado de un experimento si éste se llevase a cabo.
Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye
una herramienta fundamental para la prospectiva, puesto que se puede diseñar un
escenario de acontecimientos futuros considerando las tendencias actuales de
diversos fenómenos naturales.
Sesgo:
Error sistemático o desviaciones en los
Resultados o inferencias.
El sesgo puede ser minimizado asegurando que los
Participantes de los estudios sean:
- comparablemente seleccionados
- similarmente encuestados
Curtosis:
La curtosis mide el grado de agudeza o achatamiento de una distribución con
relación a la distribución
Normal, es decir, mide cuán puntiaguda es una distribución.