SlideShare une entreprise Scribd logo
1  sur  14
Medidas de dispersión<br />De Wikipedia, la enciclopedia libre<br />Saltar a navegación, búsqueda<br />Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.<br />Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).<br />Contenido[ocultar]1 Rango estadístico 1.1 Requisitos del rango 1.1.1 Ejemplo 2 Varianza 2.1 Propiedades 3 Desviación típica 3.1 Desviación típica muestral 3.2 Desviación típica poblacional 3.2.1 Ejemplo 4 Covarianza 4.1 Ejemplo 5 Coeficiente de Correlación de Pearson 5.1 Propiedades 5.1.1 Ejemplo 6 Véase también <br />Rango estadístico [editar]<br />El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios. Se le suele simbolizar con R.<br />Requisitos del rango [editar]<br />Ordenamos los números según su tamaño. <br />Restamos el valor mínimo del valor máximo. <br />Ejemplo [editar]<br />Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en un rango de:<br />Rango = 100 – 1 =99 <br />Varianza [editar]<br />La varianza, también denominada variancia, es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.<br />Propiedades [editar]<br />La varianza es siempre positiva o 0: <br />Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica. <br />Yi = Xi + k c <br />Si a los datos de la distribución les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante. <br />Propiedad distributiva: V(X + Y) = V(X) + V(Y) <br />Desviación típica [editar]<br />La variancia a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la desviación típica, o desviación standard, que se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por S, dado que es su inicial de su nominación en inglés.<br />Desviación típica muestral [editar]<br />Desviación típica poblacional [editar]<br />Ejemplo [editar]<br />Con Scilab este cálculo se hace de la siguiente manera:<br />-->x= [17 14 2 5 8 7 6 8 5 4 3 15 9]<br /> x  =<br />    17.    14.    2.    5.    8.    7.    6.    8.    5.    4.    3.    15.    9.<br />-->stdev(x)<br /> ans  =<br />    4.716311<br />--><br />Primero hemos declarado un vector con nombre X, donde introduzco los números de la serie. Luego con el comando stdev se hallará la desviación típica.<br />Covarianza [editar]<br />La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (σ) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra quot;
s_{xy}quot;
.<br />La formula suele aparecer expresada como:<br />Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas).<br />La expresión se resuelve promediando el producto de las puntuaciones diferenciales por su tamaño muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadístico, refleja la relación lineal que existe entre dos variables. El resultado numérico fluctua entre los rangos de +infinito a -infinito. Al no tener unos límites establecidos no puede determinarse el grado de relación lineal que existe entre las dos variables, solo es posible ver la tendencia.<br />Ejemplo [editar]<br />Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre)<br />-->x=[10 20 30 40]Vector de datos X<br /> x  =<br />    10.    20.    30.    40.<br />-->y=[10 20 30 40]Vector de datos H<br /> y  =<br />    10.    20.    30.    40.<br />-->fre=[.20 .04 .01  0;Matriz de frecuencias<br />-->     .10 .36 .09  0;<br />-->       0 .05 .10  0;<br />-->       0   0   0 .05]<br /> fre  =<br />    0.2    0.04    0.01    0.<br />    0.1    0.36    0.09    0.<br />    0.     0.05    0.1     0.<br />    0.     0.      0.      0.05<br />-->s=covar(x,y,fre)Aplicación del Comando covar<br /> s  =<br />    49.<br />Coeficiente de Correlación de Pearson [editar]<br />El coeficiente de correlación de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones típicas (raíz cuadrada de las varianzas).<br />Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:<br />Propiedades [editar]<br />El coeficiente de correlación, r, presenta valores entre –1 y +1. <br />Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. <br />Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. <br />Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente. <br />Ejemplo [editar]<br />Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre)<br />-->x=[2.5 7.5 12.5 17.5] Vector de datos X<br />x  =<br />   2.5    7.5    12.5    17.5<br />-->h=[0 1 2] Vector de datos H<br />h  =<br />   0.    1.    2.<br />-->fre=[.03 .12 .07;.02 .13 .11;.01 .13 .14;.01 .09 .14] Matriz de frecuencias<br />fre  =<br />   0.03    0.12    0.07<br />   0.02    0.13    0.11<br />   0.01    0.13    0.14<br />   0.01    0.09    0.14<br />-->rho=correl(x,h,fre) Aplicación del Comando correl<br />MEDIDAS DE DISPERSIÓN<br />A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de información que aportan individualmente, no hay que dejar de señalar que en muchas ocasiones esa información, no sólo no es completa, sino que puede inducir a errores en su interpretación. Veamos algunos ejemplos.<br />Consideremos dos grupos de personas extraídos como muestras respectivas de dos poblaciones distintas: el primero está compuesto por 100 personas que asisten a la proyección de una película para niños, y el segundo por 100 personas elegidas entre los asistentes a una discoteca juvenil. Pudiera ocurrir que, aun siendo las distribuciones de las edades de ambos grupos muy distinta, la media y la mediana coincidieran para ambas. (Da un ejemplo concreto en que esto ocurra).<br />Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes entradas en miles de pesos, a lo largo de dos semanas correspondientes a épocas distintas del año<br />1ª semana2ª semana10302040305050506060806010060350350<br />La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los dos casos) y, sin embargo, las consecuencias que se podrían derivar de una y otra tabla son bien distintas.<br />Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras medidas, aparte de los valores de centralización, que nos indiquen la mayor o menor desviación de cada observación respecto de aquellos valores.<br />Las medidas de desviación, variación o dispersión que estudiaremos a continuación son: Rango o amplitud, desviación media y desviación típica.<br />RANGO, AMPLITUD TOTAL O RECORRIDO<br />El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la que proporciona menos información. Además, esta información puede ser errónea, pues el hecho de que no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad.<br />Comparemos, por ejemplo, estas dos series:<br />Serie 1: 1  5  7  7    8    9    9  10  17<br />Serie 2: 2  4  6  8  10  12  14  16  18<br />Ambas series tienen rango 16, pero están desigualmente agrupadas, pues mientras la primera tiene una mayor concentración en el centro, la segunda se distribuye uniformemente a lo largo de todo el recorrido.<br />El uso de esta medida de dispersión, será pues, bastante restringido.<br />DESVIACIÓN MEDIA<br />En teoría, la desviación puede referirse a cada una de las medidas de tendencia central: media, mediana o moda; pero el interés se suele centrar en la medida de la desviación con respecto a la media, que llamaremos desviación media.<br />Puede definirse como la media aritmética de las desviaciones de cada uno de los valores con respecto a la media aritmética de la distribución, y de indica así:<br />Nótese que se toman las desviaciones en valor absoluto, es decir, que la fórmula no distingue si la diferencia de cada valor de la variable con la media es en más o en menos.<br />Ya se habrá advertido que esta expresión sirve para calcular la desviación media en el caso de datos sin agrupar. Veamos un ejemplo:<br />Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media de estos valores.<br />x2-332334-114-114-11500611722833833<br />DM = 1,8<br />Veamos ahora cómo se calcula la desviación media en el caso de datos agrupados en intervalos.<br />donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de los intervalos correspondientes.<br />Además, las desviaciones son de cada centro, o marca de clase, a la media aritmética. Es decir,<br />Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las edades de los 100 empleados de una cierta empresa:<br />Claseni16-20220-24824-28828-321832-362036-401840-441544-48848-523<br />veamos cómo se procede:<br />Clasenixmni  xmni  16-202183616,7233,4420-2482217624-28828-321832-362036-401840-441844-48848-523100<br />DM = 6,09<br />La desviación media viene a indicar el grado de concentración o de dispersión de los valores de la variable. Si es muy alta, indica gran dispersión; si es muy baja refleja un buen agrupamiento y que los valores son parecidos entre sí.<br />La desviación media se puede utilizar como medida de dispersión en todas aquellas distribuciones en las que la medida de tendencia central  más significativas haya sido la media. Sin embargo, para las mismas distribuciones es mucho más significativa la desviación típica, que estudiaremos a continuación, y eso hace que el uso de la desviación media sea cada vez más restringido.<br />DESVIACIÓN TÍPICA<br />Es sin duda la medida de dispersión más importante, ya que además sirve como medida previa al cálculo de otros valores estadísticos.<br />La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribución. Es decir,<br />para datos sin agrupar, o bien:<br />Cálculo de la desviación típica para datos no agrupados en clases<br />Veamos la fórmula anterior aplicada a un caso concreto.<br />Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.<br />x25-5,227,048-2,24,8410-0,20,04121,83,24165,833,64<br />Primero hallamos  = 10,2<br />luego S = <br />Cálculo de la desviación típica para datos agrupados en clases y agrupados por frecuencias<br />Método largo: Se aplica la siguiente fórmula<br />donde  y f es la frecuencia absoluta de cada intervalo.<br />Método abreviado o corto: La fórmula a utilizar es:<br />donde:<br />I: amplitud de la clase<br />D: distancia en clases desde cada una en concreto a la clase que contiene a la media supuesta A.<br />Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así:<br />Clasesf150 – 155155 – 160160 – 165165 – 170170 – 175175 – 180180 – 185185 – 190190 – 195195 – 200361218251710741103<br />Resp: S = 9,56<br />
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN
Medidas De DispersióN

Contenu connexe

Tendances

Medidas de Dispersion
Medidas de DispersionMedidas de Dispersion
Medidas de DispersionKirito777
 
Diapositiva Medidas de Dispersion
Diapositiva Medidas de DispersionDiapositiva Medidas de Dispersion
Diapositiva Medidas de DispersionRaquelMasters
 
1.4. medidas de dispersion
1.4. medidas de dispersion1.4. medidas de dispersion
1.4. medidas de dispersionITCM
 
Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...
Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...
Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...liliatorresfernandez
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersionshua Cruz
 
Medidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidadMedidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidadEnedina Rodriguez
 
La varianza es la media aritmética del cuadrado de estadística varianza
La varianza es la media aritmética del cuadrado de estadística varianzaLa varianza es la media aritmética del cuadrado de estadística varianza
La varianza es la media aritmética del cuadrado de estadística varianzaeldieguito123
 
Medidas de variabilidad y Distribución Normal
Medidas de variabilidad y Distribución NormalMedidas de variabilidad y Distribución Normal
Medidas de variabilidad y Distribución NormalMaría Isabel Bautista
 
Medidas de Dispersión o Variabilidad
Medidas de Dispersión o VariabilidadMedidas de Dispersión o Variabilidad
Medidas de Dispersión o Variabilidadjgbd127
 

Tendances (20)

Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Medidas de Dispersion
Medidas de DispersionMedidas de Dispersion
Medidas de Dispersion
 
Medidas de Dispersion
Medidas de DispersionMedidas de Dispersion
Medidas de Dispersion
 
Diapositiva Medidas de Dispersion
Diapositiva Medidas de DispersionDiapositiva Medidas de Dispersion
Diapositiva Medidas de Dispersion
 
1.4. medidas de dispersion
1.4. medidas de dispersion1.4. medidas de dispersion
1.4. medidas de dispersion
 
Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...
Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...
Medidas de dispersión de rango, desviación, media cuarticular, estandar y coe...
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
MEDIDAS DE DISPERSION DE DATOS
MEDIDAS DE DISPERSION DE DATOSMEDIDAS DE DISPERSION DE DATOS
MEDIDAS DE DISPERSION DE DATOS
 
Medidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidadMedidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidad
 
La varianza es la media aritmética del cuadrado de estadística varianza
La varianza es la media aritmética del cuadrado de estadística varianzaLa varianza es la media aritmética del cuadrado de estadística varianza
La varianza es la media aritmética del cuadrado de estadística varianza
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Medidas De Dispersion
Medidas De DispersionMedidas De Dispersion
Medidas De Dispersion
 
Medidas de variabilidad y Distribución Normal
Medidas de variabilidad y Distribución NormalMedidas de variabilidad y Distribución Normal
Medidas de variabilidad y Distribución Normal
 
Medidas de Dispersion
Medidas de DispersionMedidas de Dispersion
Medidas de Dispersion
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersión
 
Medidas de Dispersión o Variabilidad
Medidas de Dispersión o VariabilidadMedidas de Dispersión o Variabilidad
Medidas de Dispersión o Variabilidad
 
Medidas de Dispersión
Medidas de DispersiónMedidas de Dispersión
Medidas de Dispersión
 
Resumen Medidas de Variabilidad
Resumen Medidas de VariabilidadResumen Medidas de Variabilidad
Resumen Medidas de Variabilidad
 
Varianza
VarianzaVarianza
Varianza
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersión
 

Similaire à Medidas De DispersióN

M E D I D A S D E T E N D E N C I A C E N T R A L
M E D I D A S  D E  T E N D E N C I A  C E N T R A LM E D I D A S  D E  T E N D E N C I A  C E N T R A L
M E D I D A S D E T E N D E N C I A C E N T R A LEnder Melean
 
Medidas de dispersion_prof hector
Medidas de dispersion_prof hectorMedidas de dispersion_prof hector
Medidas de dispersion_prof hectornchacinp
 
medidas de dispercion
medidas de dispercionmedidas de dispercion
medidas de dispercionluisllovera92
 
Ppt estadistica descriptiva dispersion
Ppt estadistica descriptiva dispersionPpt estadistica descriptiva dispersion
Ppt estadistica descriptiva dispersionlsandoval46
 
Medidas de Dispersión .
Medidas de Dispersión .Medidas de Dispersión .
Medidas de Dispersión .Valentina
 
Unidad Iii Estadistica 3
Unidad Iii Estadistica 3Unidad Iii Estadistica 3
Unidad Iii Estadistica 3No answer
 
Medidas de tendencia, conceptos basicos
Medidas de tendencia, conceptos basicosMedidas de tendencia, conceptos basicos
Medidas de tendencia, conceptos basicosFiorellaBelenNicole
 
Medidas de Dispersion Estadistica I
Medidas de Dispersion Estadistica IMedidas de Dispersion Estadistica I
Medidas de Dispersion Estadistica IArnaly Perozo
 
estadistica inferencial
estadistica inferencialestadistica inferencial
estadistica inferencialRuben Santos
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersionVictor Milano
 
Presentación n3 medidas de dispersion
Presentación n3 medidas de dispersionPresentación n3 medidas de dispersion
Presentación n3 medidas de dispersionGustavolemusg
 
Medidas de dispersiòn Geonarkis
Medidas de dispersiòn GeonarkisMedidas de dispersiòn Geonarkis
Medidas de dispersiòn GeonarkisGEONARKIS
 
Presentación de estadistica
Presentación de estadisticaPresentación de estadistica
Presentación de estadisticaSebastian Delgado
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersiónLuis Ramirez S
 

Similaire à Medidas De DispersióN (20)

Medidas de Dispersion
Medidas de DispersionMedidas de Dispersion
Medidas de Dispersion
 
M E D I D A S D E T E N D E N C I A C E N T R A L
M E D I D A S  D E  T E N D E N C I A  C E N T R A LM E D I D A S  D E  T E N D E N C I A  C E N T R A L
M E D I D A S D E T E N D E N C I A C E N T R A L
 
Medidas de dispersion_prof hector
Medidas de dispersion_prof hectorMedidas de dispersion_prof hector
Medidas de dispersion_prof hector
 
medidas de dispercion
medidas de dispercionmedidas de dispercion
medidas de dispercion
 
Ppt estadistica descriptiva dispersion
Ppt estadistica descriptiva dispersionPpt estadistica descriptiva dispersion
Ppt estadistica descriptiva dispersion
 
Presentación 2 estadistica
Presentación 2   estadisticaPresentación 2   estadistica
Presentación 2 estadistica
 
Medidas de Dispersión .
Medidas de Dispersión .Medidas de Dispersión .
Medidas de Dispersión .
 
Unidad Iii Estadistica 3
Unidad Iii Estadistica 3Unidad Iii Estadistica 3
Unidad Iii Estadistica 3
 
Medidas de tendencia, conceptos basicos
Medidas de tendencia, conceptos basicosMedidas de tendencia, conceptos basicos
Medidas de tendencia, conceptos basicos
 
Medidas de Dispersion Estadistica I
Medidas de Dispersion Estadistica IMedidas de Dispersion Estadistica I
Medidas de Dispersion Estadistica I
 
estadistica inferencial
estadistica inferencialestadistica inferencial
estadistica inferencial
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Presentación n3 medidas de dispersion
Presentación n3 medidas de dispersionPresentación n3 medidas de dispersion
Presentación n3 medidas de dispersion
 
Tema 2 presentación
Tema 2 presentaciónTema 2 presentación
Tema 2 presentación
 
Medidas de dispersiòn Geonarkis
Medidas de dispersiòn GeonarkisMedidas de dispersiòn Geonarkis
Medidas de dispersiòn Geonarkis
 
Presentación de estadistica
Presentación de estadisticaPresentación de estadistica
Presentación de estadistica
 
Media aritmética
Media aritméticaMedia aritmética
Media aritmética
 
Medidas de dispersión
Medidas de dispersiónMedidas de dispersión
Medidas de dispersión
 

Medidas De DispersióN

  • 1. Medidas de dispersión<br />De Wikipedia, la enciclopedia libre<br />Saltar a navegación, búsqueda<br />Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.<br />Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).<br />Contenido[ocultar]1 Rango estadístico 1.1 Requisitos del rango 1.1.1 Ejemplo 2 Varianza 2.1 Propiedades 3 Desviación típica 3.1 Desviación típica muestral 3.2 Desviación típica poblacional 3.2.1 Ejemplo 4 Covarianza 4.1 Ejemplo 5 Coeficiente de Correlación de Pearson 5.1 Propiedades 5.1.1 Ejemplo 6 Véase también <br />Rango estadístico [editar]<br />El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios. Se le suele simbolizar con R.<br />Requisitos del rango [editar]<br />Ordenamos los números según su tamaño. <br />Restamos el valor mínimo del valor máximo. <br />Ejemplo [editar]<br />Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en un rango de:<br />Rango = 100 – 1 =99 <br />Varianza [editar]<br />La varianza, también denominada variancia, es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.<br />Propiedades [editar]<br />La varianza es siempre positiva o 0: <br />Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica. <br />Yi = Xi + k c <br />Si a los datos de la distribución les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante. <br />Propiedad distributiva: V(X + Y) = V(X) + V(Y) <br />Desviación típica [editar]<br />La variancia a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la desviación típica, o desviación standard, que se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por S, dado que es su inicial de su nominación en inglés.<br />Desviación típica muestral [editar]<br />Desviación típica poblacional [editar]<br />Ejemplo [editar]<br />Con Scilab este cálculo se hace de la siguiente manera:<br />-->x= [17 14 2 5 8 7 6 8 5 4 3 15 9]<br /> x =<br /> 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.<br />-->stdev(x)<br /> ans =<br /> 4.716311<br />--><br />Primero hemos declarado un vector con nombre X, donde introduzco los números de la serie. Luego con el comando stdev se hallará la desviación típica.<br />Covarianza [editar]<br />La covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. La formulación clásica, se simboliza por la letra griega sigma (σ) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra quot; s_{xy}quot; .<br />La formula suele aparecer expresada como:<br />Este tipo de estadístico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas).<br />La expresión se resuelve promediando el producto de las puntuaciones diferenciales por su tamaño muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadístico, refleja la relación lineal que existe entre dos variables. El resultado numérico fluctua entre los rangos de +infinito a -infinito. Al no tener unos límites establecidos no puede determinarse el grado de relación lineal que existe entre las dos variables, solo es posible ver la tendencia.<br />Ejemplo [editar]<br />Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre)<br />-->x=[10 20 30 40]Vector de datos X<br /> x =<br /> 10. 20. 30. 40.<br />-->y=[10 20 30 40]Vector de datos H<br /> y =<br /> 10. 20. 30. 40.<br />-->fre=[.20 .04 .01 0;Matriz de frecuencias<br />--> .10 .36 .09 0;<br />--> 0 .05 .10 0;<br />--> 0 0 0 .05]<br /> fre =<br /> 0.2 0.04 0.01 0.<br /> 0.1 0.36 0.09 0.<br /> 0. 0.05 0.1 0.<br /> 0. 0. 0. 0.05<br />-->s=covar(x,y,fre)Aplicación del Comando covar<br /> s =<br /> 49.<br />Coeficiente de Correlación de Pearson [editar]<br />El coeficiente de correlación de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones típicas (raíz cuadrada de las varianzas).<br />Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:<br />Propiedades [editar]<br />El coeficiente de correlación, r, presenta valores entre –1 y +1. <br />Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión. <br />Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente. <br />Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente. <br />Ejemplo [editar]<br />Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre)<br />-->x=[2.5 7.5 12.5 17.5] Vector de datos X<br />x =<br /> 2.5 7.5 12.5 17.5<br />-->h=[0 1 2] Vector de datos H<br />h =<br /> 0. 1. 2.<br />-->fre=[.03 .12 .07;.02 .13 .11;.01 .13 .14;.01 .09 .14] Matriz de frecuencias<br />fre =<br /> 0.03 0.12 0.07<br /> 0.02 0.13 0.11<br /> 0.01 0.13 0.14<br /> 0.01 0.09 0.14<br />-->rho=correl(x,h,fre) Aplicación del Comando correl<br />MEDIDAS DE DISPERSIÓN<br />A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de información que aportan individualmente, no hay que dejar de señalar que en muchas ocasiones esa información, no sólo no es completa, sino que puede inducir a errores en su interpretación. Veamos algunos ejemplos.<br />Consideremos dos grupos de personas extraídos como muestras respectivas de dos poblaciones distintas: el primero está compuesto por 100 personas que asisten a la proyección de una película para niños, y el segundo por 100 personas elegidas entre los asistentes a una discoteca juvenil. Pudiera ocurrir que, aun siendo las distribuciones de las edades de ambos grupos muy distinta, la media y la mediana coincidieran para ambas. (Da un ejemplo concreto en que esto ocurra).<br />Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes entradas en miles de pesos, a lo largo de dos semanas correspondientes a épocas distintas del año<br />1ª semana2ª semana10302040305050506060806010060350350<br />La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los dos casos) y, sin embargo, las consecuencias que se podrían derivar de una y otra tabla son bien distintas.<br />Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras medidas, aparte de los valores de centralización, que nos indiquen la mayor o menor desviación de cada observación respecto de aquellos valores.<br />Las medidas de desviación, variación o dispersión que estudiaremos a continuación son: Rango o amplitud, desviación media y desviación típica.<br />RANGO, AMPLITUD TOTAL O RECORRIDO<br />El rango se suele definir como la diferencia entre los dos valores extremos que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la que proporciona menos información. Además, esta información puede ser errónea, pues el hecho de que no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad.<br />Comparemos, por ejemplo, estas dos series:<br />Serie 1: 1 5 7 7 8 9 9 10 17<br />Serie 2: 2 4 6 8 10 12 14 16 18<br />Ambas series tienen rango 16, pero están desigualmente agrupadas, pues mientras la primera tiene una mayor concentración en el centro, la segunda se distribuye uniformemente a lo largo de todo el recorrido.<br />El uso de esta medida de dispersión, será pues, bastante restringido.<br />DESVIACIÓN MEDIA<br />En teoría, la desviación puede referirse a cada una de las medidas de tendencia central: media, mediana o moda; pero el interés se suele centrar en la medida de la desviación con respecto a la media, que llamaremos desviación media.<br />Puede definirse como la media aritmética de las desviaciones de cada uno de los valores con respecto a la media aritmética de la distribución, y de indica así:<br />Nótese que se toman las desviaciones en valor absoluto, es decir, que la fórmula no distingue si la diferencia de cada valor de la variable con la media es en más o en menos.<br />Ya se habrá advertido que esta expresión sirve para calcular la desviación media en el caso de datos sin agrupar. Veamos un ejemplo:<br />Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviación media de estos valores.<br />x2-332334-114-114-11500611722833833<br />DM = 1,8<br />Veamos ahora cómo se calcula la desviación media en el caso de datos agrupados en intervalos.<br />donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de los intervalos correspondientes.<br />Además, las desviaciones son de cada centro, o marca de clase, a la media aritmética. Es decir,<br />Ejemplo: Para hallar la desviación media de la siguiente tabla referida a las edades de los 100 empleados de una cierta empresa:<br />Claseni16-20220-24824-28828-321832-362036-401840-441544-48848-523<br />veamos cómo se procede:<br />Clasenixmni xmni 16-202183616,7233,4420-2482217624-28828-321832-362036-401840-441844-48848-523100<br />DM = 6,09<br />La desviación media viene a indicar el grado de concentración o de dispersión de los valores de la variable. Si es muy alta, indica gran dispersión; si es muy baja refleja un buen agrupamiento y que los valores son parecidos entre sí.<br />La desviación media se puede utilizar como medida de dispersión en todas aquellas distribuciones en las que la medida de tendencia central más significativas haya sido la media. Sin embargo, para las mismas distribuciones es mucho más significativa la desviación típica, que estudiaremos a continuación, y eso hace que el uso de la desviación media sea cada vez más restringido.<br />DESVIACIÓN TÍPICA<br />Es sin duda la medida de dispersión más importante, ya que además sirve como medida previa al cálculo de otros valores estadísticos.<br />La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribución. Es decir,<br />para datos sin agrupar, o bien:<br />Cálculo de la desviación típica para datos no agrupados en clases<br />Veamos la fórmula anterior aplicada a un caso concreto.<br />Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.<br />x25-5,227,048-2,24,8410-0,20,04121,83,24165,833,64<br />Primero hallamos = 10,2<br />luego S = <br />Cálculo de la desviación típica para datos agrupados en clases y agrupados por frecuencias<br />Método largo: Se aplica la siguiente fórmula<br />donde y f es la frecuencia absoluta de cada intervalo.<br />Método abreviado o corto: La fórmula a utilizar es:<br />donde:<br />I: amplitud de la clase<br />D: distancia en clases desde cada una en concreto a la clase que contiene a la media supuesta A.<br />Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así:<br />Clasesf150 – 155155 – 160160 – 165165 – 170170 – 175175 – 180180 – 185185 – 190190 – 195195 – 200361218251710741103<br />Resp: S = 9,56<br />