1. REALIZADO POR ALBA GUTIÉRREZ ÁLVAREZ
GRUPO 6
U.D. VIRGEN DEL ROCÍO
Actividades del Seminario 5 de
Estadísticas y TICS
2. - En este quinto seminario de Estadísticas y TICS, tuvimos que realizar un
actividad en relación con un estudio sobre el volumen corpuscular de
hematies (VCH).
- Lo primero que realizamos fue hacer una tabla de datos, a traves
del programa estadístico SPSS, donde introducimos todos los datos de
la muestra realizada, así como los datos obtenidos. La tabla con los datos del
estudio, donde quedan reflajadas las tres variables estudiadas en el estudio
(que fueron el sexo, el volumen corpuscular de hematíes (VCH) y la
edad), quedó de la siguiente forma:
3. -Tras realizar la tabla con las variables estudiadas, la primera actividad
consistía en calcular la media, la moda, la varianza, la desviación típica y el
rango de las variables "edad" y "VCH".
-A modo de introducción, la media aritmética es el valor obtenido al sumar
todos los datos y dividir el resultado entre el número total de datos.
El cálculo de la media aritmética de la muestra dada es la siguiente:
1ª Actividad
4.
5. Tras la media aritmética, calculamos la moda, que es el valor que tiene
mayor frecuencia absoluta, es decir, el valor que más veces se repite.
- En la moda de la variable edad, los dos valores que tienen mayor frecuencia
(se repiten dos veces) son las edades de 38 y 59 años.
-En la moda de la variable VCH, también son dos valores los que se repiten,
en este caso tres veces, y son 90 y 92 cm³.
A continuación. pasamos a calcular la varianza. La varianza en estadísticas es
la media aritmética del cuadrado de las desviaciones respecto a la media de
una distribución estadística. Se representa por σ² . La fórmula para su
resolución es la siguiente:
6. Para calcular la varianza, primero debemos de calcular la media aritmética,
pero ya la tenemos calculada del primer ejercicio:
7.
8. Ahora, debemos de calcular la desviación típica.
La desviación típica es la raíz cuadrada de la varianza, y se
representa con la letra griega
Como la varianza ya la tenemos calculada de la actividad anterior,
para la desviación típica solo tendremos que calcular la raíz.
La desviación típica de la variable edad sería:
La desviación típica de la variable VCH sería:
9. Lo último que nos piden calcular es el rango de ambas
variables.
El rango es la diferencia entre el mayor y el menor de los
datos de una distribución estadística.
El rango de la variable edad sería:
El rango de la variable VCH es:
10. La segunda actividad de este quinto seminario es, mediante el
programa estadístico de SPSS (PASW 18), obtener las frecuencias
de las variables “sexo”, “edad” y “VCH”.
Mediante el programa PASW 18 obtenemos en forma de tabla de
frecuencias, las frecuencias de las tres variables:
2º Actividad
11. 3ª Actividad
La tercera actividad consiste en crear gráficos para conocer la
distribución de cada una de estas variables.
Para ello, de nuevo desde PASW 18 , nos vamos al cuadro de
frecuencias, elegimos las variables que queramos y hacemos click en la
opción de “gráficos”:
12. • Interpretación de la gráfica de “sexo”: para la variable sexo hemos
elegido un gráfico de sectores, ya que se trata de una variable cualitativa
dicotómica. En dicho gráfico, podemos observar que hay el mismo
número de mujeres que de hombres, en total 20 individuos (de color azul
está representado el número de mujeres y el color verde corresponde al
número de hombres).
13. • Interpretación del gráfico de la variable “edad”: para la edad (variable
cuantitativa) hemos elegido un gráfico de barras. En él podemos observar
como en la edad de 38 años (la edad viene representada en el eje horizontal)
hay doy dos individuos (el número de individuos está representado en el eje
vertical). Así mismo, también hay dos individuos con 59 años. De las demás
edades representadas, solo hay un individuo por edad.
14. • Interpretación del gráfico de la variable “VCH”: para esta variable,
hemos elegido un gráfico llamado histograma, donde se muestran los
resultados en forma de barras. En él, podemos observar como el número
de volumen corpuscular de hematíes entre 85 y 90 mL tiene la frecuencia
mayor, es decir, las personas estudiadas presentan con una mayor
frecuencia dicho volumen corpuscular de hematíes.
•Así mismo, la forma que presenta el histograma viene dada en forma de
“campana de Gauss”, ya que los datos que representan nuestra muestra
se ajustan a una distribución normal.
4ª Actividad
La cuarta actividad consistía en crear un gráfico que relacionara las variables
“VCH” y “sexo”.
El gráfico que elegimos fue un gráfico de cajas y bigotes, y una vez elegido el
gráfico, seleccionamos las dos variables y aceptamos.
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un
segmento vertical que indica donde está la mediana y por lo tanto, su relación con
los cuartiles primero y tercero (el segundo cuartil coincide con la mediana)
15. Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja
se llaman bigotes. Estos bigotes tienen un límite d prolongación, de modo
que cualquier dato que no se encuentre dentro de este rango será marcado e
identificado de forma individual.
El gráfico de caja y bigotes quedó así:
16. • Interpretación del gráfico de caja y bigotes: en este gráfico vienen
representadas las variables “sexo” y “VCH”.
En el caso de las mujeres, podemos observar como la media del VCH es
aproximadamente unos 88 mL, y que el valor máximo es de 100 mL y el valor
mínimo de unos 78 mL.
En el caso del hombre, observamos como la media alcanza un valor superior
de 92 mL, y los valores máximo y mínimo son, respectivamente, de 103 y 79
mL.
17. 5ª Actividad
La quinta y última actividad consistía en crear una tabla de contingencia que
relacionara la “edad” y el “sexo”.
La tabla de contingencia se usan cuando vamos a analizar la relación entre dos o
más variables, que en este caso son el “sexo” y la “edad”.
Para realizar dicha tabal desde el programa PASW 18, seleccionamos, dentro de la
pestaña “Estadísticos descriptivos”, “Tablas de contingencia”. A continuación
seleccionamos ambas variables y aceptamos, obteniendo lo siguiente:
18. • Interpretación de la tabla de contingencia: en la tabla mostrada
anteriormente, podemos observar la relación entre las edades y la cantidad de
hombres y mujeres que hay en cada edad. Por ejemplo, podemos ver como a
la edad de 38 años, hay un total de dos personas (un hombre y una mujer).
Y hasta aquí todo lo relacionado con las actividades del quinto seminario.