El resumen describe dos variables cualitativas y dos variables cuantitativas del conjunto de datos "activossalud". Para las variables cualitativas "tabaco" y "cerveza", se muestran las tablas de frecuencias que indican que casi la mitad de los participantes nunca han consumido tabaco, mientras que la mayoría no bebe cerveza. Para las variables cuantitativas "altura" y "comunicacionfamiliar", los resúmenes numéricos muestran que la distribución es simétrica para ambas y proporcionan estadísticas como
2. Comenzamos seleccionando dos variables
cualitativas de nuestro conjunto de datos
“activossalud”, de modo que las describiremos
en tablas de frecuencias e interpretaremos
algunos aspectos de la distribución
5. Con la tabla podemos ver que casi la mitad nunca han consumido el
tabaco. El dato de la variable que menos valores tiene es el 5.88% “2
o 3 veces al mes”. Por lo que vemos los que suelen consumirlo lo
hacen “alguna vez” (19.03%) aunque no se aleja del porcentaje de los
que lo hacen a diario (17.30)
7. En el caso de la variable “cerveza” vemos que lo más frecuente es
que no beban nunca cerveza (37.02%). Los que beben a diario solo
son un 1.38%. Sin embargo hasta un 20.76% beben cerveza en los
fines de semana, siendo el segundo valor más alto de los obtenidos.
8. Ahora vamos a escoger dos variables numéricas
del mismo conjunto de datos y mediante
resúmenes numéricos describiremos e
interpretaremos la distribución de las mismas.
9. Elegimos la variable “altura”
Marcamos para que nos den la
media, la desviación típica y el rango
intercuartilítico
10. La media es de 1.667% y la Q2 es de 1.655 por lo que al
comprobar que son casi iguales, podemos decir que la distribución
es simétrica. Otro dato que nos muestra simetría es el rango que
existe entre Q1-Q2 y Q2-Q3 es más o menos el mismo.
La desviación típica es de 0.08 y la media 1.667, lo que significa
que entre 1.58 – 1.75 se encuentra el 68.3% de los individuos.
Hay que tener en cuenta que no todos los individuos han
respondido a la pregunta.
11. Repetimos el mismo proceso pero en vez de
usar la variable “altura” seleccionamos la
siguiente variable: “comunicacionfamiliar”
12. Lo primero que llama la atención es que la mitad de los individuos se
han negado a responder esta pregunta. La media obtenida es de 7.82
y la desviación típica es de 2.82, lo que significa que entre 5.01-10.65
se encuentran el 68.3% de los individuos.
Entre la media y el primer cuartil hay una diferencia de 0.83 y entre
Q1-Q2 y Q2-Q3 hay 1 y 2 valores respectivamente. Por ello podemos
deducir que se trata de una distribución simétrica.
13. Ahora vamos a pasar a la interpretación
de las distintas gráficas que podemos
hacer con R commander.
14.
15. Podemos observar que la
minoría hacen botellón a
diario o 2 o 3 veces a la
semana.
Sin embargo una gran
mayoría si que realizan
botellón los fines de
semana.
El resultado es muy
semejante entre los que
nunca hace botellón y los
que lo hacen alguna vez al
año.
16. Con los resultados
obtenidos vemos que la
diferencia entre los que lo
realizan a diario y los que
los realizan 2 o 3 veces a
la semana con respecto a
los demás es bastante
grande.
El que más representa es
el que hace botellón solo
los fines de semana
17. Vemos que lo más
frecuente es que se
realicen menos de 5 horas
de deporte.
También vemos que lo
menos frecuente es hacer
más de diez horas de
deporte.
Como podemos ver es una
gráfica muy asimétrica
18. Hay cuatro valores
atípicos, es decir,
observaciones con valores
extremos.
La media se encuentra
entre los valores 40-45.
La distancia entre Q1-Q2 y
Q2-Q3 es muy similar, por
lo que podemos decir que
la distribución es
simétrica.
Por último el puntaje más
alto y el más bajo se
encuentra a la misma
distancia de la media