2. El procesamiento de datos
Luego de las tareas de recolección, el investigador
tiene una serie de datos.
Con ese conjunto de datos, al principio, no se podrá
realizar una síntesis.
Es necesario realizar sobre el conjunto de datos una
serie de actividades tendientes a organizarlo. Esas
acciones se llaman procesamiento de datos.
3. La división de datos
Primero se dividen los datos en:
• Datos numéricos: se procesan agrupándolos en intervalos, se
tabulan, se construyen cuadros estadísticos para exponerlos en forma
clara y fácilmente asimilable.
• Datos verbales: pueden tener dos procesos diferentes:
– Se transforman en datos numéricos: primero los datos se
codifican, luego se tabulan y se construyen los cuadros.
– Permanecen como datos verbales: los datos quedan como
información no cuantificada, cualitativa.
Si se ha realizado una serie de entrevistas, de tipo no estructurado, pueden
cuantificarse algunos de los datos obtenidos (el número de entrevistados por
sexo y edad, la respuesta a alguna pregunta específica), en tanto que otras
informaciones se mantendrán en su forma verbal, como paradigmas o
ejemplos de las opiniones de la muestra.
4. La codificación de datos I
El objetivo es agrupar numéricamente los datos verbales,
para luego poder trabajar con ellos como si se tratara de datos
cuantitativos.
Pasos:
1) Revisar un subgrupo de datos con el fin de encontrar una
tipología de respuestas posible.
2) A cada categoría de respuestas le damos un código particular
(un número o una letra), que servirá para agrupar todas las
respuestas u observaciones que sean idénticas o se parezcan.
3) Luego se señala con el código correspondiente cada una de
las
respuestas, con lo que se sistematiza.
5. La codificación de datos II
Con una pregunta abierta, se pide a un grupo de personas
que diga qué piensa sobre los reality show. La codificación
nos permitirá agrupar sus respuestas, para poder evaluar
cuáles son las opiniones más salientes al respecto. Los
códigos podrían ser:
– Es un tipo de programa entretenido.
– Es un tipo de programa aburrido.
– Es un tipo de programa que idiotiza a la audiencia.
– No sabe o no opina al respecto.
Luego de la codificación, se puede realizar la tabulación.
6. La tabulación de datos I
Tabulación viene de la palabra latina tabula y
significa hacer tablas, listados de datos que los
muestren agrupados y contabilizados.
Se cuenta cada una de las respuestas que aparecen y
luego se distribuyen de acuerdo con los códigos
previamente fijados.
El resultado de la tabulación será el cómputo
ordenado de las respuestas.
7. La tabulación de datos II
• Ejemplo:
Se entrevistaron a 50 personas que migraron del
campo a la ciudad para que averiguar las causas
de esa migración. Después de la codificación, se
puede tener una lista de motivos de migración.
– Motivos económicos
– Motivos de salud
– Motivos familiares
– Motivos educacionales
– Otros motivos
8. La tabulación de datos III
Total entrevistados: 50
Total responden a la pregunta: 46
Motivos indicados
1. Motivos económicos 27
2. Motivos de salud 2
3. Motivos familiares 12
4. Motivos educacionales 11
5. Otros motivos 3
Total respuestas: 55
9. Cuadros estadísticos
Luego de tabular la información, hay que presentar los
resultados, para que resulten fácilmente comprensibles.
Ante todo, cada cuadro debe estar correctamente titulado.
Luego de encontrar un título para el cuadro, lo siguiente es
convertir en porcentajes las cifras reales (cifras absolutas)
que se obtuvieron en la tabulación.
El valor en función del cual se hace el cálculo de los porcentajes se
llama base de porcentaje.
Cuando la base es un número demasiado pequeño (menor de 15
o 20 casos) se suele presentar la información en cifras absolutas
y no relativas, porque puede inducir a que el lector se hiciese una
idea falsa acerca de la exactitud de la información.
10. Cuadros de una sola variable
Modelo 1
EDADES DE LOS ENTREVISTADOS
Total de la muestra 250
Total respondieron 247
%
Hasta 25 años 30
De 26 a 39 años 25
De 40 a 59 años 21
De 60 años y más 24
Modelo 2
EDADES DE LOS ENTREVISTADOS
Hasta 25 años 30 %
De 26 a 39 años 25 %
De 40 a 59 años 21 %
De 60 años y más 24 %
(247)
Total de la muestra 250 (100 %)
11. Cuadros con dos o más variables I
Son los que presentan el comportamiento
simultáneo de más de una variable, pretendiendo
mostrar sus relaciones recíprocas.
Surgen de las tabulaciones cruzadas y se llaman
cuadros de doble o triple entrada, según la
cantidad de variables incluidas en ellos.
La variable independiente se coloca horizontalmente,
mientras que la dependiente se sitúa en la vertical.
12. Cuadros con dos o más variables II
Opiniones Edades (años)
Hasta 25 26 a 39 40 y más Total
Total entrevistas 83 103 61 247
% % % %
A favor 17 28 44 28
En contra 23 22 25 23
Neutral 52 47 20 42
No sabe/ no 8 3 11 7
contesta
13. Graficación
La graficación deriva de la actividad anterior y consiste en
expresar visualmente los valores numéricos que aparecen en
los cuadros.
La calidad de un gráfico consiste en comunicar ideas complejas
con claridad, precisión y eficiencia.
Favorecen la comparación entre diferentes grupos de datos o la
relación entre ellos. Se recomienda presentar la información en
porcentajes (frecuencias relativas).
Deben ser autoexplicativos (título apropiado, unidades de
medida, ejes rotulados, referencias si es necesario, etc.).
Fuente: Laboratorio de estadística, Stella Maris Diez.
14. Presentación gráfica
El eje vertical (ordenada) debe comenzar en cero.
1000 1000
Alumnos Matriculados
Alumnos Matriculados
800
800
600
600 400
200
400
0
2006 2007 2008 2009 2010
2006 2007 2008 2009 2010
Año
Año
Institución A Institución B
Institución A Institución B
No son recomendables los gráficos 3D. A
D 20%
32%
C B
10% 38%
Fuente: Laboratorio de estadística, Stella Maris Diez.
15. Presentación gráfica I
• De variables categóricas
X: Actitud hacia los piquetes como forma de expresión de reclamos
(Si, No, NS).
Distribución de frecuencias Gráfico circular
A P O YO A L O S P I Q U E TE S
¿Está a favor de los piquetes como forma de
expresión de reclamos? NS
6%
Frecuencia Frecuencia
absoluta relativa
NO
RESPUETAS f fr (%) 30%
SI 158 64,5
SI
NO 73 29,8
64%
NS 14 5,7
Total 245 100,0
Fuente: Laboratorio de estadística, Stella Maris Diez.
16. Presentación gráfica II
• De variables cuantitativas discretas
X: cantidad de aciertos de cada alumno en una prueba multiple choice
(0 a 5)
Distribución de frecuencias Gráfico de bastones
Frec Frec.
Absoluta Relativa 40,0%
X: Cant. Aciertos f fr 30,0%
0 2 3,4% 20,0%
% Alumnos
1 3 5,1%
10,0%
2 7 11,9%
0,0%
3 22 37,3%
0 1 2 3 4 5
4 16 27,1%
Cantidad de aciertos
5 9 15,3%
Total 59 100,0%
Fuente: Laboratorio de estadística, Stella Maris Diez.
17. Presentación gráfica III
• De variables cuantitativas continuas
X: monto (en $) otorgado a cada estudiante en concepto de beca (50
a 450).
Distribución de frecuencias Histograma
X Frec.Abs. Frec.Rel. 50%
40%
% Sujetos
50 - 150 166 27,04% 30%
20%
150 - 250 271 44,14% 10%
250 - 350 115 18,73% 0%
100 200 300 400
350 - 450 62 10,10%
Montos de becas
TOTAL 614 100,00%
Fuente: Laboratorio de estadística, Stella Maris Diez.