Este documento presenta una introducción al periodismo de datos. Explica cómo las herramientas digitales permiten acceder y analizar grandes cantidades de datos, detectar patrones e informar a la sociedad. También cubre temas como datos abiertos, extracción de datos, análisis estadístico, visualización de datos y ejemplos exitosos de periodismo de datos. El objetivo final es que los periodistas usen un enfoque basado en datos para mejorar la calidad de la información disponible para el público.
1. Webinario
Introducción al Periodismo
de Datos
Por Sandra Crucianelli
Knight International Journalism Fellow
www.icfj.org
scrucianelli@icfj.org
@spcrucianelli
5. PAC: Periodismo Asistido por
Computadora
Introduce el uso de hojas de cálculo, como
herramienta para procesar datos
II. Detección y cruce de variables
III. Cálculo de medidas de tendencia central (media, media
ponderada, moda)
IV. Cálculo de medidas de proporción (razón, porcentaje, tasa,
Índice)
V. Cálculo de medidas de dispersión (desviación, varianza)
VI. Conclusiones: Detección de patrones de comportamiento
7. ¿Periodismo de Datos?
Casi todo se expresa con números
En el mundo digital, tenemos capacidad para acceder a grandes
cantidades de datos (Big Data)
Nuevas Herramientas de Búsqueda
Nuevas Herramientas de Extracción
Nuevas Herramientas de Análisis
Nuevas Herramientas de Visualización
Visión Científica: el periodista de datos reporta sus métodos, y
muestra documentos de modo que otros podrían replicar el
proceso y llegar a la misma conclusión
http://www.documentcloud.org/home
8. Del PAC al PAH
Periodismo asistido por Hackers
http://www.meetup.com/HacksHackersBA/
El programador se incorpora al equipo
periodístico
10. 1) Salarios de 667.000 empleados públicos
2) Crearon una aplicación incorporando un buscador de sueldos por
nombre, oficina gubernamental, año, categoría.
3) Socializaron la información
http://www.texastribune.org/library/data/government-employee-salaries/
13. Condiciones de Borde
Ley de Acceso
Datos abiertos
Formatos adecuados
Herramientas digitales
Creatividad… y mucho esfuerzo
Resultado: sociedades mejor informadas
14. ¿Qué es un dato abierto?
Formato reutilizable
Word, Excel, CVS
Archivos con opción de descarga
Gráficos con códigos de inserción
Tablas dinámicas
Caso Uruguay:
http://www.mef.gub.uy/indicadores.php
Caso España:
http://www.datosabiertos.jcyl.es/
15. ¿No si tenemos datos?
Ejercicio: Google
Búsqueda avanzada
Opción por defecto
Por dominio, formatos y/o fechas
Búsquedas geolocalizadas
Lectura de URLs
El Académico
Bases de Datos interactivas
Monitoreo de redes sociales
16. Ver no es lo mismo que acceder
¿Cómo extraer datos cuando no están accesibles?
17. Scraping de Datos
Programas informáticos o técnicas de programación
cuya finalidad es la de extraer datos (“raspar”) para:
2. Obtener datos estructurados (De PDF a Excel)
3. Leer datos de imágenes fotográficas para convertirlos
en textos o tablas (OCR: Reconocimiento Óptico de
Caracteres)
Secuencia:
n Recoger (Ruby: lenguaje de programación)
n Procesar (Google Refine: para limpiar y organizar los
datos)
n Almacenar (Panda Project: repositorio para compartir
bases de datos)
19. Proceso
Relaciones entre variables
Cualitativas – Cuantitativas
Jerarquía entre los datos
Proporciones (3 de cada 10)
Frecuencias (veces que un mismo dato se
repite o combinaciones de datos que se
repiten)
Datos abstractos Datos inteligentes
23. Links por Categoría
Ejemplos Periodismo de Datos:
http://tinyurl.com/ejemplosDataJour
Datos Oficiales:
http://tinyurl.com/LinksGovAr
Recursos Extracción de datos:
http://tinyurl.com/ExtraccionData
Recursos Visualización de Datos:
http://tinyurl.com/LinksDataViz
Aplicaciones Basadas en Datos
http://tinyurl.com/AplicacionesDatos