Este documento presenta una estrategia para implementar un gobierno abierto mediante la apertura de datos públicos. Explica que es importante realizar una auditoría de datos para conocer la estructura y fuentes de datos de una organización. También cubre la clasificación y formato de publicación de datos, recomendando el uso de formatos no propietarios y estructurados como CSV. Además, introduce el software CKAN como una herramienta para crear un portal de datos y gestionar la publicación y descubrimiento de conjuntos de datos de forma centralizada.
1. Cómo conseguir un
Gobierno Abierto
Estrategia para la apertura de datos públicos
Gobierno Abierto y Reutilización de
Información Pública en el Ámbito Local
18 y 19 julio 2013
Sede de Carmona
2. PABLO MARTÍN MUÑOZ
OPEN SOURCE ARCHITECT & DATA SCIENTIST
@edipotrebol
Co-fundador de Openkratio
#OpenData #oGov #FreeSoftware #SmartCities
3. Indice
● Punto de partida
● Auditoría de datos
● Clasificación de los datos
● Formato de publicación de datos
● El portal de datos
● Un caso concreto: CKAN.
● Usando CKAN con DataHub.io
5. Punto de partida
● Variedad de Administraciones Públicas
● Implantación de Administración Electrónica
● Recursos de los que se dispone
● Conocimientos previos
● Interés por parte del gobierno
● Interés por parte de la ciudadanía
7. Auditoría de datos
Es importante definir qué se tiene,
cómo se tiene y dónde se tiene.
8. Auditoría de datos
Pasos a seguir:
1. Generar mapa organizativo
2. Generar mapa de procesos
3. Detectar entradas y salidas de cada proceso
4. Analizarlas!
5. Documentar el trabajo realizado
10. Auditoría de datos
Isla: Porción de tierra rodeada de agua por
todas partes.
Islas adyacentes: Islas que, aun apartadas del
continente, pertenecen al territorio nacional,
como las Baleares y Canarias respecto de
España, y las que se consideran parte de tal
territorio.
En islas: separadamente.
11. Auditoría de datos
Islas de información; Bases de datos que aun
perteneciendo a la organización están
separadas de los sistemas de información base
de la misma.
Objetivo: Crear puentes a dichas islas!
12. Auditoría de datos
Objetivo final:
Conocer cuál es la estructura de datos
global de la organización y su nivel de
desarrollo.
14. Clasificación de los datos
Los datos pueden ser clasificados teniendo en
cuenta diferentes indicadores. Algunos de ellos
son:
● Temática
● Interés
● Complejidad
● Calidad
● Formato
● Estadarización
● ...
15. Clasificación de los datos
Clasificación basada en su interés:
La organización nunca debería valorar en
solitario el interés de los datos. Éste siempre
debe ser valorado por la ciudadanía.
Por ello, antes de publicar datos, es importante
recoger feedback de la ciudadanía.
16. Clasificación de los datos
Una posibilidad: Crear UserVoice de Datos
para ser valorados por la ciudadanía.
18. Formato de pub de datos
La elección del formato de publicación de los
datos es una de las tareas más importantes del
proceso de publicación ya que determinará el
uso que la gente haga de los mismos.
Una mala elección de formatos puede hacer
que los datos publicados no sean usados, por
diferentes motivos.
19. Formato de pub de datos
Conceptos clave:
● Human readable / Machine readable
● Estructurados / No estructurados
● Propietario / No propietario
● Semantizados / No semantizados
20. Formato de pub de datos
Las 5 estrellas del [Linked]OpenData:
● 1 estrella: Pon tus datos disponibles en la web en
cualquier formato y con una licencia libre.
● 2 estrellas: Hazlos disponibles de forma estructurada
(por ejemplo XLS en vez de tablas escaneadas).
● 3 estrellas: Usar formatos no propietarios (por ejemplo
CSV en vez de XLS).
● 4 estrellas: Usar URLs para describir datos.
● 5 estrellas: Enlazar tus datos con otros para
proporcionar contexto.
Ver más en http://5stardata.info/
21. Formato de pub de datos
Y recuerda... No liberes datos en PDF!
Imagen original
23. El portal de datos
Un portal de datos es un espacio web donde
una organización publicará todos sus datos
para ser consultados y reutilizados por terceras
personas.
Los portales de datos, al contrario que otros
portales, están enfocados en el dato como
unidad principal de interacción.
24. El portal de datos
Independencia tecnológica:
Los portales de datos pueden ser construidos
de diversa forma y por ello son independientes
de una tecnología concreta.
Diferentes son los estándares de datos que se
usen para la publicación del contenido.
25. El portal de datos
Buscar
El sistema de
búsqueda debe ser
potente y permitir
opciones avanzadas
de la misma
Publicar
La publicación debe
ser simple, bien
estructrurada y que
aporte toda la
información necesaria
Características básicas
26. El portal de datos
Partes fundamentales:
● Catálogo de datos
● Exploración de datos
● Visualización
● API
27. El portal de datos
Otras partes más genéricas:
● Gestión de usuarios
● Apariencia
● Sindicación
● Seguridad
● Alojamiento
● ...
34. Un caso concreto: CKAN
Herramienta para manejar y publicar conjuntos
de datos.
Desarrollada por Open Knowledge Foundation
Gratuito y de código abierto
35. Un caso concreto: CKAN
Características:
● Gestionar datos
● Buscar datos
● Metadatos
● Soporte geoespacial
● Comunidad
● Visualización
● Personalizable
● Almacenamiento
● Histórico
● Extensible
● Datos federados
● API
36. Un caso concreto: CKAN
Gestionar datos:
● Introducir datos
● Publicación de datos
● Trabajo con flujos de trabajo
● Harvesting
37. Un caso concreto: CKAN
Buscar datos:
● Sistema enriquecido de búsqueda
● Búsquedas facetadas
● Fuzzy matching
● Rápido acceso a conjuntos de datos
● Buscar via API
38. Un caso concreto: CKAN
Metadatos:
● Identificador único
● Título
● Descripción
● Histórico
● Licencia
● Etiquetas
● Múltiples formatos
● ...
39. Un caso concreto: CKAN
Soporte geoespacial:
● Previsualizaciones
● Búsqueda
● Descubrimiento
40. Un caso concreto: CKAN
Comunidad:
● Comentarios
● Compartición en redes sociales
● Sindicación (RSS / ATOM)
● Extensiones: Follow y To-Do
41. Un caso concreto: CKAN
Visualización:
● Vista de tabla
● Vista de gráfico
● Vista de mapa
● Datos como imagen
42. Un caso concreto: CKAN
CKAN es software libre y su código más la
documentación se pueden descargar en su
pagina web.
Además se puede ver cómo evoluciona el
proyecto en GitHub además de posibilitar las
contribuciones al mismo.
44. Usando CKAN con DataHub.io
DataHub.io es una plataforma de libre acceso y
gratuita basada en CKAN para alojar conjuntos
de datos en la nube.
Permite la gestión de grupos para el manejo de
datos o para organizar los datos por temáticas
concretas.