Estado de los datos abiertos para la investigación en Perú
1. ESTADO DE LOS
DATOS ABIERTOS
PARA LA
INVESTIGACIÓN EN
EL PERÚ
Carlos Quispe Gerónimo (Ministerio de Educación)
carlosqg@gmail.com
Diana Balcázar Tafur (GRADE)
balcazardiana@gmail.com
VI Jornadas Nacionales de Bibliotecas Universitarias:
Redescubriendo la educación superior en la era del conocimiento
Lima, 29 de mayo de 2014
2. El contexto
El incremento de los datos ha crecido de forma exponencial
en los últimos años. En la figura se muestra el crecimiento
que ha tenido a nivel mundial sobre todo por la evolución
de dispositivos de almacenamiento, en la nube y por
Internet.
Fuente: Dhar (2013)
Esta situación ha provocado un
gran impacto en la ciencia a través
de la gestión de datos
derivados de investigaciones,
la Big Data, la visualización de
datos, nuevos estilos de
descripción de datos, entre
otros.
3. Cambios producidos por el uso de datos como soporte
principal de la investigación
Data Journals
Repositorios de
datos
Data
Scientists
Data Curation
Visualización de
datos
Databrarian Servidores de
gestión de
datos
4. Objetivos de la presentación
• Determinar el estado de los datos abiertos en la
investigación científica peruana.
• Comparar la realidad peruana con la realidad
latinoamericana en relación a gestión de datos.
• Proponer iniciativas para armar un plan de gestión
de datos en una institución de investigación.
5. Metodología
Se analizó los portales web de
las siguientes entidades:
Ministerios
Institutos de investigación estatales
(adscritas al sistema nacional de
Ciencia y Tecnología)
Universidades (incluidas en el
directorio de la ANR)
Organismos No Gubernamentales
• Fueron incluidos solo aquellos
portales web que incluyeran
datos derivados de investigación,
que los datos estén disponibles
sin restricciones y que se puedan
descargar bajo algún formato.
• Los datos fueron recopilados en
una tabla generada en Excel 2010
donde se generaron las gráficas
correspondientes.
• En las bases de datos
identificadas se evaluó el tipo de
datos ofrecido, si contaba con
licencia CC, el formato de datos,
entre otros aspectos.
6. Instituciones que ofrecen datos abiertos
derivados de investigación: Ministerios
En total se evaluaron los
portales web de 18
ministerios
Se incluyeron en el estudio
solamente a los portales
que ofrecían datos
derivados de investigación,
no estadísticas diversas.
6%
94%
Ministerios que cuentan con datos
abiertos
Datos abiertos
No tiene datos
El único ministerio que
ofrece datos abiertos es el
Ministerio de Educación
7. Al hacer click a la
opción Archivo de
Datos se muestran
los 2 servicios
ofrecidos por el
MINEDU
Ministerio de Educación
13. El servicio ofrece 2
tipos de formato:
uno para poder
procesar la
documentación y
otra para obtener
la descripción.
14. Universidades que ofrecen datos
abiertos derivados de investigación
Ofrece datos
abiertos
derivados de
investigacione
s sociales
realizados por
el Instituto de
Opinión
Pública (IOP-
Data)
Tiene
restricciones
en el acceso
15. Estado de los datos abiertos para la
investigación en el Perú
Base de
datos
Tipo de
información
Institución Formato de
descripción
de datos
Licencias
CCZero
Uso de estilo
de citación
Declaración
de re-uso de
datos
UUEE Socio-
económica
MINEDU International
Household
Survey
Network
(IHSN)
No No No
UUEE-
Sistema de
documenta
ción virtual
Socio-
económica
MINEDU International
Household
Survey
Network
(IHSN)
No No No
Microdatos Socio-
económica
INEI No se
especifica
No No No
ANDA Socio-
económica
INEI No se
especifica
No No No
IOP-Data Socio-
económica
PUCP No se
especifica
No No No
16. ¿Por qué son importantes los datos
para la investigación científica?
Grandes beneficios para el
manejo de Big-Data
Permite respuestas rápidas
a emergencias
Combate el fraude
Estimula la novedad y la
colaboración creativa
Fortalece la transparencia
ciudadana
Respuestas eficientes a
cambios globales
Fuente: Boulton (2013)
17. Directrices para establecer un plan de
gestión de datos científicos
• Revisar los Principios de Panthon
• Describir y procesar los tipos de datos,
muestras, colecciones físicas, software,
materiales curriculares y otros materiales
que se produzcan en el curso de un proyecto
o investigación;
• Establecer las normas que se utilizarán para
los datos y el formato de metadatos y el
contenido (donde las normas existentes
están ausentes o se considere inadecuada,
esto debe documentarse junto con las
soluciones o remedios propuestos)
• Establecer las políticas de acceso y
distribución incluyendo disposiciones para la
protección adecuada de la privacidad, la
confidencialidad, seguridad, propiedad
intelectual u otros derechos o requisitos;
• Determinar las políticas y disposiciones para
la reutilización, la redistribución, y la
producción de derivados; y planes para el
archivado de datos, muestras y otros
productos de investigación, y para la
preservación del acceso a los mismos.
Fuente: University of
Alabama
18. Conclusiones
• El estado de la gestión de datos abiertos en la investigación en el Perú se
encuentra en estado embrionario.
• Es necesario que las instituciones públicas comprendan que la apertura de datos
es una condición propia de su esencia.
• Se deben implementar formatos de descripción de datos (por ejemplo: CSMD-
CCLRC Core Scientific Metadata Model) y de citaciones de datos (por ejemplo:
DataCite).
• Se debe comprender que el re-uso de datos permitirá no duplicar esfuerzos por
investigar un tema teniendo en cuenta el presupuesto limitado para la
investigación en el país.
• Las especialidades de Bibliotecología y CC.II. en el país deben adoptar programas
para el manejo de gestión de datos no solo para la investigación sino también para
cualquier ámbito.
19. MUCHAS GRACIAS POR SU ATENCIÓN
Carlos Quispe Gerónimo (MINEDU): carlosqg@gmail.com
Diana Balcázar Tafur (GRADE): balcazardiana@gmail.com