SlideShare una empresa de Scribd logo
1 de 58
Descargar para leer sin conexión
Datos abiertos en ciencias
(4to. Taller LEARN, CEPAL, Santiago, 27 octubre 2016)
Claudio Guti´errez • DCC, Universidad de Chile / CIWS •
cgutierr@dcc.uchile.cl
. ”[...] la Compa˜n´ıa de Jes´us que no permite al profano el
acceso a sus colecciones, por lo que tantos problemas de la
historia quedar´an siempre desesperadamente oscuros, o el
Banco de Francia que no permite a los especialistas del primer
Imperio consultar sus registros [...] as´ı seguiremos, hasta que
las sociedades consientan organizar racionalmente, con su
memoria, el conocimiento de s´ı mismas. No lo lograr´an sino
luchando cuerpo a cuerpo con los dos principales
responsables del olvido y la ignorancia: la negligencia que
extrav´ıa documentos, y, m´as peligroso a´un, la pasi´on por
el secreto [...] Nuestra civilizaci´on habr´a hecho un inmenso
progreso el d´ıa en que el disimulo, erigido en m´etodo de
acci´on y casi en virtud burguesa, deje el lugar al gusto por
la informaci´on.
(MARC BLOCH, APOLOG´IA PARA LA HISTORIA, 1943)
M´as informaci´on, m´as comunicaci´on no elimina la fundamental
imprecisi´on del todo, mas bien la agrava. [...] La masa de
informaci´on no engendra ninguna verdad. Cuanta m´as
informaci´on se pone en marcha, tanto m´as intrincado se
hace el mundo. La hiperinformaci´on y la hipercomunicaci´on
no inyecta ninguna luz en la oscuridad. (BYUNG-CHUL HAN, LA
SOCIEDAD DE LA TRANSPARENCIA, 2012)
ASUNTO POL´ITICO Y T ´ECNICO
En esta charla: el desaf´ıo t´ecnico
I. Datos abiertos hoy
II. Entender los datos
A- Datos
B- Datos abiertos
C- Datos abiertos cient´ıficos
III. Desaf´ıos
I. DATOS ABIERTOS HOY
Resumen:
• Portales de datos cient´ıficos
• APIs para datos cient´ıficos online
• Datasets y journals
• Visualizaciones y herramientas
• Marcos legales y regulaciones
• Iniciativas pro datos abiertos
• ... ¿qu´e m´as?... ¿c´omo jerarquizar?
II. ENTENDER LOS DATOS
II.A. DATOS
ACLARACI ´ON NECESARIA
Datos = informaci´on; Datos = conocimiento
conocimiento = informaci´on + metainformaci´on
informaci´on = datos + metadatos
datos = ?
DATOS (DEFINICI ´ON DE BUR ´OCRATA)
hechos y estad´ısticas reunidas para referencia o an´alisis
COMPUTACI ´ON. cantidades, caracteres o s´ımbolos sobre
las que opera un computador, almacenadas y transmitidas
en forma de se˜nales el´ectricas y almacenadas en medios
magn´eticos, ´opticos o mec´anicos.
FILOSOF´IA. cosas conocidas o asumidas como hechos,
que forman la base de un razonamiento o c´alculo
DATOS (DEFINICI ´ON ENTRE NOS)
Datos
Mundo virtual
=
Atomos
Mundo material
O sin matem´aticas:
Ciencia de los datos = qu´ımica del mundo virtual
¿QU ´E ES UN DATO? UN DATASET?
1. Definici´on extensional:
• Un archivo de datos
• Un conjunto (red) de archivos de datos
2. Definici´on intensional:
• Una URI (o una direcci´on o una API)
• La salida (el output) de un sensor
• Un concepto: “los jugadores de la Premier League”
GESTIONAR DATOS VERSI ´ON 1.0
(el enfoque tradicional)
1. Limpiar, organizar, clasificar
2. Sistema de curator´ıa y almacenamiento
3. Sistema de recuperaci´on (cat´alogos, lenguajes consulta,
etc.)
Ejemplo de enfoque tradicional: NATURE
SCIENTIFIC DATA JOURNAL:
“Scientific Data is a peer-reviewed, open-access journal for
descriptions of scientifically valuable datasets, and research
that advances the sharing and reuse of scientific data.”
GESTIONAR DATOS VERSI ´ON 2.0
JIM GRAY: No mover los datos...
La Web como unificador, como infraestrutura de datos
1. Repositorios locales de los propios productores y
organizaciones que los producen
2. Infraestructura para integrarlos (virtualmente) y enlazarlos
3. Sistema de archivo para efectos de seguridad
¿Y los bibliotecarios d´onde quedan?: dise˜no integraci´on,
est´andares de metadatos, sistemas de archivo.
¿POR QU ´E HABLAMOS DE ESTO hoy?
1. Nuevas tecnolog´ıas de captura, transformaci´on y
almacenamiento de datos. Diluvio datos
2. Alcanzamos las fronteras de nuestro “hogar com´un”.
Empezamos a “toparnos” (Brundtland Report).
Interconectiviidad
3. Nueva forma de crear conocimiento. Otra “ciencia”.
I.B. DATOS CIENT´IFICOS
PREGUNTA (NADA) INGENUA:
¿Qu´e son “datos cient´ıficos” (de “investigaci´on”)?
Los datos cient´ıficos se definen como informaci´on recolectada
usando m´etodos espec´ıficos para un prop´osito espec´ıfico de
estudio o an´alisis. Datos recolectados en un experimento de
laboratorio hecho bajo condiciones controladas es un ejemplo
de datos cient´ıficos.
“Datos generados en el ciclo de vida de una investigaci´on
como de sus resultados.” (Biblioteca CEPAL).
PREGUNTA (NADA) INGENUA:
¿Qu´e son “datos cient´ıficos”?
(OECD) “Research data” are defined as factual records
(numerical scores, textual records, images and sounds) used
as primary sources for scientific research, and that are
commonly accepted in the scientific community as necessary to
validate research findings. A research data set constitutes a
systematic, partial representation of the subject being
investigated.
PREGUNTA (NADA) INGENUA:
¿Qu´e son “datos cient´ıficos”?
1. Diferencia importante: datos “usados” versus datos
“recolectados” o “generados”
2. M´as amplio que datos que generan (o que dejan) los
proyectos cient´ıficos (e.g. para efectos de replicaci´on)
3. Verdadero desaf´ıo que viene: datos de sensores
4. Otros no menores: privacidad, seguridad (datos m´edicos)
II.C. DATOS ABIERTOS
Un dato es abierto si cualquiera es libre para
acceder a ´el, usarlo, modificarlo y compartirlo
bajo condiciones que, como mucho, preserven
su autor´ıa y su apertura.
(Handbook of Open Data)
NSF Principles:
Public
Accesible
Described
Reusable
Complete
Timely
Managed Post Release
OECD Principles
Openness Flexibility
Transparency Legal conformity
Professionalism Interoperability
Quality Security
Efficiency Accountability
Sustainability Formal responsability
Protection of
intellectual property
OKF Principles
Access (whole, cost, form)
Redistribution & Reuse
Atribution & Integrity
No discrimination against persons or groups
No discrimination gaints fields of endeavor
Distribution of License
License must not be specific to package
License must not restrict distribution of other works
Cinco enfoques y argumentos para “open”:
1. Democracia: acceso est´a hoy desigualmente
distribu´ıdo
2. Econom´ıa: baja los costos y promueve la innovaci´on
3. T´ecnico: ventajas t´ecnicas de arquitecturas abiertas
4. Transparencia: datos deben ser accesibles a todo
p´ublico
5. Accountability: mejora la replicabilidad y la auditor´ıa
(tomado y modificado de Fecher & Friesike, 2014)
Open realmente open
At the end of the day, information outlives software and
transcends software and is more valuable than software. I
think any online service can call itself “Open” if it makes,
and lives up to, this commitment: Any data that you give
us, we’ll let you take away again, without withholding
anything, or encoding it in a proprietary format, or
claiming any intellectual-property rights whatsoever.
(Set My Data Free, Tim Bray, 2006)
III. DESAF´IOS
ALGUNOS DESAF´IOS:
1. “Negligencia que extrav´ıa.” Hacer conciencia sobre el valor
de los datos.
2. “Pasi´on por el secreto” (y crisis del concepto de
propiedad para datos, informaci´on, conocimiento).
Cambiar mentalidad.
3. Modelos de incentivos y negocios adecuados. Entender
los commons del mundo virtual.
4. M´as desafiante que los anteriores: lidiar con la avalancha
de datos.
“Some of the design flaws of current open data sites are pretty
obvious. The datasets that are more important, or could
potentially be more useful, are not brought into the surface of
these sites” (C´esar Hidalgo)
DESAF´IO 1: ¿C´omo calcular el valor de los datos? Ante
la avalancha de datos, ¿c´omo jerarquizar los datos?
Cantidad de datos excede por mucho las capacidades
humanas de “I/O”.
DESAF´IO 2: Visualizaci´on, interfaces para m´aquinas,
recuperaci´on automatizada de datos
Mentalidad cl´asica: bases de datos, repositorios “finitos”,
accesos locales, enfoque centralizado.
DESAF´IO 3: Datos globales como extensi´on de los
locales o cualitativamente diferentes? (infinitos, globales,
decentralizados)
Los datos (´atomos) est´an naturalmente enlazados
DESAF´IO 4: La estructura de enlazamiento (de red) de
los datos Cu´anto replicar, c´omo (e.g. portales de datos
abiertos). El tema de las dificultades t´ecnicas.
Test de las cinco estrellas:
1. disponga sus datos en la Web (en cualquier formato) bajo
licencias abiertas
2. disp´ongalos como datos estructurados (e.g. use Excel en
vez de la imagen escaneadas de una tabla)
3. h´agalos disponibles en formatos abiertos no propietarios
(e.g. CSV en vez de Excel)
4. use URIs para denotar cosas, de forma que las personas
puedan apuntar a, o referenciar vuestros datos
5. enlace sus datos a otros datos para proveer contexto
GRACIAS POR LA ATENCI ´ON
cgutierr@dcc.uchile.cl

Más contenido relacionado

La actualidad más candente

Gestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentinaGestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentinaFernando-Ariel Lopez
 
Workshop de datos científicos. Introducción
Workshop de datos científicos. IntroducciónWorkshop de datos científicos. Introducción
Workshop de datos científicos. IntroducciónFernando-Ariel Lopez
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
Primeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosPrimeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosFernando-Ariel Lopez
 
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...LEARN Project
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoLEARN Project
 
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...Fernando-Ariel Lopez
 
Ley peruana de Repositorios Digitales
Ley peruana de Repositorios DigitalesLey peruana de Repositorios Digitales
Ley peruana de Repositorios DigitalesLibio Huaroto
 
Interop metadata tony
Interop metadata tonyInterop metadata tony
Interop metadata tonymaredata
 
Mare d seminario-rmelero
Mare d seminario-rmeleroMare d seminario-rmelero
Mare d seminario-rmeleromaredata
 
Repositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivasRepositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivasLibio Huaroto
 
Repositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaRepositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaLibio Huaroto
 
Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2maredata
 
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...LEARN Project
 
Gestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan MarchGestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan MarchFESABID
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16datos.ua.es
 

La actualidad más candente (20)

Gestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentinaGestión de datos de investigación, primeros pasos en argentina
Gestión de datos de investigación, primeros pasos en argentina
 
Workshop de datos científicos. Introducción
Workshop de datos científicos. IntroducciónWorkshop de datos científicos. Introducción
Workshop de datos científicos. Introducción
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
 
Primeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosPrimeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datos
 
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
Avances en torno a la Ley 26.899 e iniciativa regional de datos primarios de...
 
Datos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso MexicoDatos Abiertos de Investigacion - Caso Mexico
Datos Abiertos de Investigacion - Caso Mexico
 
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
Plan de gestión de datos de investigación: una propuesta Argentina del CAICYT...
 
Ley peruana de Repositorios Digitales
Ley peruana de Repositorios DigitalesLey peruana de Repositorios Digitales
Ley peruana de Repositorios Digitales
 
Interop metadata tony
Interop metadata tonyInterop metadata tony
Interop metadata tony
 
Mare d seminario-rmelero
Mare d seminario-rmeleroMare d seminario-rmelero
Mare d seminario-rmelero
 
Repositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivasRepositorios peruanos: reflexiones y perspectivas
Repositorios peruanos: reflexiones y perspectivas
 
Repositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científicaRepositorios digitales como apoyo a la investigación científica
Repositorios digitales como apoyo a la investigación científica
 
Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2Presentacion barcelona 3.rafael.antonia.v2
Presentacion barcelona 3.rafael.antonia.v2
 
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
Gestion de datos para la investigacion: el caso peruano by Edward Mezones, Su...
 
Repositorios
RepositoriosRepositorios
Repositorios
 
CENTRO DE DATOS
CENTRO DE DATOSCENTRO DE DATOS
CENTRO DE DATOS
 
El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...
El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...
El proyecto LEARN y la gestión de datos de investigación: Avances y desafíos ...
 
Gestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan MarchGestión de datos de investigación. Fundación Juan March
Gestión de datos de investigación. Fundación Juan March
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
 

Destacado

LEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research DataLEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research DataLEARN Project
 
Research Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESPResearch Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESPLEARN Project
 
About Data From A Machine Learning Perspective
About Data From A Machine Learning PerspectiveAbout Data From A Machine Learning Perspective
About Data From A Machine Learning PerspectiveLEARN Project
 
Data for Development in the Caribbean
Data for Development in the CaribbeanData for Development in the Caribbean
Data for Development in the CaribbeanLEARN Project
 
Managing Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challengesManaging Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challengesLEARN Project
 
LEARN Project: The Story So Far
LEARN Project: The Story So FarLEARN Project: The Story So Far
LEARN Project: The Story So FarLEARN Project
 
The Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research OrganisationsThe Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research OrganisationsLEARN Project
 
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...LEARN Project
 
Data management: The new frontier for libraries
Data management: The new frontier for librariesData management: The new frontier for libraries
Data management: The new frontier for librariesLEARN Project
 
Developing a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management ProtocolsDeveloping a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management ProtocolsLEARN Project
 
Opening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and ChallengesOpening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and ChallengesLEARN Project
 
The Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARNThe Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARNLEARN Project
 

Destacado (12)

LEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research DataLEARN: Helping Institutions to Build and Implement a Policy on research Data
LEARN: Helping Institutions to Build and Implement a Policy on research Data
 
Research Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESPResearch Data Management in São Paulo by Fabio Kon FAPESP
Research Data Management in São Paulo by Fabio Kon FAPESP
 
About Data From A Machine Learning Perspective
About Data From A Machine Learning PerspectiveAbout Data From A Machine Learning Perspective
About Data From A Machine Learning Perspective
 
Data for Development in the Caribbean
Data for Development in the CaribbeanData for Development in the Caribbean
Data for Development in the Caribbean
 
Managing Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challengesManaging Research Data in the Caribbean: Good practices and challenges
Managing Research Data in the Caribbean: Good practices and challenges
 
LEARN Project: The Story So Far
LEARN Project: The Story So FarLEARN Project: The Story So Far
LEARN Project: The Story So Far
 
The Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research OrganisationsThe Data Deluge: the Role of Research Organisations
The Data Deluge: the Role of Research Organisations
 
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
El camino hacia la Gestión de Datos de Investigación: la experiencia de Perú ...
 
Data management: The new frontier for libraries
Data management: The new frontier for librariesData management: The new frontier for libraries
Data management: The new frontier for libraries
 
Developing a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management ProtocolsDeveloping a Framework for Research Data Management Protocols
Developing a Framework for Research Data Management Protocols
 
Opening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and ChallengesOpening Research Data in EU Universities: Policies, Motivators and Challenges
Opening Research Data in EU Universities: Policies, Motivators and Challenges
 
The Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARNThe Needs of Stakeholders in the RDM Process - the role of LEARN
The Needs of Stakeholders in the RDM Process - the role of LEARN
 

Similar a Open Data in the world of Science” by Dr. Claudio Gutiérrez

Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoSocialBiblio
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eMegamovil
 
Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendenciastravon1
 
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libresGestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libresDiego Spano
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de artePepe
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------RubnGarcs2
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...Jean Sanchez
 
INTERNET: Retos y Oportunidades en los Archivos
INTERNET:Retos y Oportunidades en los ArchivosINTERNET:Retos y Oportunidades en los Archivos
INTERNET: Retos y Oportunidades en los ArchivosKarla Arosemena
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Universidad Autónoma
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Universidad Autónoma
 
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.Lizeth Yuliana Pinto Roa
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...Joaquín Borrego-Díaz
 
Competencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la WebCompetencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la WebMaria Estrada
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesMaría Sánchez González (@cibermarikiya)
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eMegamover
 

Similar a Open Data in the world of Science” by Dr. Claudio Gutiérrez (20)

Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abierto
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad e
 
Clase 1-intro
Clase 1-introClase 1-intro
Clase 1-intro
 
Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendencias
 
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libresGestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
Gestión del conocimiento y el desarrollo de Bibliotecas Digitales libres
 
Text mining para historiadores de arte
Text mining para historiadores de arteText mining para historiadores de arte
Text mining para historiadores de arte
 
introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------introduccion-al-analisis-de-datos--------
introduccion-al-analisis-de-datos--------
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
Articulo ICIEI
Articulo ICIEIArticulo ICIEI
Articulo ICIEI
 
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
WEKA: Programa que Permite una mayor Comprensión y Acercamiento a la Minería ...
 
INTERNET: Retos y Oportunidades en los Archivos
INTERNET:Retos y Oportunidades en los ArchivosINTERNET:Retos y Oportunidades en los Archivos
INTERNET: Retos y Oportunidades en los Archivos
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02
 
Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02Produccinperiodismoenweb 120122075955-phpapp02
Produccinperiodismoenweb 120122075955-phpapp02
 
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
UNIDAD II: LA INFORMACIÓN CIENTÍFICA Y TÉCNICA.
 
Diapositivasss
DiapositivasssDiapositivasss
Diapositivasss
 
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...Innovación en el tratamiento de la información desde la  Ingeniería del Conoc...
Innovación en el tratamiento de la información desde la Ingeniería del Conoc...
 
Competencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la WebCompetencias informacionales para la búsqueda de información en la Web
Competencias informacionales para la búsqueda de información en la Web
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
Introducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad eIntroducción a la terminología de la sociedad e
Introducción a la terminología de la sociedad e
 

Más de LEARN Project

Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster LEARN Project
 
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM PolicyLEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM PolicyLEARN Project
 
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM ToolkitLEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM ToolkitLEARN Project
 
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3mResearch Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3mLEARN Project
 
Data, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of ChileData, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of ChileLEARN Project
 
LEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career ResearchersLEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career ResearchersLEARN Project
 
LEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDMLEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDMLEARN Project
 
Paolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual MeetingPaolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual MeetingLEARN Project
 
LEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening RemarksLEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening RemarksLEARN Project
 
“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...LEARN Project
 

Más de LEARN Project (11)

Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster Research Data Management, Challenges and Tools - Per Öster
Research Data Management, Challenges and Tools - Per Öster
 
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM PolicyLEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
LEARN Final Conference: Tutorial Group | Using the LEARN Model RDM Policy
 
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM ToolkitLEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
LEARN Final Conference: Tutorial Group | Implementing the LEARN RDM Toolkit
 
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3mResearch Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
Research Data in an Open Science World - Prof. Dr. Eva Mendez, uc3m
 
Data, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of ChileData, Science, Society - Claudio Gutierrez, University of Chile
Data, Science, Society - Claudio Gutierrez, University of Chile
 
LEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career ResearchersLEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
LEARN Final Conference: Tutorial Group | How To Engage Early Career Researchers
 
LEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDMLEARN Final Conference: Tutorial Group | Costing RDM
LEARN Final Conference: Tutorial Group | Costing RDM
 
Paolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual MeetingPaolo Budroni at COAR Annual Meeting
Paolo Budroni at COAR Annual Meeting
 
LEARN Webinar
LEARN WebinarLEARN Webinar
LEARN Webinar
 
LEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening RemarksLEARN Carribean Workshop Opening Remarks
LEARN Carribean Workshop Opening Remarks
 
“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...“Data for Development – the value of data for research and society” by Dr. Ma...
“Data for Development – the value of data for research and society” by Dr. Ma...
 

Último

sesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfsesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfpatriciavsquezbecerr
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesRaquel Martín Contreras
 
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxSecuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxNataliaGonzalez619348
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsxJuanpm27
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docxLuisAndersonPachasto
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfssuser50d1252
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfssuser50d1252
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Rosabel UA
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxRAMON EUSTAQUIO CARO BAYONA
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 

Último (20)

recursos naturales america cuarto basico
recursos naturales america cuarto basicorecursos naturales america cuarto basico
recursos naturales america cuarto basico
 
sesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfsesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdf
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materiales
 
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docxSecuencia didáctica.DOÑA CLEMENTINA.2024.docx
Secuencia didáctica.DOÑA CLEMENTINA.2024.docx
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
3. Pedagogía de la Educación: Como objeto de la didáctica.ppsx
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
 
VISITA À PROTEÇÃO CIVIL _
VISITA À PROTEÇÃO CIVIL                  _VISITA À PROTEÇÃO CIVIL                  _
VISITA À PROTEÇÃO CIVIL _
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 

Open Data in the world of Science” by Dr. Claudio Gutiérrez

  • 1. Datos abiertos en ciencias (4to. Taller LEARN, CEPAL, Santiago, 27 octubre 2016) Claudio Guti´errez • DCC, Universidad de Chile / CIWS • cgutierr@dcc.uchile.cl
  • 2. . ”[...] la Compa˜n´ıa de Jes´us que no permite al profano el acceso a sus colecciones, por lo que tantos problemas de la historia quedar´an siempre desesperadamente oscuros, o el Banco de Francia que no permite a los especialistas del primer Imperio consultar sus registros [...] as´ı seguiremos, hasta que las sociedades consientan organizar racionalmente, con su memoria, el conocimiento de s´ı mismas. No lo lograr´an sino luchando cuerpo a cuerpo con los dos principales responsables del olvido y la ignorancia: la negligencia que extrav´ıa documentos, y, m´as peligroso a´un, la pasi´on por el secreto [...] Nuestra civilizaci´on habr´a hecho un inmenso progreso el d´ıa en que el disimulo, erigido en m´etodo de acci´on y casi en virtud burguesa, deje el lugar al gusto por la informaci´on. (MARC BLOCH, APOLOG´IA PARA LA HISTORIA, 1943)
  • 3. M´as informaci´on, m´as comunicaci´on no elimina la fundamental imprecisi´on del todo, mas bien la agrava. [...] La masa de informaci´on no engendra ninguna verdad. Cuanta m´as informaci´on se pone en marcha, tanto m´as intrincado se hace el mundo. La hiperinformaci´on y la hipercomunicaci´on no inyecta ninguna luz en la oscuridad. (BYUNG-CHUL HAN, LA SOCIEDAD DE LA TRANSPARENCIA, 2012)
  • 4. ASUNTO POL´ITICO Y T ´ECNICO
  • 5. En esta charla: el desaf´ıo t´ecnico I. Datos abiertos hoy II. Entender los datos A- Datos B- Datos abiertos C- Datos abiertos cient´ıficos III. Desaf´ıos
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 23. • Portales de datos cient´ıficos • APIs para datos cient´ıficos online • Datasets y journals • Visualizaciones y herramientas • Marcos legales y regulaciones • Iniciativas pro datos abiertos • ... ¿qu´e m´as?... ¿c´omo jerarquizar?
  • 26. ACLARACI ´ON NECESARIA Datos = informaci´on; Datos = conocimiento conocimiento = informaci´on + metainformaci´on informaci´on = datos + metadatos datos = ?
  • 27. DATOS (DEFINICI ´ON DE BUR ´OCRATA) hechos y estad´ısticas reunidas para referencia o an´alisis COMPUTACI ´ON. cantidades, caracteres o s´ımbolos sobre las que opera un computador, almacenadas y transmitidas en forma de se˜nales el´ectricas y almacenadas en medios magn´eticos, ´opticos o mec´anicos. FILOSOF´IA. cosas conocidas o asumidas como hechos, que forman la base de un razonamiento o c´alculo
  • 28. DATOS (DEFINICI ´ON ENTRE NOS) Datos Mundo virtual = Atomos Mundo material O sin matem´aticas: Ciencia de los datos = qu´ımica del mundo virtual
  • 29. ¿QU ´E ES UN DATO? UN DATASET? 1. Definici´on extensional: • Un archivo de datos • Un conjunto (red) de archivos de datos 2. Definici´on intensional: • Una URI (o una direcci´on o una API) • La salida (el output) de un sensor • Un concepto: “los jugadores de la Premier League”
  • 30. GESTIONAR DATOS VERSI ´ON 1.0 (el enfoque tradicional) 1. Limpiar, organizar, clasificar 2. Sistema de curator´ıa y almacenamiento 3. Sistema de recuperaci´on (cat´alogos, lenguajes consulta, etc.)
  • 31. Ejemplo de enfoque tradicional: NATURE SCIENTIFIC DATA JOURNAL: “Scientific Data is a peer-reviewed, open-access journal for descriptions of scientifically valuable datasets, and research that advances the sharing and reuse of scientific data.”
  • 32. GESTIONAR DATOS VERSI ´ON 2.0 JIM GRAY: No mover los datos... La Web como unificador, como infraestrutura de datos 1. Repositorios locales de los propios productores y organizaciones que los producen 2. Infraestructura para integrarlos (virtualmente) y enlazarlos 3. Sistema de archivo para efectos de seguridad ¿Y los bibliotecarios d´onde quedan?: dise˜no integraci´on, est´andares de metadatos, sistemas de archivo.
  • 33. ¿POR QU ´E HABLAMOS DE ESTO hoy? 1. Nuevas tecnolog´ıas de captura, transformaci´on y almacenamiento de datos. Diluvio datos 2. Alcanzamos las fronteras de nuestro “hogar com´un”. Empezamos a “toparnos” (Brundtland Report). Interconectiviidad 3. Nueva forma de crear conocimiento. Otra “ciencia”.
  • 35. PREGUNTA (NADA) INGENUA: ¿Qu´e son “datos cient´ıficos” (de “investigaci´on”)? Los datos cient´ıficos se definen como informaci´on recolectada usando m´etodos espec´ıficos para un prop´osito espec´ıfico de estudio o an´alisis. Datos recolectados en un experimento de laboratorio hecho bajo condiciones controladas es un ejemplo de datos cient´ıficos. “Datos generados en el ciclo de vida de una investigaci´on como de sus resultados.” (Biblioteca CEPAL).
  • 36. PREGUNTA (NADA) INGENUA: ¿Qu´e son “datos cient´ıficos”? (OECD) “Research data” are defined as factual records (numerical scores, textual records, images and sounds) used as primary sources for scientific research, and that are commonly accepted in the scientific community as necessary to validate research findings. A research data set constitutes a systematic, partial representation of the subject being investigated.
  • 37. PREGUNTA (NADA) INGENUA: ¿Qu´e son “datos cient´ıficos”? 1. Diferencia importante: datos “usados” versus datos “recolectados” o “generados” 2. M´as amplio que datos que generan (o que dejan) los proyectos cient´ıficos (e.g. para efectos de replicaci´on) 3. Verdadero desaf´ıo que viene: datos de sensores 4. Otros no menores: privacidad, seguridad (datos m´edicos)
  • 38.
  • 39.
  • 40.
  • 42. Un dato es abierto si cualquiera es libre para acceder a ´el, usarlo, modificarlo y compartirlo bajo condiciones que, como mucho, preserven su autor´ıa y su apertura. (Handbook of Open Data)
  • 44. OECD Principles Openness Flexibility Transparency Legal conformity Professionalism Interoperability Quality Security Efficiency Accountability Sustainability Formal responsability Protection of intellectual property
  • 45. OKF Principles Access (whole, cost, form) Redistribution & Reuse Atribution & Integrity No discrimination against persons or groups No discrimination gaints fields of endeavor Distribution of License License must not be specific to package License must not restrict distribution of other works
  • 46. Cinco enfoques y argumentos para “open”: 1. Democracia: acceso est´a hoy desigualmente distribu´ıdo 2. Econom´ıa: baja los costos y promueve la innovaci´on 3. T´ecnico: ventajas t´ecnicas de arquitecturas abiertas 4. Transparencia: datos deben ser accesibles a todo p´ublico 5. Accountability: mejora la replicabilidad y la auditor´ıa (tomado y modificado de Fecher & Friesike, 2014)
  • 47. Open realmente open At the end of the day, information outlives software and transcends software and is more valuable than software. I think any online service can call itself “Open” if it makes, and lives up to, this commitment: Any data that you give us, we’ll let you take away again, without withholding anything, or encoding it in a proprietary format, or claiming any intellectual-property rights whatsoever. (Set My Data Free, Tim Bray, 2006)
  • 49. ALGUNOS DESAF´IOS: 1. “Negligencia que extrav´ıa.” Hacer conciencia sobre el valor de los datos. 2. “Pasi´on por el secreto” (y crisis del concepto de propiedad para datos, informaci´on, conocimiento). Cambiar mentalidad. 3. Modelos de incentivos y negocios adecuados. Entender los commons del mundo virtual. 4. M´as desafiante que los anteriores: lidiar con la avalancha de datos.
  • 50.
  • 51. “Some of the design flaws of current open data sites are pretty obvious. The datasets that are more important, or could potentially be more useful, are not brought into the surface of these sites” (C´esar Hidalgo) DESAF´IO 1: ¿C´omo calcular el valor de los datos? Ante la avalancha de datos, ¿c´omo jerarquizar los datos?
  • 52.
  • 53. Cantidad de datos excede por mucho las capacidades humanas de “I/O”. DESAF´IO 2: Visualizaci´on, interfaces para m´aquinas, recuperaci´on automatizada de datos
  • 54. Mentalidad cl´asica: bases de datos, repositorios “finitos”, accesos locales, enfoque centralizado. DESAF´IO 3: Datos globales como extensi´on de los locales o cualitativamente diferentes? (infinitos, globales, decentralizados)
  • 55. Los datos (´atomos) est´an naturalmente enlazados DESAF´IO 4: La estructura de enlazamiento (de red) de los datos Cu´anto replicar, c´omo (e.g. portales de datos abiertos). El tema de las dificultades t´ecnicas.
  • 56. Test de las cinco estrellas: 1. disponga sus datos en la Web (en cualquier formato) bajo licencias abiertas 2. disp´ongalos como datos estructurados (e.g. use Excel en vez de la imagen escaneadas de una tabla) 3. h´agalos disponibles en formatos abiertos no propietarios (e.g. CSV en vez de Excel) 4. use URIs para denotar cosas, de forma que las personas puedan apuntar a, o referenciar vuestros datos 5. enlace sus datos a otros datos para proveer contexto
  • 57.
  • 58. GRACIAS POR LA ATENCI ´ON cgutierr@dcc.uchile.cl