SlideShare une entreprise Scribd logo
1  sur  149
Télécharger pour lire hors ligne
Buenas prácticas de
Gestión de datos en
Humanidades y Ciencias
Sociales
Yusnelkis Milanés Guisado. PhD.
Universidad Pablo de Olavide
La gestión de datos de investigación
Los datos de investigación en Hum. y CS.
Buscar datos de investigación
Documentación y descripción de los datos
Temas a tratar
https://humanidadesdigitales.blogs.upv.es/la-rapida-evolucion-de-las-
humanidades-digitales/
Datos y estructura de ficheros
Nomenclatura de ficheros
Integridad de los datos
Construcción de variables
Documentación del proyecto
Documentación de los datos
Computer-assisted interviewing
Using integrated software
Entrada de datos y documentación
Pre-test y estudios pilotos
Confidencialidad
Cuestiones iniciales para comenzar un proyecto
https://www.icpsr.umich.edu/files/deposit/dataprep.pdf
Ciclo de vida de los datos científicos
La gestión de datos de investigación
La gestión de datos de investigación refiere a todos
los procesos que te permiten organizar, procesar y
estructurar los datos de tu investigación durante el
ciclo de vida del Proyecto…
Concienciación sobre
publicar datasets
METADATOS
Datasets (Bruto) de
CALIDAD
Reproducibiliadad
Ciencia reproducible
¡¡Implicaciones
en la solicitud
de los
proyectos!!
Requisitos de las agencias de financiación
OECD Principles and Guidelines for Access to Research Data
from Public Funding (2004-2007)
“… open access to scientific data should be adopted as
the international norm for the exchange of scientific
data derived from publicly funded research.”
The National Science Foundation, January2011
“requires, in all proposals a supplementary document of
no more than two pages describing a Data
Management Plan for the proposed research.“
European Research Council , Open Access Guidelines for
Researchers, June 2012
“…primary data, as well as data-related products such
as computer codes, is deposited in the relevant
databases as soon as possible, preferably immediately
after publication and in any case not later than six
months after the date of publication.”
Requisitos de las agencias de financiación
NACIONAL
Ministerio de Ciencia e Innovación (2020) Resolución de la Convocatoria de Proyectos de I+D+I 2020 de la Agencia Estatal
de Investigación [en línea] Disponible en:
https://www.ciencia.gob.es/stfls/MICINN/Ayudas/PE_2017_2020/PE_Orientada_Retos_Sociedad/FICHEROS/Proyectos_ID
I_Retos_Investigacion/ConvocatoriaPID2020_Resolucion20201111.pdf
La importancia de planificar (DMP)
La importancia de planificar (DMP)
Documento formal que
describe qué harás con tus
datos durante tu investigación
y después que completes tu
proyecto
EL DMP debe contener solo la información más
importante y preferiblemente no debería exceder
los 10,000 caracteres (incluidos los espacios).
Descripción
de los datos
• Tipos de datos creados o re-usados
• Organización de los datos y versiones
• Usuarios de los datos
Documentación y
Metadatos
• Esquemas de metadatos
• Documentación de los datos: FAIR
• Control calidad de los datos
Almacenamiento
y seguridad
• Almacenamiento, seguridad, estrategia de back-up,
preservación a largo plazo, costes, barreras técnicas, etc.
Componentes de un PGD
Componentes de un PGD
Compartir datos y
preservación a
largo plazo
• Compartir datos, restricciones, cuáles datos y cuándo
• repositorios, identificadores persistentes
Aspectos legales y
éticos
• Gestión de los accesos a los datos, posibles barreras
• Barreras legales y éticas, licencias, re-uso,
• Tratamiento de los datos sensibles
• Roles (Quién se encarga y dirige de la gestión de datos ?)
• Recursos
Responsabilidades
y recursos
Los datos de investigación
Componentes de un PGD
“datos que son recolectados,
observados o creados para ser
analizados y producir resultados de
investigación originales”
• Numéricos, descriptivos o visuales.
• Encontrarse en estado bruto o analizado,
pueden ser experimentales u observacionales.
Datos e información
Datos e Información conceptos estrechamente
relacionados.
•Los datos constituyen la base a través de la cual, mediante procesos de procesamiento y
análisis, se convierte en información.
•Los datos se comprenden esencialmente al nivel en el cuál las medidas son
coleccionadas, y pueden ser:
•Cualitativos o cuantitativos
•Factuales o no –factuales
•Numéricos
•Textuales
•Audiovisuales
Datos de investigación
• Datos primarios: Datos coleccionados para un propósito particular ( Ej: responder
a una pregunta de investigación) por el propio investigador y / o su equipo de manera
directa.
• Datos secundarios: Datos coleccionados o producidos con intermediación de
otras fuentes (ejemplo, historia clínica de pacientes, entrevistas, cuestionarios, etc) _
Limitaciones
• Textos: Cuestionarios, Transcripciones de entrevistas, Codebooks,
Metodologías, Flujos de trabajo, Procedimientos, Protocolos, Notebooks, Diarios
de investigación, etc.
• Numéricos: Respuestas a encuestas, Registros médicos, Respuestas a tests,
Hojas de Excel, instrumentos de medida, Info geoespacial, etc. (Stata, Spss, Excel,
Gis)
• Multimedia: Imágenes, Audio recordings, Videos (jpeg, png, tiff, mp3, wav,
mpeg, quicktime)
Tipos de Datos de investigación
Tipos de Datos de investigación
• Códigos: Fuentes de código, Algoritmos, Scripts (R, Python, Java, MATLAB)
• Sintáxis: Software-specific code files to carry out data processing steps (e.g. data
preparation, linkage, statistical analysis, etc) (Stata, SPSS, R, MATLAB)
• Específico de una disciplina: Los tipos de datos pueden incluir: Flexible Image
Transport System (FITS) [Astronomy]; Crystallographic Information File (CIF) [Chemistry];
GRIdded Binary (GRIB) [Meteorology]
Por su origen
Datos públicos
Datos privados
Por su finalidad
Administrativa
Investigación
Por su nivel de procesamiento
Brutos
Procesados
Estadísticos
Tipos de datos de investigación en CS y HUM
Datos de investigación.
survey data (opinion polls, voting records)
Social media data
Audiovisual data (images, maps, sound, video, multimedia)
raw measurments, numeric tables, government statistics,
and índices, census
text (fieldnotes, transcripts, blogs, e-mails)
spatial (zonal, event, spatial referent)
Audio recordings (From interviews)
Descripción de los datos
Descripción
de los datos
Almacenamiento
y seguridad
Aspectos
legales y éticos
Descripción
de los datos
Nuevo conocimiento
 Tipologías
 Resumen de resultados
 Sesiones informativas
 Posts en Medios de prensa
 Conferencias
 Artículos académicos
• Cuestionario de la encuesta
• Diseño de la entrevista
• Coding book
No sólo datos ….
Tipos de datos de investigación en CS y HUM
https://youtu.be/GvirMb1vmww
Nuevos tipos de investigación en Ciencias Sociales y archivo de
datos
• El uso de datos de medio sociales
Métodos y datos
Cuantitativos
Cross-sectional studies
Longitudinal studies
Opinion polls
Questionnaires
Social attitude surveys
Surveys and censuses
Cualitativos
Semi-structured interviews
Unstructured interviews
Unstructured Observation
Open questionnaire survey
Keeping logs and diaries
Focal groups (Groups discussions)
TIPO Método Formato
Datos agregados o macrodatos
https://trainingmodules.ukdataservice.ac.uk/aggregate/#/lessons/Vn9Rr2Gm5V8BKIpmeRfXPfabJv_RQOj3
Ejemplo de indicadores agregados:
esperanza de vida,
tasas de empleo,
PIB,
emisiones de gases de efecto invernadero,
recuentos de censos
Producidos por datos combinados de
individuos (a partir de aplicar métodos
de agregación estadística como suma
o promedio)
Datos de censos: Datos construidos a partir de diferentes niveles (áreas,
autoridades locales, nivel nacional, etc)
https://trainingmodules.ukdataservice.ac.uk/aggregate/#/lessons/rX3tpMY1MyJSLUKIy2Qx7XrZbhEjz5g5
https://ukdataservice.ac.uk/help/data-types/census-data/
https://beta.ukdataservice.ac.uk/datacatalogue/studies/#!?Search=&Rows=10&Sort=0&DataTypeFacet=Census%20data&Pag
e=1&DateFrom=440&DateTo=2021
Datos agregados o macrodatos
https://ec.europa.eu/education/news/pisa-2018_en
Datos agregados o macrodatos
Datos de series temporales
https://trainingmodules.ukdataservice.ac.uk/aggregate/#/lessons/Vn9Rr2Gm5V8BKIpmeRfXPfabJv_R
QOj3
Datos agregados o macrodatos
Buscar datos de investigación
Proveedores internacionales de macrodatos
• The World Bank
• Organization for Economic Co-operation and
Development (OECD)
• International Monetary Fund (IMF)
• The International Labour Organization (ILO).
• UNESCO
• UNIDO
• HUMAN RIGTHS ATLAS
• International Monetary Fund
•International Labour Organisation
•UNICEF
•UN Statistics
•UNESCO
•Eurostat
https://stats2.digitalresources.jisc.ac.uk/
Barómetros: Datos de opinion pública
http://www.cis.es/cis/opencm/ES/11_barometros/index.jsp
Buscar datos
Barómetros: Datos de opinion pública
https://www.globalbarometer.net/
Buscar datos
https://www.europarl.europa.eu/at-your-service/en/be-
heard/eurobarometer
Global barometer
Eurobarometer
European Social Survey
http://www.europeansocialsurvey.org/
Buscar datos
European Values Study
https://europeanvaluesstudy.eu/
Buscar datos
https://guides.libraries.emory.edu/main/Data_Services/public
Buscar datos
https://www.icpsr.umich.edu/web/pages/
The Inter-University Consortium for Political and Social Research
Buscar datos
https://dataverse.harvard.edu/
Harvard Dataverse
Buscar datos
Buscar datos
https://www.data-archive.ac.uk/deposit
UK Data Archive
Data catalogue
https://beta.ukdataservice.ac.uk/datacatalogue/studies/#!?Search=&Rows=10&Sort=0&DateFrom=440&Date
To=2021&Page=1
Buscar datos
https://www.cessda.eu/
CESSDA stands for Consortium of European Social Science Data Archives and ERIC stands for
European Research Infrastructure Consortium.
Buscar datos
Buscar datos
Datos.gob.es
Buscar datos
The Word Bank
https://datos.bancomundial.org/
Buscar datos
data.europea.eu
https://datos.bancomundial.org/
Buscar datos
Google Dataset Search
https://datasetsearch.research.google.com/
https://ec.europa.eu/eurostat/data/database
Eurostat
Buscar datos
https://www.base-search.net/
Buscar datos
https://www.re3data.org/
Buscador de respositorios
Buscar datos
http://www.glopac.org/
Buscar datos
Global Performance Arts Consortium
Ciencia Abierta
“Open Science is the practice of science in such
a way that others can collaborate and contribute,
where research data, lab notes and other
research processes are freely available, under
terms that enable reuse, redistribution and
reproduction of the research and its underlying
data and methods”
https://www.fosteropenscience.eu/foster-taxonomy/open-science-definition
Ciencia abierta vs Acceso abierto
Open Access ≠ Open Science
Acceso libre y gratuito a:​
• Publicaciones
científicas ​
1. Acceso libre y gratuito a:​
• Publicaciones científicas ​
• Datos de investigación (FAIR)​
• Métricas abiertas​
• Software libre​
• Recursos educativos en abierto ​
• Open peer-review
• Ciencia ciudadana ​
Ciencia abierta
OSF: Open Science Framework
Datos FAIR
• se pueden encontrar en Internet
(Identificadores persistentes, metadatos),
• son accesibles (derechos y licencias claros),
• están en un formato utilizable,
• se identifican de una manera única y
persistente para que se pueda hacer
referencia a ellos.
El principal objetivo de los principios FAIR es preparar los
datos de investigación para que tanto humanos
y máquinas puedan recuperarlos y reutilizarlos de la
mejor manera posible...
Los repositorios cubren la mayoría de
los aspectos
Objetivo: Datos FAIR
Datos FAIR
Objetivo: Datos FAIR
Planificar
Preparar
Recolección de
datos
Procesamiento
Análisis
Depósito /
Compartir / Re-uso
Datos FAIR
Herramientas para valorar si tus datos
son FAIR:
• FAIR data self-assessment tool
(https://ardc.edu.au/resources/working-with-data/fair-
data/fair-self-assessment-tool/)
• FAIR-Aware (https://fairaware.dans.knaw.nl/)
Datos FAIR vs Datos abiertos
Tan abierto como sea posible, tan cerrado
como sea necesario
La accesibilidad limitada, por ejemplo, debido a
la protección de la privacidad de los datos, no
contradice los principios FAIR.
Organización de carpetas y
ficheros
Organización de carpetas y ficheros
Reduce tu carga de trabajo
Re-usa tus ideas y las de tu equipo
Recicla tus datos
Ahorra tiempo !!!
Organiza y documenta tus Datos !!!
Organización y descripción de los datos
Datos no es sólo coleccionar los datos …
Importa la información descriptiva de los datos y los
procedimientos.
Todos los materiales relevantes deben ser organizados en carpetas
Ejemplos de materiales relevantes:
• Invitación a partircipar en una investigación
• Hoja de los datos de los participantes
• Consentimiento informado
• Diseño de la entrevista
• Descripción de la codificación a utilizar en la
tranncripción
• Descripción del procedimiento de anonimización
• Datasets
• Códigos de variables
• Información descriptiva del Proyecto,
• etc
Organización y descripción de los datos
Organización de carpetas y ficheros
Organiza las carpetas de manera lógica y sistemática*
Criterios:
• Organización
• Contexto
• Tipologías
• Unidades de análisis, objetivos y métodos
Example A) For this survey, data and documentation files are held in
separate folders. Data files are further organized according to data type
and then according to research activity. Documentation files are organized
also according to the type of file and research activity. This helps to restrict
the level of folders to three or four deep and not to have more than ten items
in each list.
Separa los datos limpios en una copia Máster
Diseñando ficheros de datos cualitativos
Los eventos individuales deben ser estructurados en ficheros individuales
• Ex: Una entrevista, una imagen, o un audio recording
Luego estos ficheros se organizan en carpetas similares
Nomenclatura de ficheros
• El nombre de un fichero es su principal
identificador
• La estrategia de nomenclatura debe ser
consistente en el tiempo y entre diferentes
personas
• Un equipo de colaboración debe seguir la misma
convención establecida y documentada en un fichero
independiente.
Nomenclatura de ficheros
Número de elementos o criterios a considerar:
• Descripción del contenido
• Tipos de datos, métodos, etc
• Número del proyecto
• Nombre del creador
• Nombre del equipo de invest. o Dpto. asociado a los datos
• Fecha de creación; Fecha de publicación
• Número de versión
https://mantra.ed.ac.uk/organisingdata/
Nomenclatura de ficheros
Usa nombres de ficheros descriptivos *
• Únicos
• Refleje el contenido
• Evita uso de caracteres raros y espacios
• Puede incluir guiones bajos
• Corto (No más de 25 caracteres)
Mala práctica:
Misdatos.xls
Misdatosbuenos.xls
2001_data.xls
Version_buena.xls
Buena práctica:
Altmetrics_ 01_ Modelos_V3_20201121_YMG.
Altmetrics – Nombre proj.
01 – Paquete de trabajo
Modelosdata2021 – Datos del
experimento, actividad, etc.
V3 – Versión
20201121 – Fecha
YMG – Autor(a)
Nomenclatura de ficheros
IP02R0120190731.docx
¿ Qué nos dice el nombre de este fichero ?
Componentes del nombre: I P02 R01 20190731
• I = interview (type of data)
• P[n] = participant ID - participant 02
• R[n] = researcher ID – researcher 01
• Fecha entrevista en format YYYYMMDD – 20190731
Nomenclatura de ficheros
Ejemplo:
» 20130311_interview2_audio.wav
» 20130311_interview2_trans.rtf
» 20130311_interview2_image.jpg
• La forma más conveniente es dar a todos los archivos
conectados al mismo evento un 'identificador de evento' al
principio del nombre, es decir, en la primera parte del
nombre.
• La última parte del nombre se puede usar para
transmitir los detalles o tipo, por ejemplo, si se trata de
una cinta de audio, transcripción o una imagen fija.
Nomenclatura de ficheros
¿Qué hacer cuando son muchos ficheros a re-nombrar ?
• Ex: Imágenes generadas automaticamente por cámaras
• Batch renaming (también conocido como “mass file renaming”, “bulk
renaming”)
“3 Ways to Batch Rename Files in Windows”.
https://www.maketecheasier.com/batch-rename-files-in-windows/
Ant Renamer: www.antp.be/software/renamer
RenameIT: sourceforge.net/prpjects/renameit
Bulk Rename Utility: www.bulkrenameutility.co.uk/
File explorer (Windows)
Organización de las variables
» Relaciones entre variables:
• conjuntos de variables relacionadas con el mismo
fenómeno
• variables originales o derivadas
La posición de las variables en el archivo de datos, sus nombres y etiquetas
deben reflejar lo siguiente:
Organización de las variables
• » Enlaces a elementos del estudio y fuentes de los
datos: Por ejemplo, diferentes instrumentos de
medición, diferentes partes del cuestionario,
diferentes bases de datos de fuentes, diferentes
métodos de observación, etc.
• Tipos de variables: Por ejemplo, variables de
identificación y otras variables complementarias con
diferentes roles específicos:
• indicadores sociodemográficos,
• variables generadas obtenidas por
transformación de información original, etc.
La posición de las variables en el archivo de datos, sus nombres y etiquetas
deben reflejar lo siguiente:
Tipos de variables
Créditos: Mahima S.
Nomenclatura de variables
https://zenodo.org/record/3820473#.YZyXUPnMJPZ
Nomenclatura de variables
Hay tres enfoques básicos para nombrar
variables:
» Uso de códigos numéricos que reflejan la posición de la
variable en un sistema (por ejemplo, V001, V002, V003...);
» Uso de códigos que se refieran al instrumento de
investigación (por ejemplo, número de pregunta en un
cuestionario: Q1a, Q1b, Q2, Q3a...);
» Uso de nombres mnemotécnicos que se refieren al
contenido de variables (por ejemplo, NACIMIENTO para el año
de nacimiento, EDAD para la edad del encuestado, etc.). La
palabra mnemotécnico significa "ayuda a la memoria".
Nomenclatura de variables
https://zenodo.org/record/3820473#.YZyXUPnMJPZ
Nomenclatura de variables
https://ddialliance.org/sites/default/files/National%20Household%20Survey,%2
02011%20%5bCanada%5d%20Public%20Use%20Microdata%20File%20(PUMF)-
%20Individuals%20File.pdf
Control de versiones
• ¿A cuántos nos ha sucedido esto durante un proyecto de
investigación ?
Control de versiones
• Control automático o manual
• Debes registrar los cambios en la data, no importa cuán
pequeños o "insignificantes" sean en ese momento.
• Usa autobackup para esto, en lugar de guardar
y archivar múltiples versiones.
! Asegúrate siempre de mantener la copia original (Raw Data) !
Control de versiones
Las versiones podrían establecerse de la
siguiente manera:
V1: fase de recopilación de datos,
V2: la fase de limpieza de datos y
V3: agrega cualquier variable construida (si
corresponde, al final del libro de códigos, con las
etiquetas apropiadas y las fórmulas utilizadas para
crearlas registradas cuando se crean las variables)
Control de versiones
Apache®
Subversion®
Un sistema de control de versiones
de código abierto fundado en 2000
por CollabNet, Inc.
Control de versions (Code Versioning)
• GitHub: https://github.com
• GitLab: https://about.gitlab.com
• Bitbucket: https://bitbucket.org
• Gitea: https://gitea.io/en-us
#Tips
Si tu código es extenso ( Usa Git repsitorios )
Si tu código es pequeño (1 o 2 ficheros, Control manual )
Control de versiones
• Wikis y Google Docs
proveen rastreo de versiones
automático
• El Open Science Framework
(OSF) proporciona una
herramienta de gestión de
proyectos de código abierto y
gratuita
Formato de ficheros
Elección de formatos
• Seleccionar formatos abiertos, no
propietarios.
• Elegir formatos comunes al campo
disciplinar al que se está trabajando:
Para asegurar la interoperabilidad y la
reutilización de los datos.
• Tener en cuenta el tiempo en que se
espera conservar los datos
• Seleccione formatos sin cifrar y sin
compilar
Elección de formatos
Formatos comunes de los datos en CS.
Text - ASCII, Word, PDF
Numéricos - ASCII, Excel, Access, SPSS, STATA
Multimedia - jpeg, tiff, dicom, mpeg, quicktime,
Wav
Espacial - geotiff, KLM, KMZ
Modelos - 3D, statistical
Elección de formatos
UK Data Service. Format your data. "Create well organised and sustainable data" https://www.ukdataservice.ac.uk/manage-
data/format/file-formats.aspx
• ¿Cuál es el mejor formato para la creación de los datos ?
• ¿Cuál es el major formato para el análisis de los datos ?
• ¿Cuál es el major formato para la conservación a largo-plazo y la
compartición de los datos?
• Open vs. Formatos propietarios
Formatos para conservación
Type of data Recommended formats Acceptable formats
Textual data Rich Text Format (.rtf).
Plain text, ASCII (.txt).
eXtensible Mark-up Language (.xml) text according
to an appropriate Document Type Definition (DTD)
or schema.
Hypertext Mark-up Language (.html).
Widely-used formats: MS Word (.doc/.docx).
Some software-specific formats: NUD*IST, NVivo and ATLAS.ti.
Image data. TIFF 6.0 uncompressed (.tif). JPEG (.jpeg, .jpg, .jp2) if original created in this
format.
GIF (.gif).
TIFF other versions (.tif, .tiff).
RAW image format (.raw).
Photoshop files (.psd).
BMP (.bmp).
PNG (.png).
Adobe Portable Document Format (PDF/A, PDF)
(.pdf).
Audio data. Free Lossless Audio Codec (FLAC) (.flac). MPEG-1 Audio Layer 3 (.mp3) if original created in
this format.
Audio Interchange File Format (.aif).
Waveform Audio Format (.wav).
Video data. MPEG-4 (.mp4).
OGG video (.ogv, .ogg).
motion JPEG 2000 (.mj2).
AVCHD video (.avchd).
Documentation and
scripts.
Rich Text Format (.rtf).
PDF/UA, PDF/A or PDF (.pdf).
XHTML or HTML (.xhtml, .htm).
OpenDocument Text (.odt).
Plain text (.txt).
Widely-used formats: MS Word (.doc/.docx), MS Excel
(.xls/.xlsx).
XML marked-up text (.xml) according to an appropriate DTD or
schema, e.g. XHMTL 1.0.
UK Data Service. Format your data. "Create well organised and sustainable data" https://www.ukdataservice.ac.uk/manage-
data/format/file-formats.aspx
Type of data Recommended formats Acceptable formats
Tabular data with
extensive metadata
variable labels,
code labels, and
defined missing
values
SPSS portable format (.por)
delimited text and command ('setup') file
(SPSS, Stata, SAS, etc.)
structured text or mark-up file of metadata
information, e.g. DDI XML file
proprietary formats of statistical packages:
SPSS (.sav), Stata (.dta), MS Access
(.mdb/.accdb)
Tabular data with
minimal metadata
column headings,
variable names
comma-separated values (.csv)
tab-delimited file (.tab)
delimited text with SQL data definition
statements
delimited text (.txt) with characters not
present in data used as delimiters
widely-used formats: MS Excel (.xls/.xlsx),
MS Access (.mdb/.accdb), dBase (.dbf),
OpenDocument Spreadsheet (.ods)
Geospatial data
vector and raster
data
ESRI Shapefile (.shp, .shx, .dbf, .prj, .sbx,
.sbn optional)
geo-referenced TIFF (.tif, .tfw)
CAD data (.dwg)
tabular GIS attribute data
Geography Markup Language (.gml)
ESRI Geodatabase format (.mdb)
MapInfo Interchange Format (.mif) for
vector data
Keyhole Mark-up Language (.kml)
Adobe Illustrator (.ai), CAD data (.dxf or
.svg)
binary formats of GIS and CAD packages
UK Data Service. Format your data. "Create well organised and sustainable data"
https://www.ukdataservice.ac.uk/manage-data/format/file-formats.aspx
Formatos para conservación
Documentación y metadatos
Documentación de los datos
I have never documented my data before. I have both qualitative and
quantitative data and I work on a collaborative
project. Where do I start? …
Documentación de los datos
• No Pánico !
• Comienza pronto !
• Piensa en cuál información es necesaria para entender tus
datos
• Crea una documentación separada de tus datos que incluya info
básica sobre tus datos. Organiza de forma que exista conexión
entre tus datos y la documentación de tus datos.
• Planifica dónde depositar tus datos luego de concluido el Proyecto.
El tipo de respositorio que escojas seguirá un estándar específico
de metadatos.
• Documenta de manera consistente !!!
Documentación de los datos
! Documentación de los = Describir los
datos !
“It's important to log what you do as you do it each step of the way”
Documentación de los datos
Variedad de documentos que acompañan y
describen a los datos para que estos sean
significativos
Ofrecen información contextual de los datos
primarios, importante en el análisis
El contexto de la recopilación de datos: historia
del proyecto, objetivos e hipótesis
Métodos de recopilación de datos: muestreo,
proceso de recopilación de datos, instrumentos
utilizados, libros de códigos, hardware y software
utilizado, escala y resolución, cobertura temporal y
geográfica y fuentes de datos secundarias utilizadas
Estructura de los archivos de datos y relaciones
entre archivos
Documentación de los datos
Validación de datos,
verificación, limpieza y procedimientos
llevados a cabo para asegurar su calidad
Cambios realizados en los datos a lo
largo del tiempo desde su creación
original e identificación de las
diferentes versiones
Información sobre el acceso,
condiciones de uso o confidencialidad
Documentación de los datos
Metadatos
Plan
Collect
Assure
Describe
Preserve
Discover
Integrate
Analyze
Los metadatos se desarrollan durante todo el ciclo de
vida de los datos
Metadatos
Metadatos: Datos sobre los datos.
“Información estructurada que describe, explica,
localiza, o representa algo más” (NISO)
Facilitan la identificación y recuperación. • Título:
• Autor / investigador principal:
• Colaboradores (contributor):
• Identificador:
• Tipo de datos:
• Derechos:
• Fechas:
• Idioma:
• Lugar:
• Resumen de contenido y
palabras
• Investigación.
• Relaciones:
Metadatos
Adaptado de: URL: https://www.ontotext.com/knowledgehub/fundamentals/metadata-fundamental/
• Título:
• Autor /
investigador
principal:
• Materia
• Finaciador
• etc
• Versión de los datos
• Derechos de autor:
• Formatos de
ficheros
• etc
• Esquema de base
de datos
• Taxonomía
• Lista de variables
• Diccionario de datos
¿ Cómo crear metadatos consistentes
para tu proyecto ?
• Puedes describir los metadatos de tus ficheros ya creados, o que
vas a crear durante el proyecto (propuestas, notas, guías de
entrevistas, encuestas, datos agregados, imágenes, periódicos,
etc)
• Si haces cambios importantes en el proyecto, debes actualizar
tus ficheros de metadatos
¿Cómo crear metadatos?
• Nombra y organiza tus ficheros de metadatos, siguiendo las
mismas convenciones utilizadas para los ficheros de datos.
• Formatos abiertos para que sea fácilmente leíble por máquina y
permita su recuperación e interoperabilidad (.xml, json,
dublincore, etc)
¿Cómo crear metadatos?
Plantillas de metadatos
Si estas comenzando, usa plantillas de metadatos para que te sea más
fácil:
_ Create a codebook about your research to accompany the dataset
(DDI Alliance, 2017a). https://ddialliance.org/.../getting.../create-a-
codebook
_ Georgia Tech Library (n.d.) Metadata
Template https://www.library.gatech.edu/smartech-metadata;
_ Use the Dublin Core Metadata Generator (dublincoregenerator, n.d.);
_ The Cornell University (n.d.) guide to writing “readme” style metadata
(with downloadable
template) https://data.research.cornell.edu/content/readme;
Estándares de metadatos
Si quieres metadatos muy estructurados, utiliza un estándar
de metadatos.
• Un estándar de metadatos prove una estructura para describir
los datos con:
–Términos communes que permitan la consistencia entre los
registros
–Definiciones communes para una fácil interpretación
–Estructura común para facilitar recuperar información rapidamente
CC
image
by
ccarlstead
on
Flickr
Estándares de metadatos: Búsqueda
https://rd-alliance.github.io/metadata-directory/standards
Puedes seleccionar el que mejor se ajuste a tu campo disciplinar
usando este catálogo de la RDA:
Estándares de metadatos:
Búsqueda
https://www.dcc.ac.uk/guidance/standards/metadata
Factores a considerar:
• Campo disciplinar (Ciencias Sociales, Artes y
humanidades, etc)
• Tipos de datos
• Política organizacional (¿Qué estandar usan ? )
• ¿Qué recursos están disponibles para crear
metadatos ?
• Otros factores: Recursos humanos, Materiales,
Uso de vocabularies controlados, etc.
¿Cómo generar metadatos?
http://nsteffel.github.io/dublin_core_generator/
The Dublin Core Metadata Generator
(dublincoregenerator, n.d.)
metadata elements are converted into a
machine-readable file in *.xml.
¿Cómo generar metadatos?
Si depositas tus datos en un **Repositorio de
confianza**, ya te asignarían los metadatos que
tenga el estándar que utilice el repositorio.
¿Cómo generar metadatos?
https://data.gulfresearchinitiative.org/metadata-editor-start
Vocuabularios controlados
Use Authority Files and Standard Vocabulary
• Global Change Master Directory
• Geographic Names Information System
• Getty Thesaurus of Geographic Names
• ISO 19115 Topic Category Thesaurus
Documentación de los datos
Ejemplos más usados:
• Cuestionarios,
• Ficheros Readme.txt,
• Libros de códigos (codebooks),
• Guías de usuario,
• Diccionarios de datos, etc
• Software syntax
• Diseños de entrevistas
• Cuadernos de laboratorio
• Esquemas de base de datos
• Reportes metodológicos
! El nivel de especificidad de la documentación es algo
que debe escoger cada Proyecto !
https://mantra.ed.ac.uk/documentationmetadataandcitation/
1. A nivel de proyecto: Se documenta objetivos del
estudio, preguntas de investigación, metodologías,
instrumentos de medida, etc
2. A nivel de Base de datos y Fichero: Se
documenta cómo todos los ficheros que conforman el
data-set se relacionan. Se incluye un
fichero "readme.txt" con la información relevante.
3. A nivel de Variables e ítems: Se incluye un
fichero tipo diccionario, no sólo con los nombres de las
variables, sino con sus respectivas etiquetas explicando
su significado en el contexto del estudio.
Niveles fundamentales para la documentación
Documentación de los datos
¿Con qué propósito se crearon los datos ?
¿Qué contiene el conjunto de datos?
¿Cómo se recopilaron los datos?
¿Quién recopiló los datos y cuándo?
¿Cómo se procesaron los datos?
¿Qué posibles manipulaciones se hicieron a los datos?
¿Cuáles fueron los procedimientos de garantía de
calidad?
¿Cómo se puede acceder a los datos?
Proyecto
Documentación de los datos a nivel de proyecto
Readme files
https://cornell.app.box.com/v/ReadmeTemplate
Fichero en que se describe la
información necesaria para que
los conjuntos de datos sean
comprensibles y reutilizables:
• autoría,
• título,
• descripción,
• metodología,
• proyectos financiadores,
• cobertura temporal y geográfica,
• derechos de uso y privacidad, etc.
• Descripción del contenido de las
carpetas
https://cornell.app.box.com/v/ReadmeTemplate
Readme files
Readme files: ¿Dónde ubicarlo ?
Dryad)
Datos
Documentación a nivel de datos
La documentación a nivel de datos o a nivel de objeto
proporciona información a nivel de objetos
individuales, como imágenes o transcripciones de
entrevistas o variables en una base de datos.
Acompaña a tus datos con los metadatos que lo
describen.
Datos cuantitativos
Documentación a nivel de datos
» Información sobre el archivo de datos:
• Tipo de datos,
• tipo de archivo y formato,
• tamaño,
• scripts de procesamiento de datos.
» Información sobre las variables del fichero:
• Los nombres, etiquetas y descripciones de las variables,
• sus valores,
• una descripción de las variables derivadas o, en su caso,
frecuencias, contingencias básicas etc.
También debería estar disponible la redacción original exacta de la
pregunta.
Datos cuantitativos
Documentación a nivel de datos
Nomenclatura de variables: ejemplo
https://zenodo.org/record/4630482
Diccionario de datos
Diccionario de datos / Elementos
• Texto introductorio y explicativo:
• Contexto: es un proyecto de investigación o de un artículo científico?
• Provee el DOI del dataset o el artículo científico asociado
• Otra información relacionada como versión, etc
• Lista de campos:
• Elemento de la tabla fuente
• Definición de los elementos
• Variables
• Tipo de datos
• Longitud del campo
• Campo requerido ? y/n
• Valores nulos ? Codificación
Diccionario de datos /Ejemplo
Diccionario de datos_Plantilla
https://docs.google.com/spreadsheets/d/1M7VWYwJ3ySKq1C93yUXdLWZB5hebRGnJ
7kukCULDHmc/edit#gid=0
Codificar valores ausentes
Missing Values
• Usa una notación consistente para los campos sin valores
• Utiliza un campo separado (para revision de calidad)
• Tratamiento adecuado de los N/A
• Para campos numéricos, usar valor extremo como ej: -9999
• Para campos caracter, “NA”
Codificar valores ausentes
Dos tipos de No-respuesta en encuestas:
1.1 No_respuesta a nivel de unidad *
1.2 No_respuesta a nivel de ítem**
*1.1 Ocurre cuando el possible encuestado no respondió la encuesta ya sea por
negarse o porque no pudo ser contactado.
* Por tanto el encuestador, durante el tiempo de seguimiento no podrá seguir el
mismo número de sujetos
http://dam.ukdataservice.ac.uk/dataskills/longitudinaldata/4/story_html5.html
Codificar valores ausentes
Incluir la información del número de encuestados y
motivo como variable en el dataset
• Razones de No –
respuesta
• Controlar los sujetos que
abadonaron y los que se
volvieron a incluir
durante el seguimiento
de la encuesta
Codificar valores ausentes
http://dam.ukdataservice.ac.uk/dataskills/longitudinaldata/4/story_html5.html
1.2 No_respuesta a nivel de ítem**
• Cuando el encuestado realiza la encuesta pero no responde todas
las preguntas (Missing or No-válidos)
• Codificar los valores:
Libro de códigos de variables (Codebooks)
Un libro de códigos proporciona información autorizada
(directamente de la investigación) y citable, así como
instrucciones sobre cómo leer, analizar, interpretar y verificar
datos con fines de precisión y replicación.
Coodbooks_Plantilla
https://ddialliance.org/training/getting-started-new-content/create-a-codebook
http://www.nesstar.com/software/publisher.html
Nesstar Publisher - Download
Nesstar Publisher can produce PDF Codebooks and DDI-Codebook
Version 1.2 XML
Coodbooks_Plantilla
Ejemplo
• Ejemplos: The National Survey of Sexual Attitudes and Lifestyles,
2010-2012
https://beta.ukdataservice.ac.uk/datacatalogue/studies/study?id=8786#!/documentation
Datos cualitativos
Documentación a nivel de datos
Métodos y prácticas de investigación a
documentar:
• Copia en blanco del consentimiento informado
• Detalles sobre el establecimiento de entrevistas
• Detalles sobre la selección de sujetos de la
entrevista
• Instrucciones dadas a los entrevistadores
• Instrumentos de recopilación de datos como
cuestionarios de entrevista
Datos cualitativos
Documentación a nivel de datos
Métodos y prácticas de investigación a
documentar:
• Medidas tomadas para eliminar identificadores
directos en los datos (por ejemplo, nombre,
dirección, etc.)
• Cualquier problema que haya surgido durante el
proceso de selección y/o entrevista y cómo se
manejaron
• Lista de entrevistas
Datos cualitativos
Documentación a nivel de datos
La información contextual y de antecedentes y los detalles de los participantes de las
entrevistas, observaciones o diarios se pueden describir al principio de un archivo:
• como un encabezado,
• una página de resumen.
• Previo consentimiento informado
Beginning of the transcript file
Interview date: 08.02.2013 [=8 February 2013]
Interviewer: Matt Miller
Pseudonym of interviewee: Ian (not the real first name of the
interviewee)
Occupation of interviewee: Journalist
Age of interviewee: 32
Gender of interviewee: Male
Datos cualitativos
Documentación a nivel de datos
https://zenodo.org/record/5551096#.YZ4FG_n
MJPY
Datos cualitativos / Datos audiovisuales
Documentación a nivel de datos
Mejor práctica:
• almacenar la información de fondo en una lista de datos creada
manualmente o en un archivo de texto separado: una lista de
datos que acompaña a la recopilación de datos.
• imagen: creador, fecha, ubicación, tema, contenido, derechos de
autor, palabras clave, equipo utilizado
• Extraer metadatos incrustrados con un extractor automático de
metadatos.
Para algunos tipos de datos (archivos de imagen, audio o video), el formato de
archivo no siempre permite grabar información de fondo al principio del archivo
de datos.
Datos cualitativos
Documentación a nivel de datos
Extractor automático de metadatos
ExtractMetadata.com
Datos cualitativos
Documentación a nivel de datos
Ejemplo de “Lista de datos”
Puedes crear una lista de tus datos para documentarlo si lo haces manualmente:
• Los datos recolectados fueron entrevistas grabadas en video.
• La lista de datos contiene información descriptiva relacionada con el entrevistado y el
evento de la entrevista, así como información sobre el modelo y la marca de la
cámara utilizada y la duración del video (en minutos).
Datos cualitativos
Documentación a nivel de datos
Ejemplo de “Lista de datos”
Datos cualitativos / Periódicos, revistas, artículos
Documentación a nivel de datos
La información sobre todos estos recursos debe mantenerse
en archivos separados:
» Material recopilado de publicaciones periódicas en
línea: guarde referencias a recursos web, como URL, y
no olvide que pueden cambiar con el tiempo. Guárdelos
en una lista.
» Materiales de publicaciones periódicas: la
información bibliográfica debe detallarse
cuidadosamente (autor(es), título, fecha de publicación,
etc.);
checklist _ Control calidad
• Revisa la organización del contenido y los descriptores de
tus archivos para asegurarte que no faltan elementos clave.
• Ordena los registros por parámetros clave para resaltar
posibles discrepancias
• Verifica la validez de los valores medidos. Busca valores
imposibles o outliers (Ejemplo: Un pH de 74; Una altura de
2.50, etc)
• Verifica el marco temporal de tus datos. Genera gráficos
exploratorios de series temporales para detectar valores
anómalos o posibles lagunas en tus datos.
checklist _ Control calidad
• Valores ausentes o Missing values en tu data ? No olvides codificarlos
adecuadamente, e incluir los códigos en la documentación que acompaña a
tus datos en el proyecto.
• Comprueba el tipo de datos, escala, tamaño de las imágenes, etc.
Tipologías errores dan lugar a análisis fallidos.
• Como parte del propio Análisis Exploratorio de Datos (AED), revisa las
estadísticas descriptiva de tu dataset (media, mediana, cuartiles, valores
mínimos y valores máximos)
• Elimina todo parámetro variable que no aporte información relevante
Recursos
Data Management Plan Template: Open Science Workflows.
https://zenodo.org/record/4701021#.YWgqIflBxPa
Science Europe. Practical Guide to International Alignment of Research Data
management .
https://scienceeurope.org/media/4brkxxe5/se_rdm_practical_guide_extended_
final.pdf
Guide for Social Scieence Data preparation and Archiving
https://www.icpsr.umich.edu/files/deposit/dataprep.pdf
CESSDA Training Team. (2020). CESSDA Data Management Expert Guide. CESSDA
ERIC. https://doi.org/10.5281/zenodo.3820473.
https://zenodo.org/record/3820473#.YaDSHPnMJPY
UPO. Biblioteca/CRAI. Guía de Gestión de Datos de investigación.
https://guiasbib.upo.es/gestion_datos_de_investigacion
Recursos
• Data management guidance: http://dmptool.org/dm_guidance
• DCC How-To Guide on developing a data management and sharing plan:
http://www.dcc.ac.uk/resources/how-guides/develop-data-plan.
• NSF requirements on data management plans:
http://www.nsf.gov/pubs/policydocs/pappguide/nsf11001/gpg_2.jsp - dmp
• DMPTool Quick Start Guide: http://dmptool.org/quickstartguide
• Example DMPs from DataONE: http://www.dataone.org/data-management-
planning
• Making a research project understandable. Guide for data documentation:
https://zenodo.org/record/1914401#.YYKLJvnMJPY
149
¿Preguntas?
Yusnelkis Milanés Guisado
@Milanes_guisado
ymilgui@upo.es
Gracias !

Contenu connexe

Tendances

Búsquedas de información para elaboración de trabajos académicos
Búsquedas de información para elaboración de trabajos académicosBúsquedas de información para elaboración de trabajos académicos
Búsquedas de información para elaboración de trabajos académicosÁngel M. Delgado-Vázquez
 
Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2Ángel M. Delgado-Vázquez
 
Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...
Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...
Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...Ángel M. Delgado-Vázquez
 
Revisiones bibliográficas sistematizadas en Ciencias Sociales y Humanidades
Revisiones bibliográficas sistematizadas en Ciencias Sociales y HumanidadesRevisiones bibliográficas sistematizadas en Ciencias Sociales y Humanidades
Revisiones bibliográficas sistematizadas en Ciencias Sociales y HumanidadesÁngel M. Delgado-Vázquez
 
Búsquedas Especializadas
Búsquedas EspecializadasBúsquedas Especializadas
Búsquedas Especializadasmamorenop
 
La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016Erla Mariela Morales Morgado
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosSocialBiblio
 
Documentación: Búsqueda y organización de información científica
Documentación: Búsqueda y organización de información científicaDocumentación: Búsqueda y organización de información científica
Documentación: Búsqueda y organización de información científicaNicolas Robinson-Garcia
 
Aportaciones presentadas en la I Reunión de Servicios de Evaluación Científica
Aportaciones presentadas en la I Reunión de Servicios de Evaluación CientíficaAportaciones presentadas en la I Reunión de Servicios de Evaluación Científica
Aportaciones presentadas en la I Reunión de Servicios de Evaluación CientíficaTorres Salinas
 
Almetrics: Métricas alternativas e impacto social de la investigación signifi...
Almetrics: Métricas alternativas e impacto social de la investigación signifi...Almetrics: Métricas alternativas e impacto social de la investigación signifi...
Almetrics: Métricas alternativas e impacto social de la investigación signifi...Julio Alonso Arévalo
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16datos.ua.es
 
Altmetrics indicadores, utilidades y limitaciones
Altmetrics indicadores, utilidades y limitacionesAltmetrics indicadores, utilidades y limitaciones
Altmetrics indicadores, utilidades y limitacionesTorres Salinas
 
Utilidad e interpretación de las métricas científicas en el sector editorial
Utilidad  e interpretación de las métricas científicas en el sector editorial Utilidad  e interpretación de las métricas científicas en el sector editorial
Utilidad e interpretación de las métricas científicas en el sector editorial Flor Trillo
 
Consideraciones sobre métricas alternativas en documentación científica
Consideraciones sobre métricas alternativas en documentación científicaConsideraciones sobre métricas alternativas en documentación científica
Consideraciones sobre métricas alternativas en documentación científicaFlor Trillo
 

Tendances (20)

Búsquedas de información para elaboración de trabajos académicos
Búsquedas de información para elaboración de trabajos académicosBúsquedas de información para elaboración de trabajos académicos
Búsquedas de información para elaboración de trabajos académicos
 
Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2
 
Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...
Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...
Competencias en información para la elaboración del Trabajo Fin de Grado (Fac...
 
Revisiones bibliográficas sistematizadas en Ciencias Sociales y Humanidades
Revisiones bibliográficas sistematizadas en Ciencias Sociales y HumanidadesRevisiones bibliográficas sistematizadas en Ciencias Sociales y Humanidades
Revisiones bibliográficas sistematizadas en Ciencias Sociales y Humanidades
 
Evaluación de los recursos de Internet
Evaluación de los recursos de InternetEvaluación de los recursos de Internet
Evaluación de los recursos de Internet
 
Búsquedas Especializadas
Búsquedas EspecializadasBúsquedas Especializadas
Búsquedas Especializadas
 
La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016
 
Sexenios de investigación: Novedades 2016
Sexenios de investigación: Novedades 2016Sexenios de investigación: Novedades 2016
Sexenios de investigación: Novedades 2016
 
Métricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y BibliotecariosMétricas 2.0, Bibliotecas y Bibliotecarios
Métricas 2.0, Bibliotecas y Bibliotecarios
 
Emilio Delgado Lopez-Cozar Clarosocuros de la evaluación científica en España...
Emilio Delgado Lopez-Cozar Clarosocuros de la evaluación científica en España...Emilio Delgado Lopez-Cozar Clarosocuros de la evaluación científica en España...
Emilio Delgado Lopez-Cozar Clarosocuros de la evaluación científica en España...
 
Documentación: Búsqueda y organización de información científica
Documentación: Búsqueda y organización de información científicaDocumentación: Búsqueda y organización de información científica
Documentación: Búsqueda y organización de información científica
 
Aportaciones presentadas en la I Reunión de Servicios de Evaluación Científica
Aportaciones presentadas en la I Reunión de Servicios de Evaluación CientíficaAportaciones presentadas en la I Reunión de Servicios de Evaluación Científica
Aportaciones presentadas en la I Reunión de Servicios de Evaluación Científica
 
Economia Ests. Graduados
Economia Ests. GraduadosEconomia Ests. Graduados
Economia Ests. Graduados
 
Almetrics: Métricas alternativas e impacto social de la investigación signifi...
Almetrics: Métricas alternativas e impacto social de la investigación signifi...Almetrics: Métricas alternativas e impacto social de la investigación signifi...
Almetrics: Métricas alternativas e impacto social de la investigación signifi...
 
Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16Red Maredata - Universidad de Alicante - EDAUA16
Red Maredata - Universidad de Alicante - EDAUA16
 
Altmetrics indicadores, utilidades y limitaciones
Altmetrics indicadores, utilidades y limitacionesAltmetrics indicadores, utilidades y limitaciones
Altmetrics indicadores, utilidades y limitaciones
 
Comunicació presentada al VI Foro sobre la Evaluación de la Calidad de la Edu...
Comunicació presentada al VI Foro sobre la Evaluación de la Calidad de la Edu...Comunicació presentada al VI Foro sobre la Evaluación de la Calidad de la Edu...
Comunicació presentada al VI Foro sobre la Evaluación de la Calidad de la Edu...
 
Dora
DoraDora
Dora
 
Utilidad e interpretación de las métricas científicas en el sector editorial
Utilidad  e interpretación de las métricas científicas en el sector editorial Utilidad  e interpretación de las métricas científicas en el sector editorial
Utilidad e interpretación de las métricas científicas en el sector editorial
 
Consideraciones sobre métricas alternativas en documentación científica
Consideraciones sobre métricas alternativas en documentación científicaConsideraciones sobre métricas alternativas en documentación científica
Consideraciones sobre métricas alternativas en documentación científica
 

Similaire à Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades"

Primeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosPrimeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosFernando-Ariel Lopez
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptxRupertoCisneros3
 
Presentación investigación cuantitativa
Presentación investigación cuantitativaPresentación investigación cuantitativa
Presentación investigación cuantitativaUNEFA
 
9 pasos de la investigacion comercial
9 pasos de la investigacion comercial9 pasos de la investigacion comercial
9 pasos de la investigacion comercialALLAM BONSENORE
 
Técnicas investigación social
Técnicas investigación socialTécnicas investigación social
Técnicas investigación socialMarjorie Picott
 
Unidad 2 metodologia para el desarrollo de proyectos
Unidad  2   metodologia para el desarrollo de proyectosUnidad  2   metodologia para el desarrollo de proyectos
Unidad 2 metodologia para el desarrollo de proyectosJosefina Guerrero Garcia
 
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptxCOMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptxrosalinachs1685
 
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptxCOMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptxrosalinachs1685
 
Mdi106 sesion1 slides_introduccion_metodologia_investigadora
Mdi106 sesion1 slides_introduccion_metodologia_investigadoraMdi106 sesion1 slides_introduccion_metodologia_investigadora
Mdi106 sesion1 slides_introduccion_metodologia_investigadoraJavier Arcal
 
4 formato de-guia-de-productos-academicos-me__1
4 formato de-guia-de-productos-academicos-me__14 formato de-guia-de-productos-academicos-me__1
4 formato de-guia-de-productos-academicos-me__1CesarSamillan
 
Elaboración de plan de gestion de datos
Elaboración de plan de gestion de datosElaboración de plan de gestion de datos
Elaboración de plan de gestion de datosrotty1
 
Proceso de investigacion_de_mercado
Proceso de investigacion_de_mercadoProceso de investigacion_de_mercado
Proceso de investigacion_de_mercadoMonik Del Carmen
 
Tecnicas de investigacion entrevista, encuesta y observación
Tecnicas de investigacion   entrevista, encuesta y observaciónTecnicas de investigacion   entrevista, encuesta y observación
Tecnicas de investigacion entrevista, encuesta y observaciónOscar Caceres
 
levantamiento-de-la-informacionclase1
levantamiento-de-la-informacionclase1levantamiento-de-la-informacionclase1
levantamiento-de-la-informacionclase1duberlisg
 
levantamiento-de-la-informacionclase1
 levantamiento-de-la-informacionclase1 levantamiento-de-la-informacionclase1
levantamiento-de-la-informacionclase1duberlisg
 

Similaire à Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades" (20)

Primeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datosPrimeros para implementar un plan de gestión de datos
Primeros para implementar un plan de gestión de datos
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
 
Gestión de Datos Científicos
Gestión de Datos CientíficosGestión de Datos Científicos
Gestión de Datos Científicos
 
Presentación investigación cuantitativa
Presentación investigación cuantitativaPresentación investigación cuantitativa
Presentación investigación cuantitativa
 
Capitulo iii. metodologia de investigación ejemplo pdf
Capitulo iii. metodologia de investigación ejemplo pdfCapitulo iii. metodologia de investigación ejemplo pdf
Capitulo iii. metodologia de investigación ejemplo pdf
 
Sistemas CRIS para el monitoreo de publicaciones e investigadores: El caso de...
Sistemas CRIS para el monitoreo de publicaciones e investigadores: El caso de...Sistemas CRIS para el monitoreo de publicaciones e investigadores: El caso de...
Sistemas CRIS para el monitoreo de publicaciones e investigadores: El caso de...
 
9 pasos de la investigacion comercial
9 pasos de la investigacion comercial9 pasos de la investigacion comercial
9 pasos de la investigacion comercial
 
Técnicas investigación social
Técnicas investigación socialTécnicas investigación social
Técnicas investigación social
 
Unidad 2 metodologia para el desarrollo de proyectos
Unidad  2   metodologia para el desarrollo de proyectosUnidad  2   metodologia para el desarrollo de proyectos
Unidad 2 metodologia para el desarrollo de proyectos
 
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptxCOMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA.pptx
 
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptxCOMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptx
COMPUTACIÓN EN LA INVESTIGACIÓN CUALITATIVA 233.pptx
 
Mdi106 sesion1 slides_introduccion_metodologia_investigadora
Mdi106 sesion1 slides_introduccion_metodologia_investigadoraMdi106 sesion1 slides_introduccion_metodologia_investigadora
Mdi106 sesion1 slides_introduccion_metodologia_investigadora
 
Recoleccion y analisis de datos
Recoleccion y analisis de datosRecoleccion y analisis de datos
Recoleccion y analisis de datos
 
4 formato de-guia-de-productos-academicos-me__1
4 formato de-guia-de-productos-academicos-me__14 formato de-guia-de-productos-academicos-me__1
4 formato de-guia-de-productos-academicos-me__1
 
Elaboración de plan de gestion de datos
Elaboración de plan de gestion de datosElaboración de plan de gestion de datos
Elaboración de plan de gestion de datos
 
Proceso de investigacion_de_mercado
Proceso de investigacion_de_mercadoProceso de investigacion_de_mercado
Proceso de investigacion_de_mercado
 
Tecnicas de investigacion entrevista, encuesta y observación
Tecnicas de investigacion   entrevista, encuesta y observaciónTecnicas de investigacion   entrevista, encuesta y observación
Tecnicas de investigacion entrevista, encuesta y observación
 
levantamiento-de-la-informacionclase1
levantamiento-de-la-informacionclase1levantamiento-de-la-informacionclase1
levantamiento-de-la-informacionclase1
 
levantamiento-de-la-informacionclase1
 levantamiento-de-la-informacionclase1 levantamiento-de-la-informacionclase1
levantamiento-de-la-informacionclase1
 

Plus de Biblioteca CRAI de la Universidad Pablo de Olavide

Plus de Biblioteca CRAI de la Universidad Pablo de Olavide (20)

Gestores de Referencias (PDI) - 2022.pdf
Gestores de Referencias (PDI) - 2022.pdfGestores de Referencias (PDI) - 2022.pdf
Gestores de Referencias (PDI) - 2022.pdf
 
Cómo usar la colección de la biblioteca crai eureka y guíasbib (2022)
Cómo usar la colección de la biblioteca crai eureka y guíasbib (2022)Cómo usar la colección de la biblioteca crai eureka y guíasbib (2022)
Cómo usar la colección de la biblioteca crai eureka y guíasbib (2022)
 
Acreditación del profesorado universitario (programa PEP): cómo preparar una ...
Acreditación del profesorado universitario (programa PEP): cómo preparar una ...Acreditación del profesorado universitario (programa PEP): cómo preparar una ...
Acreditación del profesorado universitario (programa PEP): cómo preparar una ...
 
Introducción a los gestores​ de referencias bibliográficas​
Introducción a los gestores​  de referencias bibliográficas​Introducción a los gestores​  de referencias bibliográficas​
Introducción a los gestores​ de referencias bibliográficas​
 
Identidad académica. Normalización de la firma y perfiles de autor
Identidad académica. Normalización de la firma y perfiles de autorIdentidad académica. Normalización de la firma y perfiles de autor
Identidad académica. Normalización de la firma y perfiles de autor
 
Introducción a los gestores de referencias bibliográficas
Introducción a los gestores de referencias bibliográficasIntroducción a los gestores de referencias bibliográficas
Introducción a los gestores de referencias bibliográficas
 
Acreditación del profesorado universitario (programa PEP): cómo preparar una ...
Acreditación del profesorado universitario (programa PEP): cómo preparar una ...Acreditación del profesorado universitario (programa PEP): cómo preparar una ...
Acreditación del profesorado universitario (programa PEP): cómo preparar una ...
 
Conceptos clave edición multimedia
Conceptos clave edición multimediaConceptos clave edición multimedia
Conceptos clave edición multimedia
 
Herramienta de edición y retoque de imágenes: GIMP​
Herramienta de edición y retoque de imágenes: GIMP​Herramienta de edición y retoque de imágenes: GIMP​
Herramienta de edición y retoque de imágenes: GIMP​
 
Competencias para el desarrollo de Objetos de Aprendizaje Multimedia
Competencias para el desarrollo de Objetos de Aprendizaje MultimediaCompetencias para el desarrollo de Objetos de Aprendizaje Multimedia
Competencias para el desarrollo de Objetos de Aprendizaje Multimedia
 
Programa bienvenida profesorado nuevo ingreso Universidad Pablo de Olavide
Programa bienvenida profesorado nuevo ingreso Universidad Pablo de OlavidePrograma bienvenida profesorado nuevo ingreso Universidad Pablo de Olavide
Programa bienvenida profesorado nuevo ingreso Universidad Pablo de Olavide
 
Mendeley Institutional Edition: más que gestión de referencias (2019)
Mendeley Institutional Edition: más que gestión de referencias (2019)Mendeley Institutional Edition: más que gestión de referencias (2019)
Mendeley Institutional Edition: más que gestión de referencias (2019)
 
La Tesis Doctoral en la Universidad Pablo de Olavide (STEM)
La Tesis Doctoral en la Universidad Pablo de Olavide (STEM)La Tesis Doctoral en la Universidad Pablo de Olavide (STEM)
La Tesis Doctoral en la Universidad Pablo de Olavide (STEM)
 
Programa de Doctorado en Biotecnología, Ingeniería y Tecnología Química (UPO)
Programa de Doctorado en Biotecnología, Ingeniería y Tecnología Química (UPO)Programa de Doctorado en Biotecnología, Ingeniería y Tecnología Química (UPO)
Programa de Doctorado en Biotecnología, Ingeniería y Tecnología Química (UPO)
 
El plagio académico: cómo evitarlo. El uso de citas y referencias bibliográf...
El plagio académico: cómo evitarlo.  El uso de citas y referencias bibliográf...El plagio académico: cómo evitarlo.  El uso de citas y referencias bibliográf...
El plagio académico: cómo evitarlo. El uso de citas y referencias bibliográf...
 
Acreditación de la actividad investigadora para el reconocimiento y obtención...
Acreditación de la actividad investigadora para el reconocimiento y obtención...Acreditación de la actividad investigadora para el reconocimiento y obtención...
Acreditación de la actividad investigadora para el reconocimiento y obtención...
 
Zotero: gestor social de referencias bibliográficas
Zotero: gestor social de referencias bibliográficasZotero: gestor social de referencias bibliográficas
Zotero: gestor social de referencias bibliográficas
 
Identidad Académica Digital, visibilidad y evaluación de la ciencia: Google S...
Identidad Académica Digital, visibilidad y evaluación de la ciencia: Google S...Identidad Académica Digital, visibilidad y evaluación de la ciencia: Google S...
Identidad Académica Digital, visibilidad y evaluación de la ciencia: Google S...
 
Aumenta la visibilidad de tus publicaciones: publica en Acceso Abierto
Aumenta la visibilidad de tus publicaciones: publica en Acceso AbiertoAumenta la visibilidad de tus publicaciones: publica en Acceso Abierto
Aumenta la visibilidad de tus publicaciones: publica en Acceso Abierto
 
Caja de herramientas de GIMP
Caja de herramientas de GIMPCaja de herramientas de GIMP
Caja de herramientas de GIMP
 

Dernier

Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1alfredo130306
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.pptssuserbdc329
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfJC Díaz Herrera
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiaveronicayarpaz
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacienteMedicinaInternaresid1
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfPOULANDERSONDELGADOA2
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxJafetColli
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .GIANELAKAINACHALLCOJ2
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfJC Díaz Herrera
 
Trabajo Final de Powerbi DMC Indicadores.pptx
Trabajo Final de Powerbi DMC Indicadores.pptxTrabajo Final de Powerbi DMC Indicadores.pptx
Trabajo Final de Powerbi DMC Indicadores.pptxlleonm
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfJC Díaz Herrera
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoBESTTech1
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoRaúl Figueroa
 
Metodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfMetodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfarteagaara
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismofariannys5
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxMiguelPerz4
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxHhJhv
 

Dernier (20)

Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
Posiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdfPosiciones del IDH a nivel global en México (1982-2024).pdf
Posiciones del IDH a nivel global en México (1982-2024).pdf
 
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombiadecreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
decreto 2090 de 2003.pdf actividades de alto riesgo en Colombia
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Posiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdfPosiciones en el IDH global de EUA (1950-2024).pdf
Posiciones en el IDH global de EUA (1950-2024).pdf
 
Trabajo Final de Powerbi DMC Indicadores.pptx
Trabajo Final de Powerbi DMC Indicadores.pptxTrabajo Final de Powerbi DMC Indicadores.pptx
Trabajo Final de Powerbi DMC Indicadores.pptx
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Metodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdfMetodos de esterilizacion _20240418_181249_0000.pdf
Metodos de esterilizacion _20240418_181249_0000.pdf
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 

Curso "Buenas prácticas en Gestión de datos en Ciencias Sociales y Humanidades"

  • 1. Buenas prácticas de Gestión de datos en Humanidades y Ciencias Sociales Yusnelkis Milanés Guisado. PhD. Universidad Pablo de Olavide
  • 2. La gestión de datos de investigación Los datos de investigación en Hum. y CS. Buscar datos de investigación Documentación y descripción de los datos Temas a tratar
  • 4. Datos y estructura de ficheros Nomenclatura de ficheros Integridad de los datos Construcción de variables Documentación del proyecto Documentación de los datos Computer-assisted interviewing Using integrated software Entrada de datos y documentación Pre-test y estudios pilotos Confidencialidad Cuestiones iniciales para comenzar un proyecto
  • 6. La gestión de datos de investigación La gestión de datos de investigación refiere a todos los procesos que te permiten organizar, procesar y estructurar los datos de tu investigación durante el ciclo de vida del Proyecto…
  • 7. Concienciación sobre publicar datasets METADATOS Datasets (Bruto) de CALIDAD Reproducibiliadad Ciencia reproducible
  • 9. Requisitos de las agencias de financiación OECD Principles and Guidelines for Access to Research Data from Public Funding (2004-2007) “… open access to scientific data should be adopted as the international norm for the exchange of scientific data derived from publicly funded research.” The National Science Foundation, January2011 “requires, in all proposals a supplementary document of no more than two pages describing a Data Management Plan for the proposed research.“ European Research Council , Open Access Guidelines for Researchers, June 2012 “…primary data, as well as data-related products such as computer codes, is deposited in the relevant databases as soon as possible, preferably immediately after publication and in any case not later than six months after the date of publication.”
  • 10. Requisitos de las agencias de financiación
  • 11. NACIONAL Ministerio de Ciencia e Innovación (2020) Resolución de la Convocatoria de Proyectos de I+D+I 2020 de la Agencia Estatal de Investigación [en línea] Disponible en: https://www.ciencia.gob.es/stfls/MICINN/Ayudas/PE_2017_2020/PE_Orientada_Retos_Sociedad/FICHEROS/Proyectos_ID I_Retos_Investigacion/ConvocatoriaPID2020_Resolucion20201111.pdf
  • 12.
  • 13. La importancia de planificar (DMP)
  • 14. La importancia de planificar (DMP) Documento formal que describe qué harás con tus datos durante tu investigación y después que completes tu proyecto EL DMP debe contener solo la información más importante y preferiblemente no debería exceder los 10,000 caracteres (incluidos los espacios).
  • 15. Descripción de los datos • Tipos de datos creados o re-usados • Organización de los datos y versiones • Usuarios de los datos Documentación y Metadatos • Esquemas de metadatos • Documentación de los datos: FAIR • Control calidad de los datos Almacenamiento y seguridad • Almacenamiento, seguridad, estrategia de back-up, preservación a largo plazo, costes, barreras técnicas, etc. Componentes de un PGD
  • 16. Componentes de un PGD Compartir datos y preservación a largo plazo • Compartir datos, restricciones, cuáles datos y cuándo • repositorios, identificadores persistentes Aspectos legales y éticos • Gestión de los accesos a los datos, posibles barreras • Barreras legales y éticas, licencias, re-uso, • Tratamiento de los datos sensibles • Roles (Quién se encarga y dirige de la gestión de datos ?) • Recursos Responsabilidades y recursos
  • 17. Los datos de investigación
  • 18. Componentes de un PGD “datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales” • Numéricos, descriptivos o visuales. • Encontrarse en estado bruto o analizado, pueden ser experimentales u observacionales.
  • 19. Datos e información Datos e Información conceptos estrechamente relacionados. •Los datos constituyen la base a través de la cual, mediante procesos de procesamiento y análisis, se convierte en información. •Los datos se comprenden esencialmente al nivel en el cuál las medidas son coleccionadas, y pueden ser: •Cualitativos o cuantitativos •Factuales o no –factuales •Numéricos •Textuales •Audiovisuales
  • 20. Datos de investigación • Datos primarios: Datos coleccionados para un propósito particular ( Ej: responder a una pregunta de investigación) por el propio investigador y / o su equipo de manera directa. • Datos secundarios: Datos coleccionados o producidos con intermediación de otras fuentes (ejemplo, historia clínica de pacientes, entrevistas, cuestionarios, etc) _ Limitaciones
  • 21. • Textos: Cuestionarios, Transcripciones de entrevistas, Codebooks, Metodologías, Flujos de trabajo, Procedimientos, Protocolos, Notebooks, Diarios de investigación, etc. • Numéricos: Respuestas a encuestas, Registros médicos, Respuestas a tests, Hojas de Excel, instrumentos de medida, Info geoespacial, etc. (Stata, Spss, Excel, Gis) • Multimedia: Imágenes, Audio recordings, Videos (jpeg, png, tiff, mp3, wav, mpeg, quicktime) Tipos de Datos de investigación
  • 22. Tipos de Datos de investigación • Códigos: Fuentes de código, Algoritmos, Scripts (R, Python, Java, MATLAB) • Sintáxis: Software-specific code files to carry out data processing steps (e.g. data preparation, linkage, statistical analysis, etc) (Stata, SPSS, R, MATLAB) • Específico de una disciplina: Los tipos de datos pueden incluir: Flexible Image Transport System (FITS) [Astronomy]; Crystallographic Information File (CIF) [Chemistry]; GRIdded Binary (GRIB) [Meteorology]
  • 23. Por su origen Datos públicos Datos privados
  • 25. Por su nivel de procesamiento Brutos Procesados Estadísticos
  • 26. Tipos de datos de investigación en CS y HUM Datos de investigación. survey data (opinion polls, voting records) Social media data Audiovisual data (images, maps, sound, video, multimedia) raw measurments, numeric tables, government statistics, and índices, census text (fieldnotes, transcripts, blogs, e-mails) spatial (zonal, event, spatial referent) Audio recordings (From interviews)
  • 27. Descripción de los datos Descripción de los datos Almacenamiento y seguridad Aspectos legales y éticos Descripción de los datos Nuevo conocimiento  Tipologías  Resumen de resultados  Sesiones informativas  Posts en Medios de prensa  Conferencias  Artículos académicos • Cuestionario de la encuesta • Diseño de la entrevista • Coding book No sólo datos ….
  • 28. Tipos de datos de investigación en CS y HUM https://youtu.be/GvirMb1vmww Nuevos tipos de investigación en Ciencias Sociales y archivo de datos • El uso de datos de medio sociales
  • 29. Métodos y datos Cuantitativos Cross-sectional studies Longitudinal studies Opinion polls Questionnaires Social attitude surveys Surveys and censuses Cualitativos Semi-structured interviews Unstructured interviews Unstructured Observation Open questionnaire survey Keeping logs and diaries Focal groups (Groups discussions) TIPO Método Formato
  • 30. Datos agregados o macrodatos https://trainingmodules.ukdataservice.ac.uk/aggregate/#/lessons/Vn9Rr2Gm5V8BKIpmeRfXPfabJv_RQOj3 Ejemplo de indicadores agregados: esperanza de vida, tasas de empleo, PIB, emisiones de gases de efecto invernadero, recuentos de censos Producidos por datos combinados de individuos (a partir de aplicar métodos de agregación estadística como suma o promedio)
  • 31. Datos de censos: Datos construidos a partir de diferentes niveles (áreas, autoridades locales, nivel nacional, etc) https://trainingmodules.ukdataservice.ac.uk/aggregate/#/lessons/rX3tpMY1MyJSLUKIy2Qx7XrZbhEjz5g5 https://ukdataservice.ac.uk/help/data-types/census-data/ https://beta.ukdataservice.ac.uk/datacatalogue/studies/#!?Search=&Rows=10&Sort=0&DataTypeFacet=Census%20data&Pag e=1&DateFrom=440&DateTo=2021 Datos agregados o macrodatos
  • 33. Datos de series temporales https://trainingmodules.ukdataservice.ac.uk/aggregate/#/lessons/Vn9Rr2Gm5V8BKIpmeRfXPfabJv_R QOj3 Datos agregados o macrodatos
  • 34. Buscar datos de investigación
  • 35. Proveedores internacionales de macrodatos • The World Bank • Organization for Economic Co-operation and Development (OECD) • International Monetary Fund (IMF) • The International Labour Organization (ILO). • UNESCO • UNIDO • HUMAN RIGTHS ATLAS • International Monetary Fund •International Labour Organisation •UNICEF •UN Statistics •UNESCO •Eurostat https://stats2.digitalresources.jisc.ac.uk/
  • 36. Barómetros: Datos de opinion pública http://www.cis.es/cis/opencm/ES/11_barometros/index.jsp Buscar datos
  • 37. Barómetros: Datos de opinion pública https://www.globalbarometer.net/ Buscar datos https://www.europarl.europa.eu/at-your-service/en/be- heard/eurobarometer Global barometer Eurobarometer
  • 41. https://www.icpsr.umich.edu/web/pages/ The Inter-University Consortium for Political and Social Research Buscar datos
  • 45. https://www.cessda.eu/ CESSDA stands for Consortium of European Social Science Data Archives and ERIC stands for European Research Infrastructure Consortium. Buscar datos
  • 47. Buscar datos The Word Bank https://datos.bancomundial.org/
  • 49. Buscar datos Google Dataset Search https://datasetsearch.research.google.com/
  • 54. Ciencia Abierta “Open Science is the practice of science in such a way that others can collaborate and contribute, where research data, lab notes and other research processes are freely available, under terms that enable reuse, redistribution and reproduction of the research and its underlying data and methods” https://www.fosteropenscience.eu/foster-taxonomy/open-science-definition
  • 55. Ciencia abierta vs Acceso abierto Open Access ≠ Open Science Acceso libre y gratuito a:​ • Publicaciones científicas ​ 1. Acceso libre y gratuito a:​ • Publicaciones científicas ​ • Datos de investigación (FAIR)​ • Métricas abiertas​ • Software libre​ • Recursos educativos en abierto ​ • Open peer-review • Ciencia ciudadana ​
  • 56. Ciencia abierta OSF: Open Science Framework
  • 57. Datos FAIR • se pueden encontrar en Internet (Identificadores persistentes, metadatos), • son accesibles (derechos y licencias claros), • están en un formato utilizable, • se identifican de una manera única y persistente para que se pueda hacer referencia a ellos. El principal objetivo de los principios FAIR es preparar los datos de investigación para que tanto humanos y máquinas puedan recuperarlos y reutilizarlos de la mejor manera posible... Los repositorios cubren la mayoría de los aspectos Objetivo: Datos FAIR
  • 58. Datos FAIR Objetivo: Datos FAIR Planificar Preparar Recolección de datos Procesamiento Análisis Depósito / Compartir / Re-uso
  • 59. Datos FAIR Herramientas para valorar si tus datos son FAIR: • FAIR data self-assessment tool (https://ardc.edu.au/resources/working-with-data/fair- data/fair-self-assessment-tool/) • FAIR-Aware (https://fairaware.dans.knaw.nl/)
  • 60. Datos FAIR vs Datos abiertos Tan abierto como sea posible, tan cerrado como sea necesario La accesibilidad limitada, por ejemplo, debido a la protección de la privacidad de los datos, no contradice los principios FAIR.
  • 62. Organización de carpetas y ficheros Reduce tu carga de trabajo Re-usa tus ideas y las de tu equipo Recicla tus datos Ahorra tiempo !!! Organiza y documenta tus Datos !!!
  • 63. Organización y descripción de los datos Datos no es sólo coleccionar los datos … Importa la información descriptiva de los datos y los procedimientos.
  • 64. Todos los materiales relevantes deben ser organizados en carpetas Ejemplos de materiales relevantes: • Invitación a partircipar en una investigación • Hoja de los datos de los participantes • Consentimiento informado • Diseño de la entrevista • Descripción de la codificación a utilizar en la tranncripción • Descripción del procedimiento de anonimización • Datasets • Códigos de variables • Información descriptiva del Proyecto, • etc Organización y descripción de los datos
  • 65. Organización de carpetas y ficheros Organiza las carpetas de manera lógica y sistemática* Criterios: • Organización • Contexto • Tipologías • Unidades de análisis, objetivos y métodos Example A) For this survey, data and documentation files are held in separate folders. Data files are further organized according to data type and then according to research activity. Documentation files are organized also according to the type of file and research activity. This helps to restrict the level of folders to three or four deep and not to have more than ten items in each list. Separa los datos limpios en una copia Máster
  • 66. Diseñando ficheros de datos cualitativos Los eventos individuales deben ser estructurados en ficheros individuales • Ex: Una entrevista, una imagen, o un audio recording Luego estos ficheros se organizan en carpetas similares
  • 67. Nomenclatura de ficheros • El nombre de un fichero es su principal identificador • La estrategia de nomenclatura debe ser consistente en el tiempo y entre diferentes personas • Un equipo de colaboración debe seguir la misma convención establecida y documentada en un fichero independiente.
  • 68. Nomenclatura de ficheros Número de elementos o criterios a considerar: • Descripción del contenido • Tipos de datos, métodos, etc • Número del proyecto • Nombre del creador • Nombre del equipo de invest. o Dpto. asociado a los datos • Fecha de creación; Fecha de publicación • Número de versión https://mantra.ed.ac.uk/organisingdata/
  • 69. Nomenclatura de ficheros Usa nombres de ficheros descriptivos * • Únicos • Refleje el contenido • Evita uso de caracteres raros y espacios • Puede incluir guiones bajos • Corto (No más de 25 caracteres) Mala práctica: Misdatos.xls Misdatosbuenos.xls 2001_data.xls Version_buena.xls Buena práctica: Altmetrics_ 01_ Modelos_V3_20201121_YMG. Altmetrics – Nombre proj. 01 – Paquete de trabajo Modelosdata2021 – Datos del experimento, actividad, etc. V3 – Versión 20201121 – Fecha YMG – Autor(a)
  • 70. Nomenclatura de ficheros IP02R0120190731.docx ¿ Qué nos dice el nombre de este fichero ? Componentes del nombre: I P02 R01 20190731 • I = interview (type of data) • P[n] = participant ID - participant 02 • R[n] = researcher ID – researcher 01 • Fecha entrevista en format YYYYMMDD – 20190731
  • 71. Nomenclatura de ficheros Ejemplo: » 20130311_interview2_audio.wav » 20130311_interview2_trans.rtf » 20130311_interview2_image.jpg • La forma más conveniente es dar a todos los archivos conectados al mismo evento un 'identificador de evento' al principio del nombre, es decir, en la primera parte del nombre. • La última parte del nombre se puede usar para transmitir los detalles o tipo, por ejemplo, si se trata de una cinta de audio, transcripción o una imagen fija.
  • 72. Nomenclatura de ficheros ¿Qué hacer cuando son muchos ficheros a re-nombrar ? • Ex: Imágenes generadas automaticamente por cámaras • Batch renaming (también conocido como “mass file renaming”, “bulk renaming”) “3 Ways to Batch Rename Files in Windows”. https://www.maketecheasier.com/batch-rename-files-in-windows/ Ant Renamer: www.antp.be/software/renamer RenameIT: sourceforge.net/prpjects/renameit Bulk Rename Utility: www.bulkrenameutility.co.uk/ File explorer (Windows)
  • 73. Organización de las variables » Relaciones entre variables: • conjuntos de variables relacionadas con el mismo fenómeno • variables originales o derivadas La posición de las variables en el archivo de datos, sus nombres y etiquetas deben reflejar lo siguiente:
  • 74. Organización de las variables • » Enlaces a elementos del estudio y fuentes de los datos: Por ejemplo, diferentes instrumentos de medición, diferentes partes del cuestionario, diferentes bases de datos de fuentes, diferentes métodos de observación, etc. • Tipos de variables: Por ejemplo, variables de identificación y otras variables complementarias con diferentes roles específicos: • indicadores sociodemográficos, • variables generadas obtenidas por transformación de información original, etc. La posición de las variables en el archivo de datos, sus nombres y etiquetas deben reflejar lo siguiente:
  • 77. Nomenclatura de variables Hay tres enfoques básicos para nombrar variables: » Uso de códigos numéricos que reflejan la posición de la variable en un sistema (por ejemplo, V001, V002, V003...); » Uso de códigos que se refieran al instrumento de investigación (por ejemplo, número de pregunta en un cuestionario: Q1a, Q1b, Q2, Q3a...); » Uso de nombres mnemotécnicos que se refieren al contenido de variables (por ejemplo, NACIMIENTO para el año de nacimiento, EDAD para la edad del encuestado, etc.). La palabra mnemotécnico significa "ayuda a la memoria".
  • 80. Control de versiones • ¿A cuántos nos ha sucedido esto durante un proyecto de investigación ?
  • 81. Control de versiones • Control automático o manual • Debes registrar los cambios en la data, no importa cuán pequeños o "insignificantes" sean en ese momento. • Usa autobackup para esto, en lugar de guardar y archivar múltiples versiones. ! Asegúrate siempre de mantener la copia original (Raw Data) !
  • 82. Control de versiones Las versiones podrían establecerse de la siguiente manera: V1: fase de recopilación de datos, V2: la fase de limpieza de datos y V3: agrega cualquier variable construida (si corresponde, al final del libro de códigos, con las etiquetas apropiadas y las fórmulas utilizadas para crearlas registradas cuando se crean las variables)
  • 83. Control de versiones Apache® Subversion® Un sistema de control de versiones de código abierto fundado en 2000 por CollabNet, Inc.
  • 84. Control de versions (Code Versioning) • GitHub: https://github.com • GitLab: https://about.gitlab.com • Bitbucket: https://bitbucket.org • Gitea: https://gitea.io/en-us #Tips Si tu código es extenso ( Usa Git repsitorios ) Si tu código es pequeño (1 o 2 ficheros, Control manual )
  • 85. Control de versiones • Wikis y Google Docs proveen rastreo de versiones automático • El Open Science Framework (OSF) proporciona una herramienta de gestión de proyectos de código abierto y gratuita
  • 87. Elección de formatos • Seleccionar formatos abiertos, no propietarios. • Elegir formatos comunes al campo disciplinar al que se está trabajando: Para asegurar la interoperabilidad y la reutilización de los datos. • Tener en cuenta el tiempo en que se espera conservar los datos • Seleccione formatos sin cifrar y sin compilar
  • 88. Elección de formatos Formatos comunes de los datos en CS. Text - ASCII, Word, PDF Numéricos - ASCII, Excel, Access, SPSS, STATA Multimedia - jpeg, tiff, dicom, mpeg, quicktime, Wav Espacial - geotiff, KLM, KMZ Modelos - 3D, statistical
  • 89. Elección de formatos UK Data Service. Format your data. "Create well organised and sustainable data" https://www.ukdataservice.ac.uk/manage- data/format/file-formats.aspx • ¿Cuál es el mejor formato para la creación de los datos ? • ¿Cuál es el major formato para el análisis de los datos ? • ¿Cuál es el major formato para la conservación a largo-plazo y la compartición de los datos? • Open vs. Formatos propietarios
  • 90. Formatos para conservación Type of data Recommended formats Acceptable formats Textual data Rich Text Format (.rtf). Plain text, ASCII (.txt). eXtensible Mark-up Language (.xml) text according to an appropriate Document Type Definition (DTD) or schema. Hypertext Mark-up Language (.html). Widely-used formats: MS Word (.doc/.docx). Some software-specific formats: NUD*IST, NVivo and ATLAS.ti. Image data. TIFF 6.0 uncompressed (.tif). JPEG (.jpeg, .jpg, .jp2) if original created in this format. GIF (.gif). TIFF other versions (.tif, .tiff). RAW image format (.raw). Photoshop files (.psd). BMP (.bmp). PNG (.png). Adobe Portable Document Format (PDF/A, PDF) (.pdf). Audio data. Free Lossless Audio Codec (FLAC) (.flac). MPEG-1 Audio Layer 3 (.mp3) if original created in this format. Audio Interchange File Format (.aif). Waveform Audio Format (.wav). Video data. MPEG-4 (.mp4). OGG video (.ogv, .ogg). motion JPEG 2000 (.mj2). AVCHD video (.avchd). Documentation and scripts. Rich Text Format (.rtf). PDF/UA, PDF/A or PDF (.pdf). XHTML or HTML (.xhtml, .htm). OpenDocument Text (.odt). Plain text (.txt). Widely-used formats: MS Word (.doc/.docx), MS Excel (.xls/.xlsx). XML marked-up text (.xml) according to an appropriate DTD or schema, e.g. XHMTL 1.0. UK Data Service. Format your data. "Create well organised and sustainable data" https://www.ukdataservice.ac.uk/manage- data/format/file-formats.aspx
  • 91. Type of data Recommended formats Acceptable formats Tabular data with extensive metadata variable labels, code labels, and defined missing values SPSS portable format (.por) delimited text and command ('setup') file (SPSS, Stata, SAS, etc.) structured text or mark-up file of metadata information, e.g. DDI XML file proprietary formats of statistical packages: SPSS (.sav), Stata (.dta), MS Access (.mdb/.accdb) Tabular data with minimal metadata column headings, variable names comma-separated values (.csv) tab-delimited file (.tab) delimited text with SQL data definition statements delimited text (.txt) with characters not present in data used as delimiters widely-used formats: MS Excel (.xls/.xlsx), MS Access (.mdb/.accdb), dBase (.dbf), OpenDocument Spreadsheet (.ods) Geospatial data vector and raster data ESRI Shapefile (.shp, .shx, .dbf, .prj, .sbx, .sbn optional) geo-referenced TIFF (.tif, .tfw) CAD data (.dwg) tabular GIS attribute data Geography Markup Language (.gml) ESRI Geodatabase format (.mdb) MapInfo Interchange Format (.mif) for vector data Keyhole Mark-up Language (.kml) Adobe Illustrator (.ai), CAD data (.dxf or .svg) binary formats of GIS and CAD packages UK Data Service. Format your data. "Create well organised and sustainable data" https://www.ukdataservice.ac.uk/manage-data/format/file-formats.aspx Formatos para conservación
  • 93. Documentación de los datos I have never documented my data before. I have both qualitative and quantitative data and I work on a collaborative project. Where do I start? …
  • 94. Documentación de los datos • No Pánico ! • Comienza pronto ! • Piensa en cuál información es necesaria para entender tus datos • Crea una documentación separada de tus datos que incluya info básica sobre tus datos. Organiza de forma que exista conexión entre tus datos y la documentación de tus datos. • Planifica dónde depositar tus datos luego de concluido el Proyecto. El tipo de respositorio que escojas seguirá un estándar específico de metadatos. • Documenta de manera consistente !!!
  • 95. Documentación de los datos ! Documentación de los = Describir los datos ! “It's important to log what you do as you do it each step of the way”
  • 96. Documentación de los datos Variedad de documentos que acompañan y describen a los datos para que estos sean significativos Ofrecen información contextual de los datos primarios, importante en el análisis
  • 97. El contexto de la recopilación de datos: historia del proyecto, objetivos e hipótesis Métodos de recopilación de datos: muestreo, proceso de recopilación de datos, instrumentos utilizados, libros de códigos, hardware y software utilizado, escala y resolución, cobertura temporal y geográfica y fuentes de datos secundarias utilizadas Estructura de los archivos de datos y relaciones entre archivos Documentación de los datos
  • 98. Validación de datos, verificación, limpieza y procedimientos llevados a cabo para asegurar su calidad Cambios realizados en los datos a lo largo del tiempo desde su creación original e identificación de las diferentes versiones Información sobre el acceso, condiciones de uso o confidencialidad Documentación de los datos
  • 100. Metadatos Metadatos: Datos sobre los datos. “Información estructurada que describe, explica, localiza, o representa algo más” (NISO) Facilitan la identificación y recuperación. • Título: • Autor / investigador principal: • Colaboradores (contributor): • Identificador: • Tipo de datos: • Derechos: • Fechas: • Idioma: • Lugar: • Resumen de contenido y palabras • Investigación. • Relaciones:
  • 101. Metadatos Adaptado de: URL: https://www.ontotext.com/knowledgehub/fundamentals/metadata-fundamental/ • Título: • Autor / investigador principal: • Materia • Finaciador • etc • Versión de los datos • Derechos de autor: • Formatos de ficheros • etc • Esquema de base de datos • Taxonomía • Lista de variables • Diccionario de datos
  • 102. ¿ Cómo crear metadatos consistentes para tu proyecto ?
  • 103. • Puedes describir los metadatos de tus ficheros ya creados, o que vas a crear durante el proyecto (propuestas, notas, guías de entrevistas, encuestas, datos agregados, imágenes, periódicos, etc) • Si haces cambios importantes en el proyecto, debes actualizar tus ficheros de metadatos ¿Cómo crear metadatos?
  • 104. • Nombra y organiza tus ficheros de metadatos, siguiendo las mismas convenciones utilizadas para los ficheros de datos. • Formatos abiertos para que sea fácilmente leíble por máquina y permita su recuperación e interoperabilidad (.xml, json, dublincore, etc) ¿Cómo crear metadatos?
  • 105. Plantillas de metadatos Si estas comenzando, usa plantillas de metadatos para que te sea más fácil: _ Create a codebook about your research to accompany the dataset (DDI Alliance, 2017a). https://ddialliance.org/.../getting.../create-a- codebook _ Georgia Tech Library (n.d.) Metadata Template https://www.library.gatech.edu/smartech-metadata; _ Use the Dublin Core Metadata Generator (dublincoregenerator, n.d.); _ The Cornell University (n.d.) guide to writing “readme” style metadata (with downloadable template) https://data.research.cornell.edu/content/readme;
  • 106. Estándares de metadatos Si quieres metadatos muy estructurados, utiliza un estándar de metadatos. • Un estándar de metadatos prove una estructura para describir los datos con: –Términos communes que permitan la consistencia entre los registros –Definiciones communes para una fácil interpretación –Estructura común para facilitar recuperar información rapidamente CC image by ccarlstead on Flickr
  • 107. Estándares de metadatos: Búsqueda https://rd-alliance.github.io/metadata-directory/standards Puedes seleccionar el que mejor se ajuste a tu campo disciplinar usando este catálogo de la RDA:
  • 109. Factores a considerar: • Campo disciplinar (Ciencias Sociales, Artes y humanidades, etc) • Tipos de datos • Política organizacional (¿Qué estandar usan ? ) • ¿Qué recursos están disponibles para crear metadatos ? • Otros factores: Recursos humanos, Materiales, Uso de vocabularies controlados, etc.
  • 110. ¿Cómo generar metadatos? http://nsteffel.github.io/dublin_core_generator/ The Dublin Core Metadata Generator (dublincoregenerator, n.d.) metadata elements are converted into a machine-readable file in *.xml.
  • 111. ¿Cómo generar metadatos? Si depositas tus datos en un **Repositorio de confianza**, ya te asignarían los metadatos que tenga el estándar que utilice el repositorio.
  • 113. Vocuabularios controlados Use Authority Files and Standard Vocabulary • Global Change Master Directory • Geographic Names Information System • Getty Thesaurus of Geographic Names • ISO 19115 Topic Category Thesaurus
  • 114. Documentación de los datos Ejemplos más usados: • Cuestionarios, • Ficheros Readme.txt, • Libros de códigos (codebooks), • Guías de usuario, • Diccionarios de datos, etc • Software syntax • Diseños de entrevistas • Cuadernos de laboratorio • Esquemas de base de datos • Reportes metodológicos ! El nivel de especificidad de la documentación es algo que debe escoger cada Proyecto ! https://mantra.ed.ac.uk/documentationmetadataandcitation/
  • 115. 1. A nivel de proyecto: Se documenta objetivos del estudio, preguntas de investigación, metodologías, instrumentos de medida, etc 2. A nivel de Base de datos y Fichero: Se documenta cómo todos los ficheros que conforman el data-set se relacionan. Se incluye un fichero "readme.txt" con la información relevante. 3. A nivel de Variables e ítems: Se incluye un fichero tipo diccionario, no sólo con los nombres de las variables, sino con sus respectivas etiquetas explicando su significado en el contexto del estudio. Niveles fundamentales para la documentación Documentación de los datos
  • 116. ¿Con qué propósito se crearon los datos ? ¿Qué contiene el conjunto de datos? ¿Cómo se recopilaron los datos? ¿Quién recopiló los datos y cuándo? ¿Cómo se procesaron los datos? ¿Qué posibles manipulaciones se hicieron a los datos? ¿Cuáles fueron los procedimientos de garantía de calidad? ¿Cómo se puede acceder a los datos? Proyecto Documentación de los datos a nivel de proyecto
  • 117. Readme files https://cornell.app.box.com/v/ReadmeTemplate Fichero en que se describe la información necesaria para que los conjuntos de datos sean comprensibles y reutilizables: • autoría, • título, • descripción, • metodología, • proyectos financiadores, • cobertura temporal y geográfica, • derechos de uso y privacidad, etc. • Descripción del contenido de las carpetas
  • 119. Readme files: ¿Dónde ubicarlo ? Dryad)
  • 120. Datos Documentación a nivel de datos La documentación a nivel de datos o a nivel de objeto proporciona información a nivel de objetos individuales, como imágenes o transcripciones de entrevistas o variables en una base de datos. Acompaña a tus datos con los metadatos que lo describen.
  • 121. Datos cuantitativos Documentación a nivel de datos » Información sobre el archivo de datos: • Tipo de datos, • tipo de archivo y formato, • tamaño, • scripts de procesamiento de datos. » Información sobre las variables del fichero: • Los nombres, etiquetas y descripciones de las variables, • sus valores, • una descripción de las variables derivadas o, en su caso, frecuencias, contingencias básicas etc. También debería estar disponible la redacción original exacta de la pregunta.
  • 123. Nomenclatura de variables: ejemplo https://zenodo.org/record/4630482
  • 125. Diccionario de datos / Elementos • Texto introductorio y explicativo: • Contexto: es un proyecto de investigación o de un artículo científico? • Provee el DOI del dataset o el artículo científico asociado • Otra información relacionada como versión, etc • Lista de campos: • Elemento de la tabla fuente • Definición de los elementos • Variables • Tipo de datos • Longitud del campo • Campo requerido ? y/n • Valores nulos ? Codificación
  • 126. Diccionario de datos /Ejemplo
  • 128. Codificar valores ausentes Missing Values • Usa una notación consistente para los campos sin valores • Utiliza un campo separado (para revision de calidad) • Tratamiento adecuado de los N/A • Para campos numéricos, usar valor extremo como ej: -9999 • Para campos caracter, “NA”
  • 129. Codificar valores ausentes Dos tipos de No-respuesta en encuestas: 1.1 No_respuesta a nivel de unidad * 1.2 No_respuesta a nivel de ítem** *1.1 Ocurre cuando el possible encuestado no respondió la encuesta ya sea por negarse o porque no pudo ser contactado. * Por tanto el encuestador, durante el tiempo de seguimiento no podrá seguir el mismo número de sujetos http://dam.ukdataservice.ac.uk/dataskills/longitudinaldata/4/story_html5.html
  • 130. Codificar valores ausentes Incluir la información del número de encuestados y motivo como variable en el dataset • Razones de No – respuesta • Controlar los sujetos que abadonaron y los que se volvieron a incluir durante el seguimiento de la encuesta
  • 131. Codificar valores ausentes http://dam.ukdataservice.ac.uk/dataskills/longitudinaldata/4/story_html5.html 1.2 No_respuesta a nivel de ítem** • Cuando el encuestado realiza la encuesta pero no responde todas las preguntas (Missing or No-válidos) • Codificar los valores:
  • 132. Libro de códigos de variables (Codebooks) Un libro de códigos proporciona información autorizada (directamente de la investigación) y citable, así como instrucciones sobre cómo leer, analizar, interpretar y verificar datos con fines de precisión y replicación.
  • 134. http://www.nesstar.com/software/publisher.html Nesstar Publisher - Download Nesstar Publisher can produce PDF Codebooks and DDI-Codebook Version 1.2 XML Coodbooks_Plantilla
  • 135. Ejemplo • Ejemplos: The National Survey of Sexual Attitudes and Lifestyles, 2010-2012 https://beta.ukdataservice.ac.uk/datacatalogue/studies/study?id=8786#!/documentation
  • 136. Datos cualitativos Documentación a nivel de datos Métodos y prácticas de investigación a documentar: • Copia en blanco del consentimiento informado • Detalles sobre el establecimiento de entrevistas • Detalles sobre la selección de sujetos de la entrevista • Instrucciones dadas a los entrevistadores • Instrumentos de recopilación de datos como cuestionarios de entrevista
  • 137. Datos cualitativos Documentación a nivel de datos Métodos y prácticas de investigación a documentar: • Medidas tomadas para eliminar identificadores directos en los datos (por ejemplo, nombre, dirección, etc.) • Cualquier problema que haya surgido durante el proceso de selección y/o entrevista y cómo se manejaron • Lista de entrevistas
  • 138. Datos cualitativos Documentación a nivel de datos La información contextual y de antecedentes y los detalles de los participantes de las entrevistas, observaciones o diarios se pueden describir al principio de un archivo: • como un encabezado, • una página de resumen. • Previo consentimiento informado Beginning of the transcript file Interview date: 08.02.2013 [=8 February 2013] Interviewer: Matt Miller Pseudonym of interviewee: Ian (not the real first name of the interviewee) Occupation of interviewee: Journalist Age of interviewee: 32 Gender of interviewee: Male
  • 139. Datos cualitativos Documentación a nivel de datos https://zenodo.org/record/5551096#.YZ4FG_n MJPY
  • 140. Datos cualitativos / Datos audiovisuales Documentación a nivel de datos Mejor práctica: • almacenar la información de fondo en una lista de datos creada manualmente o en un archivo de texto separado: una lista de datos que acompaña a la recopilación de datos. • imagen: creador, fecha, ubicación, tema, contenido, derechos de autor, palabras clave, equipo utilizado • Extraer metadatos incrustrados con un extractor automático de metadatos. Para algunos tipos de datos (archivos de imagen, audio o video), el formato de archivo no siempre permite grabar información de fondo al principio del archivo de datos.
  • 141. Datos cualitativos Documentación a nivel de datos Extractor automático de metadatos ExtractMetadata.com
  • 142. Datos cualitativos Documentación a nivel de datos Ejemplo de “Lista de datos” Puedes crear una lista de tus datos para documentarlo si lo haces manualmente: • Los datos recolectados fueron entrevistas grabadas en video. • La lista de datos contiene información descriptiva relacionada con el entrevistado y el evento de la entrevista, así como información sobre el modelo y la marca de la cámara utilizada y la duración del video (en minutos).
  • 143. Datos cualitativos Documentación a nivel de datos Ejemplo de “Lista de datos”
  • 144. Datos cualitativos / Periódicos, revistas, artículos Documentación a nivel de datos La información sobre todos estos recursos debe mantenerse en archivos separados: » Material recopilado de publicaciones periódicas en línea: guarde referencias a recursos web, como URL, y no olvide que pueden cambiar con el tiempo. Guárdelos en una lista. » Materiales de publicaciones periódicas: la información bibliográfica debe detallarse cuidadosamente (autor(es), título, fecha de publicación, etc.);
  • 145. checklist _ Control calidad • Revisa la organización del contenido y los descriptores de tus archivos para asegurarte que no faltan elementos clave. • Ordena los registros por parámetros clave para resaltar posibles discrepancias • Verifica la validez de los valores medidos. Busca valores imposibles o outliers (Ejemplo: Un pH de 74; Una altura de 2.50, etc) • Verifica el marco temporal de tus datos. Genera gráficos exploratorios de series temporales para detectar valores anómalos o posibles lagunas en tus datos.
  • 146. checklist _ Control calidad • Valores ausentes o Missing values en tu data ? No olvides codificarlos adecuadamente, e incluir los códigos en la documentación que acompaña a tus datos en el proyecto. • Comprueba el tipo de datos, escala, tamaño de las imágenes, etc. Tipologías errores dan lugar a análisis fallidos. • Como parte del propio Análisis Exploratorio de Datos (AED), revisa las estadísticas descriptiva de tu dataset (media, mediana, cuartiles, valores mínimos y valores máximos) • Elimina todo parámetro variable que no aporte información relevante
  • 147. Recursos Data Management Plan Template: Open Science Workflows. https://zenodo.org/record/4701021#.YWgqIflBxPa Science Europe. Practical Guide to International Alignment of Research Data management . https://scienceeurope.org/media/4brkxxe5/se_rdm_practical_guide_extended_ final.pdf Guide for Social Scieence Data preparation and Archiving https://www.icpsr.umich.edu/files/deposit/dataprep.pdf CESSDA Training Team. (2020). CESSDA Data Management Expert Guide. CESSDA ERIC. https://doi.org/10.5281/zenodo.3820473. https://zenodo.org/record/3820473#.YaDSHPnMJPY UPO. Biblioteca/CRAI. Guía de Gestión de Datos de investigación. https://guiasbib.upo.es/gestion_datos_de_investigacion
  • 148. Recursos • Data management guidance: http://dmptool.org/dm_guidance • DCC How-To Guide on developing a data management and sharing plan: http://www.dcc.ac.uk/resources/how-guides/develop-data-plan. • NSF requirements on data management plans: http://www.nsf.gov/pubs/policydocs/pappguide/nsf11001/gpg_2.jsp - dmp • DMPTool Quick Start Guide: http://dmptool.org/quickstartguide • Example DMPs from DataONE: http://www.dataone.org/data-management- planning • Making a research project understandable. Guide for data documentation: https://zenodo.org/record/1914401#.YYKLJvnMJPY