Contenu connexe Similaire à Sistema de Informação de Pesquisa Corrente (Current Research Information System – CRIS) na USP (20) Sistema de Informação de Pesquisa Corrente (Current Research Information System – CRIS) na USP1. 1
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Ciência Aberta
Dados, Recursos, Repositorios e CRIS
Alexandre P. Uchoa
Research Management Consultant
Elsevier, Latin America South
a.uchoa@elsevier.com
2. 2
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
1. Ciência Aberta
2. Dados Abertos
3. Recursos Abertos
4. Repositorios
5. CRIS
3. 3
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Ciência Aberta
4. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
5
• Maior complexidade, rapidez e impacto dos problemas
contemporâneos
• Maior conscientização da sociedade quanto aos
benefícios mas também quanto aos custos da Ciência
• Vastas quantidades de dados observacionais são
necessárias para resolver esses problemas
5. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
6
Muito mais dados
Disponibilidade de grandes quantidades de dados de observação por
sensores e fluxos contínuos de dados
6. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
7
Muito mais dados
Capacidades de processamento, de armazenamento e de comunicação
cada vez maiores e mais acessíveis
Novas ferramentas on-line de análise e pesquisa aparecendo
constantemente
7. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
8
Muito mais dados
O cidadão comum está podendo se envolver cada vez mais em práticas
científicas e está assim estendendo o seu alcance
8. 10
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
10
Compartilhar: a premissa da Ciência Aberta
9. 11
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Quais forças vem promovendo iniciativas de Ciência Aberta?
10. | 12Open Access | 12
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Carlos Moedas, Comissário da DG de Pesquisa e Inovação:
ERA Conference, “A new start for Europe: Opening up to an ERA of Innovation” (22 junho)
11. | 13Open Access | 13
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
1. INOVAÇÃO ABERTA
Como levar mais pesquisas para o mercado?
• Um "Selo de Excelência" para além de H2020 (Fundos Estruturais)
• Conselho Europeu da Inovação (ERC)
2. CIÊNCIA ABERTA
Como a Europa pode tirar proveito da maior produção científica do mundo?
• Uma nuvem Europeia aberta da ciência
• Iniciativa Europeia quanto a integridade da investigação (conferência de 2016)
• Criação de uma agenda sobre Ciência Aberta
3. ABERTO AO MUNDO
Ou seja, Diplomacia para a Ciência
• 4 setores-chave: alimentação, água, energia e saúde
• Exemplos: EDCTP, Sesame
Carlos Moedas, Comissário da DG de Pesquisa e Inovação:
ERA Conference, “A new start for Europe: Opening up to an ERA of Innovation” (22 junho)
12. | 14Open Access | 14
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Robert Jan Smits, Diretor Geral, DG Research & Innovation
ERA Conference, “A new start for Europe: Opening up to an ERA of Innovation” (22 junho)
• Crescimento exponencial dos dados
• Disponibilidade de tecnologias digitais
• Aumento da população científica
• Demanda publica por uma ciencia melhor e mais
eficiente
• Cobrança por maior contabilização, capacidade de
resposta e transparencia
• Desafios sociais que surgem mais velozmente
• Debe contribuir para o crescimento economico
13. 15
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Forças levando a uma nova prática científica?
(Comissão Europeia DG de Pesquisa e Inovação, 2015)
14. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
O que é exatamente Ciencia Aberta?
15. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
18
Deficiências da conduta científica atual
• Meios questionáveis para se gerar provas
• Intolerância em relação a novas teses e abordagens incomuns
• A “verdade" está baseada simplesmente nas citações
• Há culturas inflexíveis dentro de muitas disciplinas
• Rejeição a resultados negativos e a estudos não confirmatórios
• Métodos questionáveis para avaliar a qualidade científica
Deficiências da conduta científica atual
• Meios questionáveis para se gerar provas
• Intolerância em relação a novas teses e abordagens incomuns
• A “verdade" está baseada simplesmente nas citações
• Há culturas inflexíveis dentro de muitas disciplinas
• Rejeição a resultados negativos e a estudos não confirmatórios
• Métodos questionáveis para avaliar a qualidade científica
16. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
19
• A resiliência do artigo científico como um
formato de comunicação eficaz
• Manter um posicionamento social mais
amplo das práticas de pesquisa científica e
de comunicação
• A crescente importância para a Ciência em
preservar suas fronteiras sociais
• A resiliência do artigo científico como um
formato de comunicação eficaz
• Manter um posicionamento social mais
amplo das práticas de pesquisa científica e
de comunicação
• A crescente importância para a Ciência em
preservar suas fronteiras sociais
Relutância em se adotar uma maior abertura
17. | 20Open Access | 20
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Consulta publica feita pela Commissão Europeia
http://ec.europa.eu/digital-agenda/en/news/
final-report-science-20-public-consultation
Principais forças associadas à Ciência Aberta
18. | 22Open Access | 22
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Dados Abertos
19. Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
1. Reproduzir ou verificar pesquisas
2. Disponibilizar ao público os resultados das pesquisas
financiadas com fundos públicos
3. Permitir que outras pessoas façam novas perguntas
sobre ou a partir dos dados
4. Levar ao avanço do estado da pesquisa e inovação
1. Reproduzir ou verificar pesquisas
2. Disponibilizar ao público os resultados das pesquisas
financiadas com fundos públicos
3. Permitir que outras pessoas façam novas perguntas
sobre ou a partir dos dados
4. Levar ao avanço do estado da pesquisa e inovação
Objetivos fundamentais do compartilhamento de dados
científicos
Objetivos fundamentais do compartilhamento de dados
científicos
20. 24
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
O que é mesmo "dado científico"?
• Diversos tipos de dados laboratoriais,
incluindo dados espectrográficos, de
sequenciamento gnômico e de microscopia
eletrônica;
• Dados observacionais, tais como dados de
sensoriamento remoto, geoespaciais e
socioeconômicos; e
• Outras formas de dados gerados ou
compilados, por seres humanos ou máquinas.
Uhlir & Cohen, 2011
Além das manifestações digitais da literatura (incluindo texto, som, imagens fixas,
imagens em movimento, modelos, jogos ou simulações), refere-se também a
formas de dados e bases de dados que geralmente requerem a assistência de
máquinas computacionais e software para serem úteis, tais como:
21. 25
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Os dados podem existir apenas aos olhos do
seu proprietário
Uma coleção que é considerada dados pelo
coletor, pode não ser percebida como tal
pelos destinatários
Um investigador pode estar criando coleções
de registros sem perceber o quão valioso elas
podem ser como "dados"
Peculiaridades do "dado científico"
22. 26
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
A hospedagem/guarda de dados científicos ainda é
muito fragmentada
Researcher survey, 1202 respondents
(PARSE.insight 2010)
Onde você guarda atualmente os dados de sua pesquisa?
23. 27
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Bauer, B. (Bruno) et all, Forschende und ihre Daten. Ergebnisse einer österreichweiten Befragung, Oct
2015, https://phaidra.univie.ac.at/detail_object/o:407736
It’s lostIt’s lost
Take it with meTake it with me
Don’t knowDon’t know
I hand it to my successorI hand it to my successor
OtherOther
A hospedagem/guarda de dados científicos ainda é
muito fragmentada
O que acontece na prática com os dados de sua pesquisa quando você
deixa a sua instituição?
24. 28
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Pesquisadores podem não ter os conhecimentos,
recursos ou incentivos para compartilhar seus dados
• Dados de pesquisa assumem muitas formas, são
tratados de muitas maneiras, usando muitas abordagens
• Dados de pesquisa não estão prontamente disponíveis
em uma forma compartilhável
• Práticas de partilha de dados podem variar muito
• Dados são difíceis de interpretar uma vez removidos de
seu contexto inicial
• Dados muitas vezes não existem em formas transferíveis
• Alguns dados não são partilháveis por razões éticas ou
epistemológicas
• E quais são exatamente "os dados" associados a uma
determinada pesquisa?
• E quais deveriam ser compartilhados?
Compartilhar dados é então
problemático?
25. 29
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Problemas científicos habituais do
compartilhamento de dados:
• Interpretações contestadas dos dados
• Relações entre estruturas de bases de
dados e práticas de coleta de dados
• Perguntas sobre quando e por que
certas leituras de instrumentos contam
como dados
• A "regressão do experimentador"
• Limites entre documentos e dados
Compartilhar dados é então
problemático?
26. 30
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Os 10 componentes para uso efetivos de dados
cientificos10.Integração–empregodemetadados
paragarantir(re)uso
10.Integração–empregodemetadados
paragarantir(re)uso
Guarda
Compar-
tilhamento
(Re)uso
9. Reusável (permite que se use ferramentas nele)
8. Reprodutível
7. Confiável (e.g. revisado)
6. Compreensível (disponibilidade de descrições/metodo usado)
5. Citável
4. Encontrável (dado está indexado ou conectado)
3. Acessível
2. Armazenado (por longo-prazo & independente de formato)
1. Preservado (existente em alguma forma)
27. 31
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
COSTELLO, M. J. et al. Strategies for the sustainability of online open-access biodiversity databases. Biological Conservation, v. 173, p. 155–165, maio 2014.
Ingredientes necessários para um repositórios
de dados
28. 32
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
4 tipos de Dados, 4 tipos de Hospedagem
29. 33
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• CISL Research Data Archive
• Dryad
• ESO/ST-ECF Science Archive Facility
• International Tree-Ring Data Bank
• Inter-university Consortium for Political and Social Research
• Knowledge Network for Biocomplexity
• National Archive of Computerized Data on Aging
• National Climatic Data Center
• National Geophysical Data Center
• National Snow and Ice Data Center
• National Oceanographic Data Center
• Oak Ridge National Laboratory Distributed Active Archive Center
• Pangaea - Data Publisher for Earth & Environmental Science
• World Data Center
• DataONE
https://en.wikipedia.org/wiki/Research_data_archiving
Exemplos de repositorios de dados:
Ciencias Naturais
30. 34
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
https://en.wikipedia.org/wiki/Research_data_archiving
• re3data.org
• http://www.cessda.net/about/members.html
• http://www.cessda.org/
• http://www.sa.dk/content/us/about_us
• http://www.icpsr.umich.edu/
• http://www.ropercenter.uconn.edu
• http://dataarchives.ss.ucla.edu/
• http://rda.ucar.edu
Exemplos de repositorios de dados:
Ciencias Sociais
33. 37
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
37
Pilha de Tecnologias da Web Semantica
34. 38
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
38
Linked Open Data = dados vinculados que têm seu conteúdo aberto
Tratam-se de dados publicados segundo padrões estruturados
(vocabulário controlado) que lhes permitem se interligarem a outros
dados já interligados.
É adequado a consultas semânticas e se baseia em tecnologias Web,
como HTTP, RDF e URIs que podem ser lidas automaticamente por
computadores.
Permite o reconhecimento e, por conseguinte, o compartilhamento de
dados de fontes diversas graças ao uso de ontologias e padrões
abertos de metadados.
http://linkeddata.org/data-sets
"Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"
35. 39
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
39
Dados extraídos da Wikipedia:
Cerca de 3,4 milhões de conceitos
descritos por 1 bilhão de triplos,
incluindo resumos em 11 línguas
diferentes/
37. 41
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
38. 42
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Envolve diferentes organizações e acordos formais
• Os dados são editados pelos membros e hospedados por uma
ou mais instituições
• Compartilham-se protocolos comuns e há padrões próprios de
dados
• Provisão conjunta de dados que contribuem para a obtenção de
impactos e sinergias
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
39. 43
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Continuous Plankton Recorder (CPR)
• FishBase
• MycoBank
• WoRMS (former ERMS)
• Euro+Med PlantBase
• Ocean Biogeographic Information System (OBIS)
• Global Biodiversity Information Facility (GBIF)
• Freshwater Animal Diversity Assessment (FADA)
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
40. 44
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Envolve diferentes organizações que atuam como contribuintes
• Indexação mantida por uma única instituição
• Geralmente funciona como um catálogo (de espécies)
• Oferece motores de busca com variados níveis de sofisticação
• Evolui à medida que novos dados se materializam e as
necessidades se tornam mais sofisticadas
• Inclui ferramentas capazes de pesquisas federadas em bancos
de dados
• Usa tecnologias abertas para facilidade de integração
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
41. 45
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Datacite.org
• Digital Curation Centre (DCC)
• Biogeoinformatics of the Hexacorals
• Catalogue of Life
• Index Herbariorum
• International Plant Name Index
• Fauna Europea
• VIVO *
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
42. 46
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Organização e anotação de dados de várias fontes
• Propor e manter padrões taxonômicos
• Normalmente é própria de cada disciplina específica
• Também se propõem padrões de requisitos de
dados
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
43. 47
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• CODATA - the Committee on Data for Science and
Technology
• CERIF - Common European Research Information.
Format
• CASRAI - Consortia Advancing Standards in Research
Administration Information
• FOSTER – Facilitate Open Science Training for
European Research
• Dublin Core Metadata Initiative (DCMI)
Bancos de
dados,
integrados ou
distribuídos
Indices,
catalogos e
ferramentas
Padrões
taxonomicos,
metadados e
boas práticas
Ecossistema de Compartilhamento de Dados
Físico Conceitual
44. | 48Open Access | 48
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Recursos Abertos
45. | 49Open Access | 49
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Recursos abertos populares para a gestão de
conteúdo cientifico
46. | 50Open Access | 50
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
CERIF – Commone European Research Information Format
• O CERIF é um modelo de dados (centrado em dados) que permite uma representação
(meta-data) de entidades de pesquisa, suas atividades / interconexões e seus
resultados (output),
• Propicia o arquivamento, acesso e intercâmbio de informações de pesquisa e apoio
à transferência de conhecimento.
• Um CRIS pode ser implementado usando um subconjunto ou super-conjunto do
modelo
47. | 51Open Access | 51
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
É neutro em termos de arquitetura.
O modelo de dados pode ser implementado de forma relacional, orientado a
objetos, ou por busca e recuperação de informação (incluindo WWW).
O modelo de processos pode ser implementado em SGBD, por consulta
(centralizada ou distribuída), HTML web / harvesting / IR-query, tecnologia
avançada baseada em conhecimento.
É basicamente um modelo ER totalmente normalizado.
Casos de uso são normalmente expressos em instruções SQL.
Inclui variados tipos de entidades: de base, de resultados, de infraestrutura etc.
Inclui ligação entre entidades.
Suporte a múltiplas línguas.
Modelo é “semanticamente consistente”.
Inclui métricas, indicadores e identidades federadas.
É neutro em termos de arquitetura.
O modelo de dados pode ser implementado de forma relacional, orientado a
objetos, ou por busca e recuperação de informação (incluindo WWW).
O modelo de processos pode ser implementado em SGBD, por consulta
(centralizada ou distribuída), HTML web / harvesting / IR-query, tecnologia
avançada baseada em conhecimento.
É basicamente um modelo ER totalmente normalizado.
Casos de uso são normalmente expressos em instruções SQL.
Inclui variados tipos de entidades: de base, de resultados, de infraestrutura etc.
Inclui ligação entre entidades.
Suporte a múltiplas línguas.
Modelo é “semanticamente consistente”.
Inclui métricas, indicadores e identidades federadas.
CERIF – Commone European Research Information Format
48. | 52Open Access | 52
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
PRÓS
• Formato de troca XML
• É um padrão de fato na Europa
• É bem definido no nivel do
modelo
• Conta com uma comunidade
grande de apoiadores
CONS
• É um modelo ER “totalmente”
normalizado
• É complexo
• Características semânticas não
são bem acabadas
CERIF – Commone European Research Information Format
49. | 53Open Access | 53
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
The Consortia Advancing Standards in Research
Administration Information
Glossários:
• Gerenciamento de dados administrativos - termos e definições específicos para dados
administrativos (ou informação de administração de pesquisa).
• IRIDIUM (Gestão de Dados de Pesquisa) – piloto
Taxonomias:
• Funções dos Colaboradores (CRediT) - classificação dos diversos papéis desempenhados
no na publicação de ciência.
• Tipos de identificação exclusiva usados para uma saída de pesquisa.
• Tipos de resultados de pesquisa
• Tipos de licenças de conteúdo.
Modelos:
• Plano de Gerenciamento de Dados de Pesquisa - modelo de acordo de negócio padrão
sobre requisitos de informação.
• CV Acadêmico Completo
• CV acadêmico abreviado
• Relatório de Resultados da Pesquisa (Obras)
• Relatório de Pesquisa / Serviços Acadêmicos
50. | 54Open Access | 54
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
The Consortia Advancing Standards in Research
Administration Information
http://dictionary.casrai.org/Main_Page
51. | 55Open Access | 55
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Aplicativo pronto para gerenciar e fornecer acesso a conteúdo digital de
acesso aberto. É mais usado como um repositório para hospedar e
gerenciar a produção de professores e alunos.
É um repositório modular para a gestão e divulgação de conteúdos
digitais sob a forma de objetos. É usado por bibliotecas, arquivos e
projetos de pesquisa para preservar e fornecer tipos especializados de
acesso a agregações muito grandes e complexas de imagens históricas
e culturais, artefatos, texto, mídia, conjuntos de dados e documentos.
É um serviço hospedado e tecnologia aberta que aproveita a
infraestrutura de nuvem comercial para fornecer suporte de
preservação e serviços de acesso para bibliotecas acadêmicas, centros
de pesquisa acadêmica e outras organizações de patrimônio cultural.
É um aplicativo de dados vinculado para pesquisa descoberta.
Recursos abertos populares para a gestão de
conteúdo cientifico
DSpace
Fedora
DuraCloud
VIVO
DSpace
Fedora
DuraCloud
VIVO
52. | 56Open Access | 56
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• 1. Software: uma ferramenta de descoberta de pesquisas e pesquisadores
de codigo aberto e baseada em web semantica.
• 2. Dados: dados de toda instituição, de pesquisas e pesquisadores, visiveis
publicamente. Provê dados de bases institucionais como registros de Linked
Open Data
• 3. Padrão: ontologia (VIVO data) flexivel e extensivel que cobre entidades
variadas como, recursos de pesquisa, equipamentos e campi usando Linked
Open Data.
• 4. Comunidade: comunidade aberta com forte participação internacional
• 5. Compatibilidade: com Harvard Profiles – foco em biomedicas com mais
de 40 instalações conectadas. Com Elsevier PURE. Elsevier é uma
instituição patrocinadora do VIVO.
Caracteristicas https://wiki.duraspace.org/display/VIVO
53. | 57Open Access | 57
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Compatibilidade com Harvard Profiles – foco em biomedicas com
mais de 40 instalações conectadas
• Compatibilidade com Elsevier PURE. Elsevier é uma instituição
patrocinadora do VIVO.
Compatibilidade
54. | 58Open Access | 58
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Repositorios Abertos
55. | 59Open Access | 59
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Repositorios Institucionais
É um local online para a coleta, preservação e disseminação, em
formato digital, da produção intelectual de uma instituição, em
especial da pesquisa” -- Wikipedia (Nov 2012)
• Publicações: artigos, teses, artefatos de aprendizado
Por que?
– Garante Acesso Aberto
– Cria visibilidade global
– Ponto unico de acesso
– Preservação
56. | 60Open Access | 60
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
O Avanço dos Repositorios Institucionais
Principais motivadores
i. Fortalecimento das politicas nacionais de financiamento que impoem
Acesso Aberto (ambos Green e Gold)
ii. Maior alinhamento e capacidade de integração com sistemas CRIS
iii. Instituições lutando para organizar seus recursos digitais e usar essa
informação para amparar decisões estrategicas
Source: www.opendoar.org
57. | 61Open Access | 61
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Serviços da Elsevier para Repositorios Institucionais
Planejar Popular Organizar Reportar Analisar
Politica de hospedagem
Recursos & Educação:
• Webinars para
bibliotecas
• Documentos
• Guias (construindo um
IR passo a passo)
Scopus APIs,
ScienceDirect APIs
Dspace Plugins
PURE:
Solução CRIS que
agrega todas as
informações e
produtos
relacionados a
pesquisa e prove
relatorios e
analises precisas
para a tomada de
decisão.
SciVal:
Permite
analisar e
visualizar o
desempenho
da pesquisa
Foco está em fazer com que a pesquisa seja mas fácilmente encontrada.
58. | 62Open Access | 62
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Repositorio de Dados do Mendeley
Parceria com DANS
Para CC0 armazenamento de longo prazo
com meta-dados apropriados e uma DOI
resolúvel, persistente e com controle de
versão.
Via data.mendeley.com:
• Os dados são publicados on-line com
segurança
• Podem ser facilmente compartilhados
• Podem ser citados
• Armazenados e preservados por longo-
prazo
59. | 63Open Access | 63
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
http://data.mendeley.com/
Cada conjunto de dados recebe uma versão de
DOI, por isso, podem ser citados
A citação para o
artigo associado é
exibida
60. | 64Open Access | 64
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
CRIS
Current research Information
System
61. | 65Open Access | 65
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
“Se você não consegue descrever o que
você está fazendo na forma de um
processo, você não sabe o que está
fazendo.”
62. | 66Open Access | 66
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
RI vs. CRIS
Current Research Information System - usualmente chamado
CRIS, é qualquer ferramenta de informação que ofereça acesso e
dissemine (em nivel institucional) informações acerca da pesquisa,
pessoas envolvidas, projetos, organizações, resultados, equipamentos e
instalações – “EuroCRIS”
Repositorio institucional - é um local online para a coleta,
preservação e disseminação, em formato digital, da produção intelectual
de uma instituição, em especial da pesquisa” -- Wikipedia (Nov 2012)
63. | 67Open Access | 67
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
P
r
o
p
o
s
t
a
Proposta/candidature autorizada
Necessidades de informação em uma instituição de
pesquisa
64. | 68Open Access | 68
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Proposta/candidature autorizada
P
r
o
p
o
s
t
a
Necessidades de informação em uma instituição de
pesquisa
65. | 69Open Access | 69
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Proposta/candidature autorizada
P
r
o
p
o
s
t
a
Financiamento aprovado
Necessidades de informação em uma instituição de
pesquisa
66. | 70Open Access | 70
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Proposta/candidature autorizada
P
r
o
p
o
s
t
a
Financiamento aprovado
Dados e publicação
Necessidades de informação em uma instituição de
pesquisa
67. | 71Open Access | 71
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Necessidades de informação em uma instituição de
pesquisa
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Proposta/candidature autorizada
P
r
o
p
o
s
t
a
Financiamento aprovado
Dados e publicação
68. | 72Open Access | 72
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Necessidades de informação em uma instituição de
pesquisa
69. | 73Open Access | 73
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Necessidades de informação em uma instituição de
pesquisa
70. | 74Open Access | 74
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Pesquisador
Gestor de pesquisa
Comunidade interna/externa
Produção
Necessidades de informação em uma instituição de
pesquisa
71. | 75Open Access | 75
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Produção
cientifica
Sistema
Financiero
Recursos
Humanos
Outros
Sistemas
D-Space
Projetos
Sistema Académico
Necessidades de Informação
Como os dados
são tratados hoje
na Universidade?
Como os dados
são tratados hoje
na Universidade?
Como e por quem
são mantidos?
Como e por quem
são mantidos?
Que tipo de
analise se faz
atualmente?
Que tipo de
analise se faz
atualmente?
E o que acontece
com os dados
externos?
E o que acontece
com os dados
externos?
72. | 76Open Access | 76
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Um sistema que satisfaz diferentes
necessidades e partes
Ref: The Central Position of CRIS’ in the
Research Information Ecosystem – euroCRIS.
Pure International Conference 2015
73. | 77Open Access | 77
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
X
Y
X
Múltiplos sistemas
Múltiplos IDs
Não integrados
Não homogéneos
Dados atualizados sem
sincronia
Cenário distribuido que
preserva silos de
informação
Múltiplos sistemas
Múltiplos IDs
Não integrados
Não homogéneos
Dados atualizados sem
sincronia
Cenário distribuido que
preserva silos de
informação
Informações consolidadas
de variadas fontes
Interrelaciona todas as
entidades
Dados normalizados,
desambiguados e íntegros
Atualização automatica
Cenário integrados
baseado em padrões
Informações consolidadas
de variadas fontes
Interrelaciona todas as
entidades
Dados normalizados,
desambiguados e íntegros
Atualização automatica
Cenário integrados
baseado em padrões
Y
Z
ZCRISCRIS
Contexto de informação tipico vs.
desejado
74. | 78Open Access | 78
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
X
Y
Z
X Y ZCRISCRIS
Contexto de informação tipico vs.
desejado
75. | 79Open Access | 79
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Journals, Publisher Metrics
Activities, Events
Opportunities
Applications, Awards
Persons
Organizational units
External persons
External organizations
Press
Projects, Ethical reviews
Courses
Equipment and facilities
CVs, Classifications
Pubs, Datasets, Theses
Data types
Activities
Finance
Staff
Collaboration
Publishing
Projects
Teaching
Tools
Support
Outcomes
Faculty reporting
Strategy setting &
execution
Evaluation
Increase discoverability,
collaboration, re-use,
press
Showcasing
Build publication collections,
fulltext, versions, Open
Access
Publications
Comply with funders,
publishers,
governments, internal policy
Compliance
Pre/post award management,
ethical reviews
Grants
Contexto de informação desejado
76. | 81Open Access | 81
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Contexto de informação desejado
77. | 82Open Access | 82
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Contexto de informação desejado
78. | 83Open Access | 83
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
• Políticas de conteúdo - sintaxe comum para
descrever as organizações internas e externas
• Taxonomias para conteúdo de metadados -
publicações, atividades, impacto
• Identificadores globais (e.g. ORCID) que auxiliem na
integração de dados locais
• Modelo de dados comum (e.g. CERIF, VIVO) que
permita o benchmarking e transferência de dados
com outros sistemas e CRIS
Recursos essenciais / desejávels em um CRIS
79. | 84Open Access | 84
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
- Funcionalidade de alimentação/entrada de dados
- Código aberto
- Alimentação automática de dados
- Compatibilidade com Linked Open Data
- Variados tipos de exportação de dados
- Interoperabilidade com sistemas institucionais e externos
- Integração com componentes ou produtos adicionais
- Conectividade com outras implantações
- Perfis de usuários
- Possibilidade de atualização dos próprios perfis
- Tipo de networking entre usuários (ativo ou passivo)
- Disponibilidade de oportunidades de financiamento
- Uso de Thesaurus / Vocabulário controlado
- Ontologia própria / Ontologias Suportadas
- Desambiguação automática de autor
Recursos essenciais / desejávels em um CRIS
80. | 85Open Access | 85
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Principais CRIS no mercado
Ferramenta Desenvolvedor
/ Fornecedor
Alimentação de dados Open Source Alimentação
automatica?
Linked
Open Data?
Activity
Insight
Digital Measures PubMed, Google Scholar, Scopus, Web of Science, RefWorks, Banner,
Datatel, PeopleSoft, CampusVue, Jenzabar, Sedona, EndNote, Mendeley, Zotero,
BiBTeX, a RESTful web services API, CSV Data Imports, etc. E entrada manual.
Não Sim Sim
PROFILES Inknowledge, Inc PubMed, Google Scholar, Web of Science, Scopus, Banner, PeopleSoft, Web
Services, arquivos planos e entrada manual.
Não (gratuito
para sempre)
Sim Sim
Converis Thomson
Reuters
Conexão com Thomson Reuters Web of Science, Scopus, Pubmed, Europubmed, etc. Não Sim Sim—pode
ser usado
para
alimentar
VIVO
PURE Elsevier Scopus, Web of Science, PubMed, Embase, Mendeley, arXiv, Worldcat, CrossRef,
Journal TOC, CAB Abstracts, SAO/NASA Astrophysics Data System and SciVal
Funding opportunities; Data from institutions' internal systems, including HR data,
grants, publications, patents, core facilities/resources, etc. Entrada manual e/ou por
usuarios de Publicações, concessões, patentes, livros, trabalhos criativos, educação,
conjuntos de dados, recortes de imprensa, prêmios e honras; Texto livre também
pode ser importado. Integração com todos os principais repositórios institucionais.
Não Sim Sim
Lyterati Entigence
Corporation
PubMed, Google Scholar, BibTex, Ellucian, PeopleSoft, Workday, RESTful APIs,
Template Driven Imports, CSV, Excel, Webpages, Faculty CVs
Não Sim
Symplectic
Elements
Symplectic Importação de qualquer fonte de dados interna via API, fora da caixa de importação
bibliográfica automática (sujeito a assinaturas, quando apropriado) de arXiv, Cinii,
CrossRef, DBLP, PMC Europa, figshare, PubMed, RePeC, Scopus, Web of Science.
Integração segura ORCID. In-feed de sistemas de RH / Identidade, bancos de dados
internos de concessão. Integração com todas as principais tecnologias de repositório.
Não Sim (por
portais
intergrados
como VIVO e
Profiles RNS
Sim Source
for linked
data
VIVO Duraspace PubMed, NIH RePORTER, PeopleSoft, sistemas HR & bancos de dados
administrativos, Scopus, Web of Science; enfase em fontes de dados certificadas.
Sim Sim (entrada
manual tb é
possivel)
Sim
81. | 86Open Access | 86
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Principais CRIS no mercado
Ferramenta Tipos de
perfis de
usuarios
Atualizar proprios perfis Networ
king
Expertise vs.
Oportunidades de
financiamento
Thesaurus /
Vocabulario
controlado
Ontologia / Ontologias
suportadas
Disambiguação
de autores
Activity
Insight
Faculdade,
Pessoal,
Estudantes de
Pós-Graduação
Sim Sim Sim Sim telas de coleta de dados
personalizáveis; Campus,
faculdades e ontologias
departamentais
Sim
PROFILES Todos Sim Sim Sim Sim Dublin Core, Social Media,
compatível com VIVO e outras
ontologias populares
Sim
Converis Todos Sim In some fields CASRAI, VIVO Sim (Recursos de
agrupamento de
autores)
PURE Todos Sim (usuários podem inserir conteúdo
em seus perfis através de formulários ou
importações. Os tipos de conteúdo
incluem: pessoas, subsídios concedidos,
revistas, unidades organizacionais,
projetos, eventos, equipamentos,
atividades, recortes de imprensa,
oportunidades de financiamento,
resultados de pesquisas, dados, teses de
estudantes, cursos ministrados e
prêmios)
Sim Sim (Através de
pesquisa avançada e
exploração de perfil
da web)
"Elsevier Fingerprinting
Engine" Usa dez
thesauri incluindo
MeSH para combinar e
identificar conceitos-
chave para um
indivíduo ou grupo de
pessoas.
mapeamento com ontologia
VIVO
Sim
Lyterati Todos Sim Sim Sim (Através de
pesquisa avançada e
exploração de perfil
da web)
Sim Fully customizable ontology
that maps to VIVO
Sim (usa algoritmo
em texto livre)
Symplectic
Elements
Todos Sim (perfis são preenchidos
automaticamente com dados. Alguns
dados de perfil podem ser curados
manualmente por usuários finais,
usuários proxy ou administradores. Os
usuários podem criar novas relações
entre elementos.)
Sim Sim (Através de
integrações com
informações de
pesquisa e provedor
de informações de
financiamento)
MeSH, Fields of
Research,
ScienceMetrix.
Suporta mapeamento de
dados de publicação, pessoa e
doações para a ontologia
VIVO através de sua fonte
aberta VIVO Harvester
Extension, bem como Harvard
Catalyst's Profiles RNS.
Sim
VIVO Todos Sim Sim Usa vários thesauri que
estão disponíveis
através da Web
Semântica, incluindo
MeSH
A Ontologia VIVO foi
desenvolvida e apoiada por
esforços financiados pelo NIH
e continua a ser desenvolvida
e construída por sua
comunidade de código aberto
no GitHub e em colaboração
com o projeto eagle-i.
Sim
82. | 87Open Access | 87
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Ferramenta Tipos para exportação Sistemas empresariais
institucionais
Sistemas externos Integração com outros
produtos
Conectividade com outras
implementações
Activity
Insight
RTF, XLS, CSV, PDF,
HTML, XML
Sim (Banner, Datatel, PeopleSoft,
CampusVue, Jenzabar, etc.)
Sim (Google Scholar, Scopus,
Web of Science, RefWorks, etc.)
Sim (EndNote, Mendeley, Zotero,
BiBTeX, CSV or XML files)
Não
PROFILES RTF, XLS, CSV, PDF,
HTML, XML, JSON
Sim Sim (tem API, trabalha com
Elsevier PURE, Activity Insight,
VIVO etc.)
Sim (oportunidades de
financiamento do grants.gov)
Sim
Converis XML, .mbb, XLS Sim Sim (Web of Science, ORCID,
pubmed, europubmed.)
Sim (Integrates with Pentaho
Research Analytics module and
InCites)
Não
PURE XML, RDF, SPARQL, CSV,
CERIF XML, MS Word,
Excel, PDF, ATOM/XML
web services,
EndNote/Reference
Manager, BibTex, formatos
de avaliação de det.
governos
Sim, via Web Services e arquivos
locais.
Sim (Scopus, PubMed, NIH
RePORTER, SciVal Funding,
Embase, Mendeley, arXiv,
Worldcat, CrossRef, JournalTOC,
CAB Abstracts, SAO/NSA
Astrophysics Data System, Web
of Science, dados da propria
instituição)
Sim (o módulo Funding Discovery
se integra com o SciVal Funding,
recomendando automaticamente
oportunidades de financiamento
e sugerindo colaboradores para
pesquisadores com perfil, sem
intervenção manual. Também se
integra com o SciVal).
Sim (interliga todos os aplicativos
Pure internacionalmente em uma
única rede de pesquisa (a
participação é voluntária);
permite que os usuários
pesquisem em diferentes
instituições participantes na rede
DIRECT2experts (incluindo
instâncias VIVO, Harvard
Profiles, Stanford CAP, etc.). As
instituições podem participar da
rede VIVO através do Pure.)
Lyterati PDF, MS Word, Excel, CSV,
Web Services
Sim (Ellucian, PeopleSoft,
Workday InfoEd, Coeus)
Sim (PubMed, VIVO, Google
Scholar, BibTex or CSV Sources)
Sim (BibTex and CSV) Sim
Symplectic
Elements
CSV, CERIF XML, MS
Word, Excel, PDF (APA6),
ATOM/XML web services,
EndNote/Reference
Manager, BibTex, RDF
(Linked Data),
Sim (clientes podem integrar com
sistemas de gestão de perfis
existentes, exportar data para
soluções BIS e submeter saídas
para variados padrões de
avaliação governamentais.
Sim (Altmetric, figshare,
ORCID, SHERPA/RoMEO (licens
ing information), DOAJ (licensing
information))
Sim Elements can be linked to all
major open repository
technologies and an open
source VIVO Harvester
extension is also available.
Não
VIVO RDF, GraphXML, CSV file Sim (dados podem ser ingeridos
a partir de uma ampla variedade
de fontes locais,incluindo RH,
subsídios, bases de dados de
cursos, repositórios institucionais,
lista de membros, interesses de
pesquisa e muitos outros.)
Sim (eagle-i; Drupal; e varios
outros - qualquer ferramenta que
consuma open linked data.
Inegração com sistemas
Wellspring e Symplectic.
Sim (Colabora com eagle-I em
recursos de pesquisa)
Sim (qualquer plataforma de
software compatível com a Web
Semantica pode ser integrada
(exemplo: Harvard Profiles).
Participante em Direct2Experts e
VIVO Search)
Principais CRIS no mercado
83. | 88Open Access | 88
Elsevier Latin America© Ciência Aberta: Dados, Recursos, Repositorios e CRIS Maio/2017
Muito Obrigado!
Alexandre P. Uchoa
Research Management Consultant
Elsevier, Latin America South
a.uchoa@elsevier.com
*55 21 99237-2559