SlideShare une entreprise Scribd logo
1  sur  20
ESTUDO E DESENVOLVIMENTO DE 
FERRAMENTA DE MIGRAÇÃO ENTRE 
SISTEMAS DE PUBLICAÇÃO DE TESES E 
DISSERTAÇÕES 
DIEGO JOSÉ MACEDO 
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) 
DIEGOMACEDO@IBICT.BR 
WASHINGTON L. R. DE CARVALHO SEGUNDO 
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) 
WASHINGONSEGUNDO@IBICT.BR 
TAINÁ BATISTA DE ASSIS 
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) 
TAINA@IBICT.BR 
MILTON SHINTAKU 
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) 
SHINTAKU@IBICT.BR 
1
INTRODUÇÃO 
2 
 Em 2013, a BDTD agregava 97 bibliotecas digitais. 
 No início de 2014, a atualização tecnológica da BDTD e a 
adoção de um novo sistema coletador, possibilitou a 
flexibilidade no processo de coleta. 
Sistema Quantidade 
TEDE 83 
DSpace 14 
Tecnologias diversas 7
INTRODUÇÃO 
3 
 Revela-se uma tendência na adoção do DSpace para 
depósitos de teses e dissertações (TDs), principalmente, 
quando se considera a implantação de repositórios 
institucionais (RI) nas universidades.
INTRODUÇÃO 
4 
 O Ibict desenvolveu um plug-in de migração de dados do 
TEDE, com formato de saída específico para o DSpace.
OBJETIVOS 
5 
 construção do plug-in, objetivando, contribuir com 
discussões sobre: 
 conversão automática de metadados; 
 normalização de metadados; 
 migração de dados entre sistemas; 
 e adaptação de ferramentas
METODOLOGIA 
 o desenvolvimento de um software que possibilita a 
migração de dados entre sistemas distintos, TEDE e 
DSpace, foi estruturado em quatro etapas: 
 levantamento dos requisitos, 
 seleção do software, 
 A conectividade entre sistemas dá-se por várias formas, 
sendo a manual a mais trivialmente implementável e, a 
automática, a que mais fácil é aceita pelos usuários. 
6
METODOLOGIA 
 O estudo apresentou três possibilidades, duas automáticas (harvesting 
com OAI-ORE ou webservices) e uma manual (plugin de migração). A 
adoção pelo processo manual deu-se depois da análise das opções, 
pelos seguintes motivos: 
 As opções automáticas deixariam os arquivos integrais de forma aberta e 
qualquer provedor de dados poderia coletá-los, logo as instituições 
costumam apresentar restrições a esse procedimento; 
 A execução manual permite processamento de dados durante a 
migração, possibilitando gerar conteúdo para outros campos, pela 
manipulação dos campos já existentes; 
 O processamento manual gera arquivos para migração, que podem ser 
armazenados como forma de preservação ou posterior processamento. 
7
ESTRUTURA 
8 
TEDE 
Itens processados 
Exportação 
Plugin 
com sucesso 
Itens com 
pendências 
Algoritmos de 
Normalização 
Usuário 
Filtros
ESTRUTURA 
9 
DSPACE 
TEDE 
Exportação 
Plugin 
Algoritmos de 
Normalização 
Importação 
Verificação e 
correção 
Usuário 
Plugin 
Filtros 
Itens processados 
com sucesso 
Itens com 
pendências
TEDE TELA PLUGIN 
10
TEDE TELA PLUGIN 
11
TEDE TELA PLUGIN 
12
DSPACE - TELA PLUGIN 
IMPORTAÇÃO 
13
DSPACE - TELA PLUGIN 
IMPORTAÇÃO 
14
RESULTADO(S) E 
DISCUSSÃO 
 Destacam-se assim os seguintes pontos nos resultados 
de desenvolvimento: 
 A exportação dá-se organizando os itens exportados em 
pastas por Programa de Pós-graduação e grau; 
 O conteúdo do campo citação é gerado com base nos 
campos existentes no banco, conforme norma ABNT 
(Associação Brasileira de Normas Técnicas) 6023; 
15
RESULTADO(S) E 
DISCUSSÃO 
 O conteúdo do campo assunto, quanto se utilizado o 
vocabulário do CNPq, é recuperado de forma completa, 
com os valores intermediários; 
 Há um algoritmo de correção de caracteres inválidos, os 
quais podem ter sido inseridos no processo de 
catalogação; 
 Ocorre a normalização de campos como grau e 
padronização do campo de autor, conforme ABNT. 
16
RESULTADO(S) E 
DISCUSSÃO 
 Os testes para refinamento do plug-in foram executados 
em diversas bases e com a exportação de mais de dez mil 
registros, sendo que menos de dez por cento apresentam 
problemas que não podem ser resolvidos 
automaticamente e são armazenados em pastas de 
triagem separadas, para posterior verificação e correção 
manual. 
17
CONCLUSÕES 
 Teses e dissertações são as únicas produções científicas 
que são de total responsabilidade da instituição. 
Prescindem da figura do editor, e sendo, portanto, em 
geral, os tipos de documentos mais facilmente agregados 
aos repositórios institucionais e a outros sistemas de 
informação. 
18
CONCLUSÕES 
 O desenvolvimento do plug-in fortalece a ação do 
Ibict junto aos RIs e a atualização tecnológica das 
bibliotecas digitais, revelando a importância da 
disseminação das TDs em texto integral em seus 
formatos digitais. Apresenta-se a relevância de 
estudos aplicados que resultam em produto, 
visando o atendimento de uma comunidade e 
alinhando-se às tendências de tecnologias de 
acesso aberto no contexto institucional acadêmico. 
19
OBRIGADO! 
Diego Macêdo 
diegomacedo@ibict.br 
+55 61 3217-6241 
20

Contenu connexe

Similaire à Estudo e desenvolvimento de ferramenta de migração entre sistemas de publicação de teses e dissertações

Curso de soluções tecnológicas em PD
Curso de soluções tecnológicas em PDCurso de soluções tecnológicas em PD
Curso de soluções tecnológicas em PD
Cariniana Rede
 
O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...
O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...
O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...
Carmélia Brito
 
Plano de projeto de software - SISCONI
Plano de projeto de software - SISCONIPlano de projeto de software - SISCONI
Plano de projeto de software - SISCONI
ocfelipe
 

Similaire à Estudo e desenvolvimento de ferramenta de migração entre sistemas de publicação de teses e dissertações (20)

BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOSBIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
BIODATA: SOFTWARE WEB PARA GERENCIAMENTO DE COLETA DE DADOS BIOMÉDICOS
 
CARINIANA
CARINIANACARINIANA
CARINIANA
 
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
Biblioteca Digital Brasileira de Teses e Dissertações: ações para melhoria na...
 
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
Desenvolvimento de uma ferramenta para análise de informações tecnológicas or...
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
Curso de soluções tecnológicas em PD
Curso de soluções tecnológicas em PDCurso de soluções tecnológicas em PD
Curso de soluções tecnológicas em PD
 
Gestão de Autoescola.pptx
Gestão de Autoescola.pptxGestão de Autoescola.pptx
Gestão de Autoescola.pptx
 
O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...
O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...
O Repositório Institucional de Produção Científica da ENSP/FIOCRUZ: autoarqui...
 
TCC - UFSC - Rafael Cobbe Dias
 TCC - UFSC - Rafael Cobbe Dias TCC - UFSC - Rafael Cobbe Dias
TCC - UFSC - Rafael Cobbe Dias
 
Preservação da Informação na Biblioteca Digital
Preservação da Informação na Biblioteca DigitalPreservação da Informação na Biblioteca Digital
Preservação da Informação na Biblioteca Digital
 
Bibliotecas Digitais e Serviços de Preservação
Bibliotecas Digitais e Serviços de PreservaçãoBibliotecas Digitais e Serviços de Preservação
Bibliotecas Digitais e Serviços de Preservação
 
Apresentacao - Prontuário Eletrônico.pptx
Apresentacao - Prontuário Eletrônico.pptxApresentacao - Prontuário Eletrônico.pptx
Apresentacao - Prontuário Eletrônico.pptx
 
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
Data RepositóriUM: projeto de implementação do repositório de dados para a Un...
 
Plano de projeto de software - SISCONI
Plano de projeto de software - SISCONIPlano de projeto de software - SISCONI
Plano de projeto de software - SISCONI
 
Automação Bibliotecas - Gnuteca
Automação Bibliotecas - GnutecaAutomação Bibliotecas - Gnuteca
Automação Bibliotecas - Gnuteca
 
Automação de Bibliotecas: Gnuteca
Automação de Bibliotecas: GnutecaAutomação de Bibliotecas: Gnuteca
Automação de Bibliotecas: Gnuteca
 
Plano do projeto de software
Plano do projeto de softwarePlano do projeto de software
Plano do projeto de software
 
Seer 2003-2010
Seer 2003-2010Seer 2003-2010
Seer 2003-2010
 
Pesquisa Reproduzivel
Pesquisa ReproduzivelPesquisa Reproduzivel
Pesquisa Reproduzivel
 
O papel das publicações científicas e da gestão da informação no cenário acad...
O papel das publicações científicas e da gestão da informação no cenário acad...O papel das publicações científicas e da gestão da informação no cenário acad...
O papel das publicações científicas e da gestão da informação no cenário acad...
 

Plus de Conferência Luso-Brasileira de Ciência Aberta

Plus de Conferência Luso-Brasileira de Ciência Aberta (20)

Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...Citações e métricas complementares: um estudo da sua correlação em artigos ci...
Citações e métricas complementares: um estudo da sua correlação em artigos ci...
 
Pré-Workshop: Formação em Edição Eletrónica
Pré-Workshop: Formação em Edição EletrónicaPré-Workshop: Formação em Edição Eletrónica
Pré-Workshop: Formação em Edição Eletrónica
 
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
Análise relacional entre princípios FAIR de gestão de dados de pesquisa e nor...
 
10 anos RCAAP - ConfOA
10 anos RCAAP - ConfOA10 anos RCAAP - ConfOA
10 anos RCAAP - ConfOA
 
Programa de formação modular sobre Ciência Aberta
Programa de formação modular sobre Ciência AbertaPrograma de formação modular sobre Ciência Aberta
Programa de formação modular sobre Ciência Aberta
 
Análise da Produção Científica Brasileira em Periódicos de Acesso Aberto
Análise da Produção Científica Brasileira em Periódicos de Acesso AbertoAnálise da Produção Científica Brasileira em Periódicos de Acesso Aberto
Análise da Produção Científica Brasileira em Periódicos de Acesso Aberto
 
Acesso aberto como ferramenta para o empoderamento do paciente
Acesso aberto como ferramenta para o empoderamento do pacienteAcesso aberto como ferramenta para o empoderamento do paciente
Acesso aberto como ferramenta para o empoderamento do paciente
 
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
Livros eletrônicos, políticas de licenciamento e acesso aberto - relações con...
 
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
Ciência aberta e revisão por pares aberta: aspectos e desafios da participaçã...
 
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
Melhorando a citabilidade de programas de computador para pesquisa com o Cita...
 
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
Técnicas de Search Engine Optimization (SEO) aplicadas no site da Biblioteca ...
 
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
Café com Ciência – divulgação das publicações técnico-científicas em acesso a...
 
Serviço Nacional de Registo de Identificadores DOI
Serviço Nacional de Registo de Identificadores DOIServiço Nacional de Registo de Identificadores DOI
Serviço Nacional de Registo de Identificadores DOI
 
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
Recursos educacionais abertos na Universidade Aberta. A rede como estratégia ...
 
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
Infraestrutura OpenAIRE: desenvolvimentos para o fortalecimento da Ciência Ab...
 
Preservação digital, gestão de dados de pesquisa e biodversidade
Preservação digital, gestão de dados de pesquisa e biodversidadePreservação digital, gestão de dados de pesquisa e biodversidade
Preservação digital, gestão de dados de pesquisa e biodversidade
 
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
Dados governamentais na perspectiva da Ciência Aberta: potencialidades e desa...
 
Do acesso à informação aos Dados Parlamentares Abertos em Portugal
Do acesso à informação aos Dados Parlamentares Abertos em PortugalDo acesso à informação aos Dados Parlamentares Abertos em Portugal
Do acesso à informação aos Dados Parlamentares Abertos em Portugal
 
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
Transparência e Dados Abertos do Recife: Uma Estratégia Bem Sucedida de Publi...
 
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
Revistas científicas brasileiras de acesso aberto: qualidade do ponto de vist...
 

Estudo e desenvolvimento de ferramenta de migração entre sistemas de publicação de teses e dissertações

  • 1. ESTUDO E DESENVOLVIMENTO DE FERRAMENTA DE MIGRAÇÃO ENTRE SISTEMAS DE PUBLICAÇÃO DE TESES E DISSERTAÇÕES DIEGO JOSÉ MACEDO INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) DIEGOMACEDO@IBICT.BR WASHINGTON L. R. DE CARVALHO SEGUNDO INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) WASHINGONSEGUNDO@IBICT.BR TAINÁ BATISTA DE ASSIS INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) TAINA@IBICT.BR MILTON SHINTAKU INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA ( IBICT) SHINTAKU@IBICT.BR 1
  • 2. INTRODUÇÃO 2  Em 2013, a BDTD agregava 97 bibliotecas digitais.  No início de 2014, a atualização tecnológica da BDTD e a adoção de um novo sistema coletador, possibilitou a flexibilidade no processo de coleta. Sistema Quantidade TEDE 83 DSpace 14 Tecnologias diversas 7
  • 3. INTRODUÇÃO 3  Revela-se uma tendência na adoção do DSpace para depósitos de teses e dissertações (TDs), principalmente, quando se considera a implantação de repositórios institucionais (RI) nas universidades.
  • 4. INTRODUÇÃO 4  O Ibict desenvolveu um plug-in de migração de dados do TEDE, com formato de saída específico para o DSpace.
  • 5. OBJETIVOS 5  construção do plug-in, objetivando, contribuir com discussões sobre:  conversão automática de metadados;  normalização de metadados;  migração de dados entre sistemas;  e adaptação de ferramentas
  • 6. METODOLOGIA  o desenvolvimento de um software que possibilita a migração de dados entre sistemas distintos, TEDE e DSpace, foi estruturado em quatro etapas:  levantamento dos requisitos,  seleção do software,  A conectividade entre sistemas dá-se por várias formas, sendo a manual a mais trivialmente implementável e, a automática, a que mais fácil é aceita pelos usuários. 6
  • 7. METODOLOGIA  O estudo apresentou três possibilidades, duas automáticas (harvesting com OAI-ORE ou webservices) e uma manual (plugin de migração). A adoção pelo processo manual deu-se depois da análise das opções, pelos seguintes motivos:  As opções automáticas deixariam os arquivos integrais de forma aberta e qualquer provedor de dados poderia coletá-los, logo as instituições costumam apresentar restrições a esse procedimento;  A execução manual permite processamento de dados durante a migração, possibilitando gerar conteúdo para outros campos, pela manipulação dos campos já existentes;  O processamento manual gera arquivos para migração, que podem ser armazenados como forma de preservação ou posterior processamento. 7
  • 8. ESTRUTURA 8 TEDE Itens processados Exportação Plugin com sucesso Itens com pendências Algoritmos de Normalização Usuário Filtros
  • 9. ESTRUTURA 9 DSPACE TEDE Exportação Plugin Algoritmos de Normalização Importação Verificação e correção Usuário Plugin Filtros Itens processados com sucesso Itens com pendências
  • 13. DSPACE - TELA PLUGIN IMPORTAÇÃO 13
  • 14. DSPACE - TELA PLUGIN IMPORTAÇÃO 14
  • 15. RESULTADO(S) E DISCUSSÃO  Destacam-se assim os seguintes pontos nos resultados de desenvolvimento:  A exportação dá-se organizando os itens exportados em pastas por Programa de Pós-graduação e grau;  O conteúdo do campo citação é gerado com base nos campos existentes no banco, conforme norma ABNT (Associação Brasileira de Normas Técnicas) 6023; 15
  • 16. RESULTADO(S) E DISCUSSÃO  O conteúdo do campo assunto, quanto se utilizado o vocabulário do CNPq, é recuperado de forma completa, com os valores intermediários;  Há um algoritmo de correção de caracteres inválidos, os quais podem ter sido inseridos no processo de catalogação;  Ocorre a normalização de campos como grau e padronização do campo de autor, conforme ABNT. 16
  • 17. RESULTADO(S) E DISCUSSÃO  Os testes para refinamento do plug-in foram executados em diversas bases e com a exportação de mais de dez mil registros, sendo que menos de dez por cento apresentam problemas que não podem ser resolvidos automaticamente e são armazenados em pastas de triagem separadas, para posterior verificação e correção manual. 17
  • 18. CONCLUSÕES  Teses e dissertações são as únicas produções científicas que são de total responsabilidade da instituição. Prescindem da figura do editor, e sendo, portanto, em geral, os tipos de documentos mais facilmente agregados aos repositórios institucionais e a outros sistemas de informação. 18
  • 19. CONCLUSÕES  O desenvolvimento do plug-in fortalece a ação do Ibict junto aos RIs e a atualização tecnológica das bibliotecas digitais, revelando a importância da disseminação das TDs em texto integral em seus formatos digitais. Apresenta-se a relevância de estudos aplicados que resultam em produto, visando o atendimento de uma comunidade e alinhando-se às tendências de tecnologias de acesso aberto no contexto institucional acadêmico. 19
  • 20. OBRIGADO! Diego Macêdo diegomacedo@ibict.br +55 61 3217-6241 20

Notes de l'éditeur

  1. Contrastando com abordagem das ciências puras, a computação se caracteriza pelos estudos mistos de pesquisa e desenvolvimento, principalmente pelo alinhamento da disciplina à tecnologia aplicada. De característica empírica e experimental, o presente estudo se aproxima do que Wazlawick (2008) classifica de apresentação de produto virtual, visto que o autor considera a Ciência da Computação como a Ciência do Artificial, em oposição ao mundo real das Ciências Naturais. Assim, a presente pesquisa se baseou na coleta de metadados provenientes de sistemas de gestão de teses e dissertações, via protocolo Open Archives Initiative - Protocol Metadata Harvesting (OAI-PMH), com a aplicação de filtros para determinar variações, erros de preenchimento e grau de normalização.
  2. Contrastando com abordagem das ciências puras, a computação se caracteriza pelos estudos mistos de pesquisa e desenvolvimento, principalmente pelo alinhamento da disciplina à tecnologia aplicada. De característica empírica e experimental, o presente estudo se aproxima do que Wazlawick (2008) classifica de apresentação de produto virtual, visto que o autor considera a Ciência da Computação como a Ciência do Artificial, em oposição ao mundo real das Ciências Naturais. Assim, a presente pesquisa se baseou na coleta de metadados provenientes de sistemas de gestão de teses e dissertações, via protocolo Open Archives Initiative - Protocol Metadata Harvesting (OAI-PMH), com a aplicação de filtros para determinar variações, erros de preenchimento e grau de normalização.