2. RESUMO
Os repositórios para preservação de objetos digitais são
apresentados como aqueles que estariam localizados em instituições
confiáveis e capazes de armazenar, migrar e dar acesso a coleções
digitais. Esse tipo de repositórios integra ferramentas de preservação
digital, ou aquelas que sejam equivalentes nessa funcionalidade.
Apresentar-se alguns exemplos de sistemas e soluções tecnológicas
que estão sendo testados e que já estão sendo considerados padrões
de preservação digital pela comunidade científica. São discutidas as
propriedades de preservação digital mínimas para garantir a
confiança nos repositórios digitais.
3. A Era dos repositórios
2009 OCLC anunciou que passava a hospedar e administrar
o serviço OAIster de coleta de registros via OAI-PMH e
incluí-os no seu catálogo WorldCom. Em 2010 os registros
já passavam dos 23 milhões procedentes de 1100
repositórios.
29 de março de 2012 Repositórios Confiáveis número do slide 3/55
10. O que é um repositório digital?
Aplicações provedoras de dados destinadas ao
gerenciamento de informação.
Os repositórios são em parte softwares de gestão de
informação. Sua estrutura, formatos, registros e
preservação estão condicionados pelo software utilizado.
O tipo de repositório digital é determinado pela aplicação e
os objetivos ao qual se destina, além da ferramenta
tecnológica que será adotada.
29 de março de 2012 Repositórios Confiáveis número do slide 10/55
11. O que caracteriza um repositório digital?
1. Num repositório o conteúdo é depositado pelo autor, pelo
editor ou por terceiros.
2. A arquitetura de repositório gerencia tanto o conteúdo
quanto os metadados.
3. O repositório oferece um conjunto mínimo de serviços,
ex.: inserção, obtenção, pesquisa, controle do acesso, etc.
29 de março de 2012 Repositórios Confiáveis número do slide 11/55
12. O que caracteriza um repositório digital?
1. O uso de padrões abertos para garantir que o conteúdo
estará acessível e que ele poderá ser pesquisado e
recuperado para seu uso a longo prazo.
2. As funcionalidades do software escolhido.
3. Uma decisão política feita por uma instituição ou uma
administração.
4. O uso de padrões compartilhados internacionalmente que
permite que os mecanismos estejam ajustados para a
importação, exportação, identificação, armazenamento e
recuperação do conteúdo digital no repositório.
29 de março de 2012 Repositórios Confiáveis número do slide 12/55
13. O que é um repositório institucional?
Conjunto de serviços prestados pelas universidades, para
recuperar, administrar, difundir e preservar a produção
digital gerada na instituição, qualquer que seja a tipologia ,
através da criação de uma coleção digital organizada,
aberta e interoperável via o protocolo OAI-PMH (para
recuperação de metadados) para garantir o aumento da
visibilidade e do impacto dessa produção.
29 de março de 2012 Repositórios Confiáveis número do slide 13/55
14. O que caracteriza um repositório institucional?
1. Espelha a produção institucional,
2. O lugar onde podem ser adicionadas teses, dissertações e
conjuntos de dados de pesquisa dos membros de uma
instituição.
3. As funções de acesso livre relacionadas com depósito de
resultados de pesquisas.
4. O gerenciamento, a preservação e o acréscimo de valor
por parte de bibliotecários e instituições.
5. O cumprimento da missão da universidade de produzir,
incentivar e disseminar a produção acadêmica.
29 de março de 2012 Repositórios Confiáveis número do slide 14/55
15. O que envolve um repositório institucional?
1. Mais do que um conjunto de softwares e hardwares.
2. Um conjunto de compromissos, decisões e atividades para
administrar os materiais digitais.
3. Organização, acesso e distribuição de documentos digitais.
4. Gerenciamento de mudanças tecnológicas e a migração de
conteúdos digitais de um conjunto de tecnologias para
outra.
5. A preservação de longo prazo.
29 de março de 2012 Repositórios Confiáveis número do slide 15/55
16. O que preservação digital?
Segundo o Trusted Digital Repositories (2002) a
preservação digital são as atividades
administrativas necessárias para garantir a
manutenção a longo prazo da sequência de
bits e a acessibilidade contínua ao conteúdo.
Seriam as ações necessárias para garantir o
acesso contínuo e pertinente à informação
digital durante o tempo que seja requerido e
para qualquer finalidade legítima.
29 de março de 2012 Repositórios Confiáveis número do slide 16/55
17. O que é um repositório digital confiável?
É o resultado da associação de repositórios institucionais, serviços
de preservação e arquivos por área de conhecimento; tem como
missão prover acesso de longo prazo confiável a recursos digitais
gerenciados para suas comunidades alvo, hoje e no futuro.
29 de março de 2012 Repositórios Confiáveis número do slide 17/55
18. O que é um repositório digital confiável?
Aqueles que possuem atributos para dar suporte a
sistemas de informação e considerem os seguintes
aspectos:
• responsabilidade administrativa;
• viabilidade organizacional;
• sustentabilidade financeira;
• adequabilidade tecnológica e procedimental;
• sistema de segurança;
• responsabilidade de procedimentos (certificação).
http://wiki.digitalrepositoryauditandcertification.org/bin/view/Main/WebHome
29 de março de 2012 Repositórios Confiáveis número do slide 18/55
19. Em um repositório digital confiável também...
1. As informações sobre a origem fica encapsulada com
os dados.
2. Existe uma distinção e relação clara entre as versões
dos documentos.
3. Inclusão de todos os arquivos dos dados e a
documentação.
4. Os dados são descritos para seu uso.
29 de março de 2012 Repositórios Confiáveis número do slide 19/55
20. Como criar um repositório digital confiável?
Elaborando um plano eficaz que contenha e aplique
protocolos, padrões e normas internacionais, em
concordância com as políticas da instituição, assegurando a
sua sustentabilidade a longo prazo.
Verificando se o software que se está utilizando na gestão
do repositório digital atende as normas e protocolos de
preservação básicos.
29 de março de 2012 Repositórios Confiáveis número do slide 20/55
21. Como criar um repositório digital confiável?
Utilizando metadatos na identificação dos objetos digitais
nos repositórios, permitindo:
- o acesso aos documentos depositados e,
- sua gestão e preservação a longo prazo.
Todo repositório de preservação normalizado precisa utilizar
metadados de preservação.
29 de março de 2012 Repositórios Confiáveis número do slide 21/55
22. Condições para criação de um repositório digital confiável
I. Usar um guia para a digitalização de coleções
II. Usar software de repositório digital
III. Estruturar o repositório em conformidade com o Modelo OAIS
IV. Usar o Dicionário de Metadados PREMIS
V. Usar um formato padrão de metadados
VI. Usar um extrator automático de metadados
VII. Aplicar uma norma de segurança da informação
VIII. Passar por uma auditoria para certificação
IX. Participar de uma rede distribuída de preservação digital
X. Contratar arquivistas especializados em curadoria digital.
29 de março de 2012 Repositórios Confiáveis número do slide 22/55
23. I. Usar um guia para a digitalização de coleções
24. encontrar una explicación detallada de todos los conceptos sobre esta área, así como su influencia en la construcción de una colección digital de calidad, y una re
I. Usar um guia para a digitalização de coleções
Os guias e tutoriais de digitalização explicam detalhadamente todos os conceitos da
área, assim como, a sua influenza na construção de uma coleção digital de
qualidade. Algumas delas são a copilação de fontes de informação sobre os
requisitos que alguns grandes projetos de digitalização observaram.
Uma fonte de informação para o desenvolvimento dos requisitos de um projeto de
digitalização é o tutorial «Levando a teoría à prática: Tutorial de digitalização de
imagens» daBiblioteca da Cornell University.
Outra obra de referência é a 3ª edição (2007) da NISO Recommended Practice, A
Framework of Guidance for Building Good Digital Collections, destinada a servir de
guía para instituições de memória no planejamento de projetos de criação de
coleções digitais.
Uma obra Brasileira é o «Manual de digitalização de Acervos» do professor Rubens
Ribeiro Gonçalves da Silva, da UFBA>
25. I. Usar software de repositório digital
Institucionais Temáticos Centrais Preservação
Archimede Greenstone Greenstone LOCKSS
ARNO DAITSS
CDSware
DSpace DSpace DSpace DSpace
Driver
Eprints Eprints Eprints
Fedora Fedora Fedora
i-Tor
MyCoRe março de 2012
29 de Repositórios Confiáveis número do slide 7/10
OPUS
26. Qual software de repositório escolher?
1. Programas que possuam características parecidas com
relação aos espaços para o depósito e submissão de
documentos digitais com informações científicas.
2. Uma solução que aumente a competição e reduza o
monopólio dos periódicos, diminuindo custos das
assinaturas e destacando a relevância da própria
instituição e das bibliotecas.
3. Um Software que adote o protocolo de arquivos abertos,
gratuito e que permita a criação de redes nas instituições.
29 de março de 2012 Repositórios Confiáveis número do slide 26/55
27. I. Estruturar o repositório em conformidade com o Modelo OAIS
28. O que é o Open Archive Information System – OAIS?
A norma OAIS (ISO 14721:2003) é uma recomendação para o
desenvolvimento de um consenso sobre os requisitos a
serem cumpridos pelos arquivos para preservar a longo
prazo a informação digital.
O modelo OAIS não especifica nenhum método de
implantação, mas, indica a organização de equipes e
sistemas que têm a responsabilidade de preservar a
informação e torna-la disponível para uma comunidade
específica.
29 de março de 2012 Repositórios Confiáveis número do slide 28/55
30. O que é o PREMIS?
E um dicionário de dados para metadados de preservação.
Em 2005 foi publicada a versão 1.0. Ele consiste um estudo
que define os tipos de informação que devem ser
associados a um objeto digital para sua preservação.
O dicionário traduz o modelo OAIS na forma de esquema de
metadados específicos para preservação em sistemas de
repositórios de preservação. Ele também não define
nenhuma estratégia o método de implementação.
29 de março de 2012 Repositórios Confiáveis número do slide 30/55
31. PREMIS Data Dictionary for Preservation Metadata
Cada sistema de repositório pode ter definidas as
informações que devem ser registradas como parte
permanente da estória de um objeto.
O PREMIS recomenda que sejam registradas sempre as
ações que modificam o objeto. Um repositório deve
designar um identificador único para o agente que realizou
a modificação do objeto e outorgar-lhe direitos e
permissões que são relevantes para a preservação do
objeto no repositório.
29 de março de 2012 Repositórios Confiáveis número do slide 31/55
32. PREMIS Data Dictionary for Preservation Metadata
O Dicionário de Dados PREMIS define os metadados de
preservação como a informação que um repositório utiliza
para realizar o proceso de preservação digtal. São metados
destinados à viabilidade, disponibilidade, clareza,
autenticidade e identidade no contexto da preservação.
Todo repositório de preservação normalizado precisa
utilizar metadados de preservação e especificamente os do
PREMIS.
29 de março de 2012 Repositórios Confiáveis número do slide 32/55
33. Para que serve o Dicionário PREMIS?
• Para descrever os metadados de preservação.
• Definir o conjunto central de metadados de preservação
que devem ser implementados.
• Identificar e avaliar as estratégias para codificação,
armazenamento e gerenciamento ou melhoria dos
metadados de preservação nos sistemas de arquivamento
digital.
29 de março de 2012 Repositórios Confiáveis número do slide 33/55
35. O que é o METS?
Formato padrão para codificação e transmisão de metadados.
Utiliza a estrutura de etiquetas tipo XML.
Qualquer repositório que receba informação procedente de um
processo de digitalização deve estabelecer requisitos mínimos e
obrigatórios, ou fazer referência a algum dos perfis existentes no
METS.
A publicação do PREMIS in METS Toolbox (http://pim.fcla.edu/)
facilitou essa tarefa, já que ela é uma ferramenta de código
aberto.
29 de março de 2012 Repositórios Confiáveis número do slide 35/55
36. METS e NISO Z39.87
São padrões decodificação e transmissão de metadados
(METS) desenvolvido pela comunidade bibliotecária, provê uma
estrutura de dados para intercambio, visualização e arquivamento
de objetos digitais.
NISO Z39.87 Metadados técnicos para Imagens digitais fixas, descreve
os campos necessários para que uma base de dados preserve
imagens digitais.
29 de março de 2012 Repositórios Confiáveis número do slide 36/55
37. METS e MODS e MIX
METS (Metadata Encoding and Transmission Standard) é um esquema XML
para codificar objetos digitais; reúne os metadados descritivos, os
arquivos digitais e os metadados administrativo usados para transferir,
preservar ou mostrar tais objetos.
MODS (Metadata Object Description Schema) esquema para reunir
metadados descritivos.
MIX (Metadata For Images in XML) baseado em NISO Z39.87 Technical
Metadata for Digital Still Images – descreve que campos são necessários
em uma base de dados para preservar imagens fixas.
29 de março de 2012 Repositórios Confiáveis número do slide 37/55
39. O que é o JHOVE?
Ferramenta para extração automática de metadatos
(http://hul.harvard.edu/jhove/), desenvolvida pela Harvard
University, ela permite a identificação automática, validação e
caracterização de um conjunto de tipos de objetos digitais.
O DSpace oferece um add-ons com uma versão abreviada do
JHOVE, proporcionando controle do formato, da extensão do
arquivo/bistream e a verificação de virus.
29 de março de 2012 Repositórios Confiáveis número do slide 39/55
40. I. Aplicar uma norma de segurança da informação
Para garantir a segurança da informação é necessário aplicar a
norma ISO/IEC 207002:2005 Information technology -- Security
techniques -- Code of practice for information security management,
que comprende as normas ISO/IEC 17799:2005 e ISO/IEC
17799:2005/Cor.1:2007.
A segurança da informação é definida nessa norma como a
preservação da confidencialidade para garantir que a informação
está acessível apenas a aqueles autorizados para ter esse acesso.
A integridade como uma garantia da exatidão e integridade da
informação e dos métodos do seu processamento. Y a
disponibilidade para asegurar o acesso aos usuários autorizados
quando eles requerem acesso à informação.
42. Por que passar por auditoria/certificação?
Um processo de auditoria serve para atribuir/certificar que o
repositório digital está em concordância com o modelo OAIS. Ela
verifica a infraestrutura organizacional, a gestão dos objetos
digitais e a segurança.
A certificação é um elemento essencial para confiabilidade dos
repositórios digitais.
Processos de certificação podem criar maior padronização e
credibilidade dos arquivos digitais.
Processos de certificação podem criar maior padronização e
credibilidade dos arquivos digitais.
29 de março de 2012 Repositórios Confiáveis número do slide 42/55
43. Os pilares da certificação de Repositórios Digitais
THOMAZ (2007)
29 de março de 2012 Repositórios Confiáveis número do slide 43/55
44. I. Participar de uma rede distribuída de preservação digital
29 de março de 2012 Repositórios Confiáveis
45. Rede de repositórios digitais
Por ser difícil para instituições pequenas, ele deve ser gerenciado
em parcerias ou consórcios (museus, arquivos, bibliotecas).
Pertencer a iniciativas de arquivamento com base em um sistema
distribuído, chegando a serviços de ação de serviços de curadoria
digital.
A preservação dos dados digitais estariam baseados nos
repositórios institucionais, que proveriam o suporte para as
atividades de preservação e curadoria.
29 de março de 2012 Repositórios Confiáveis número do slide 45/55
46. I. Contratar arquivistas especializados em curadoria digital.
Os profissionais envolvidos
Os desenvolvedores de repositórios digitais serão
reconhecidos como responsáveis pela aplicação dos padrões
internacionais para sistemas de preservação digital, assim
como pela inclusão de atributos que suportem a segurança
do sistema, os procedimentos apropriados, unidos às
responsabilidades da custódia.
29 de março de 2012 Repositórios Confiáveis número do slide 46/55
47. I. Contratar arquivistas especializados em curadoria digital.
UMA PÉSSIMA NOTÍCIA...
Não há no Brasil cursos para formar especialistas em
curadoria digital, preservação em repositórios digitais e
nem para a gestão de repositórios confiáveis.
29 de março de 2012 Repositórios Confiáveis número do slide 47/55
48.
49.
50.
51. Os graus de confiabilidade
Fazer que os documentos digitais consigam permanecer no
tempo e que seus conteúdos estejam em lugares com algum
tipo de garantia de acesso de longo prazo.
Esta baseada na relação entre os objetivos da política de
preservação com a definição dos papeis, ações e
expectativas da instituição.
29 de março de 2012 Repositórios Confiáveis número do slide 51/55
53. Leituras recomendadas
THOMAZ, Katia. Repositórios digitais confiáveis e certificação. Arquivistica.net, Brasília, DF, 3.1, 11 12 2007.
Disponível em: <http://www.arquivistica.net/ojs/viewarticle.php?id=118>.
MARDERO ARELLANO, Miguel Angel . Critérios para a preservação digital da informação científica. 2008. 354 f. :
Tese (doutorado) - Universidade de Brasília, Departamento de Ciência da Informação, 2008 . Disponível em:
<http://eprints.rclis.org/15412/1/Tese_Miguel_%C3%81ngel_M%C3%A1rdero_Arellano.pdf> .
SAYÃO, Luis Fernando; MARCONDES, Carlos Henrique. Software livres para repositórios institucionais: alguns
subsídios para a seleção. In: SAYÃO, Luis Fernando et al (Orgs). Implantação e gestão de repositórios
institucionais: políticas, memória, livre acesso e preservação. Salvador:EDUFBA, 2009. p. 23 – 54.
ANGEVAARE, Inge. Take care of digital collection and data: “curation” and organizational choices for research
libraries. Liber Quarterly, v.19, n. 1, April 2009. Disponível em:
<http://liber.library.uu.nl/publish/articles/000278/article.pdf>.
ALTMAN, M., ADAMS, M., CRABTREE, J., DONAKOWSKI, D., MAYNARD, M., PIENTA, A., YOUNG, C. (2009). "Digital
preservation through archival collaboration: The Data Preservation Alliance for the Social Sciences." The
American Archivist. 72(1): 169-182
29 de março de 2012 Repositórios Confiáveis número do slide 53/55
54. Leituras recomendadas
NESTOR WORKING GROUP ON TRUSTED REPOSITIORIES CERTIFICATION. Catalogue of Criteria for Trusted Digital
Repositories. Dec. 2006. Disponível em: <http://edoc.huberlin.de/series/nestor-
materialien/8en/PDF/8en.pdf>.
RLG/NARA.Trustworthy repositories audit & certification. RLG, OCLC, Feb. 2007. Disponível em <http://www.crl.edu/
sites/default/files/attachments/pages/trac_0.pdf>.
RLG/NARA. An audit checklist for the certification of trusted digital repositories: draft for public comment. Mountain
View, CA. : RLG, OCLC, 2005. Disponível em: <http://www.rebiun.org/opencms/opencms/handle404?
exporturi=/export/docReb/audit_cheklist.pdf&%5d >.
RLG/OCLC. Trusted digital repositories: attributes and responsibilities. Mountain View, CA. : RLG, OCLC, 2002.
Disponível em <http://www.oclc.org/programs/ourwork/past/trustedrep/repositories.pdf>.
29 de março de 2012 Repositórios Confiáveis número do slide 54/55