Cinco siglos conservando y difundiendo libros, y ahora ¿qué hacemos con Internet?. Mar Pérez Morillo
1. BIBLIOTECA NACIONAL DE ESPAÑA
5 SIGLOS CONSERVANDO Y
DIFUNDIENDO LIBROS, Y AHORA
¿QUÉ HACEMOS CON INTERNET?
El archivo web de la BNE
LIBER 2012, Barcelona
MAR PÉREZ MORILLO
Jefe de Servicio Web de la BNE
2. Índice
Panorama internacional del archivado web
– Antecedentes
– Principales proyectos
– Edad oscura digital
– Proyectos colaborativos
El archivo web de la Biblioteca Nacional de España
– Comienzos
– Estado de la colección
– Planes a corto plazo
– Retos de futuro
• El Depósito Legal de lo electrónico
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 2
3. Panorama internacional del archivado web. Antecedentes
• Directrices UNESCO para la Preservación del Patrimonio Digital (2003)
• Internet Archive (1996)
• Biblioteca Nacional de Australia: Pandora (1996)
• Biblioteca Nacional de Suecia (1997)
• Biblioteca Nacional de Nueva Zelanda (1999)
• Library of Congress: Minerva (2000)
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 3
4. Panorama internacional del archivado web. Otros proyectos
• Iniciativas internacionales muy numerosas ya
• La Biblioteca Nacional de Portugal creó una Wiki en la que se
recogen datos de todos los proyectos:
Año de creación
Organismo responsable
Tecnología utilizada
Recursos humanos
Más información
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 4
5. Panorama internacional del archivado web. Otros proyectos
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 5
6. Riesgo de una Edad Oscura Digital
• “Digital Dark Age”: 150 millones
de resultados en Google
• Preocupación general
• Copistas medievales vs. archiveros web
Carrera contrareloj
Problemas con los soportes
Afán de transmisión del conocimiento
Pérdidas de información
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 6
7. Riesgo de una Edad Oscura Digital
Obsolescencia
de formatos y soportes
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 7
8. Y, ante este riesgo,
¿qué hacemos?
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 8
9. Panorama internacional: el IIPC
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 9
10. Panorama internacional: el IIPC
• Numerosas iniciativas de colaboración.
• La más importante es el Consorcio Internacional para la
Preservación de Internet:
principales instituciones patrimoniales en el campo de la
información y la documentación
• Fundado en 2003 por 11 bibliotecas nacionales y el Internet
Archive.
• Hoy sus miembros somos ya 42.
• La BNE se integró en el Consorcio a principios de 2010.
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 10
12. Panorama internacional: Proyectos colaborativos
• La “Revolución del Jazmín” (Túnez, 2011): recolección web
colaborativa entre Internet Archive, la Library of Congress y la
Biblioteca Nacional de Francia.
• Blogs y sitios web de estudiantes y opositores al régimen de Ben Ali
desaparecieron cada día durante las últimas semanas de 2010 y
enero de 2011.
• Cuando Ben Ali fue depuesto del poder, los documentos oficiales
comenzaron a desaparecer también.
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 12
14. Panorama internacional: Proyectos colaborativos
• Otro proyecto colaborativo (aún en marcha): Olimpiadas 2012.
• La Universidad de North Texas creó una herramienta para
proponer sitios web que recolectar y archivar.
• El archivado lo ha realizado Internet Archive.
• Proyectos como este sirven para
favorecer la colaboración entre instituciones patrimoniales
para coordinarse en la selección de estos materiales
compartir prácticas en este campo
experimentar en accesos web comunes a colecciones de
distinta procedencia
• 2705 URL recolectadas.
• Han participado 31 instituciones de todo el mundo
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 14
15. Panorama internacional: Proyectos colaborativos
La BNE ha participado en este proyecto colaborativo, proponiendo webs
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 15
16. Panorama internacional: ISO TC 46/SC 8/WG 9
Estadísticas y aspectos de calidad en los archivos web
• La BNE trabaja en este grupo desde que se constituyó (finales de 2009)
• Comité técnico 46: Información y documentación
• Subcomité 8: Calidad, estadísticas y evaluación
• Objetivo: elaborar un informe técnico que
refleje el estado actual de la cuestión,
defina los términos y elementos relativos a estos proyectos,
establezca aspectos cuantificables para medir la calidad y
sirva de pauta a las organizaciones que desarrollan estos trabajos
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 16
17. El archivo web de la BNE. Comienzos
• La BNE inició su proyecto de archivado de la
web a finales de 2009
• Contrato con Internet Archive para recolectar el
dominio .es:
1 recolección masiva
(+ 317 millones de URL)
3 recolecciones trimestrales
complementarias
• En total: + 875 millones de URL = 30TB
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 17
18. El archivo web de la BNE. 2ª fase del proyecto
• Periodo 2011-2012:
1 recolección masiva (sept-oct 2011)
1 recolección selectiva elecciones 20-N
1 recolección selectiva Humanidades
1 recolección masiva (mayo-junio 2012)
• Total: 55TB de datos comprimidos
•Recolecciones 2009-2010 + 2011-2012= 85TB
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 18
19. El archivo web de la BNE. Estado del proyecto
• En nuestra colección se guardan distintas capturas de un
mismo sitio web.
• En la Wayback Machine, si tomamos como ejemplo la web
de RTVE, se ve que hay capturas desde diciembre de 2009
hasta la última, que es de julio de 2012.
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 19
20. El archivo web de la BNE. Estado del proyecto
www.rtve.es
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 20
21. El archivo web de la BNE. Estado del proyecto
• Entre lo archivado en nuestra colección, muchas webs ya están
desaparecidas.
• Ejemplo: una captura de la web del MCU de diciembre de 2011,
poco después de las Elecciones Generales. Hoy no existe ya esta
web. El MCU se fundió con el Ministerio de Educación.
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 21
22. El archivo web de la BNE. Estado del proyecto
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 22
23. El archivo web de la BNE. Planes a corto plazo
• Traslado de la colección desde Internet Archive
• Habilitar acceso público
• Toma de medidas ante la entrada en vigor del RD del DL electrónico
• Colaboración con las CC.AA.
• Rastreos y recolecciones propios
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 23
24. El Depósito Legal de lo electrónico
• Es el gran reto
• Necesita de la colaboración de
• Organismos públicos,
• Administraciones,
• Agencias,
• empresas privadas,
• productores
• Necesita:
• recursos,
• financiación…
• Conversaciones con Red.es para
colaboración
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 24
25. Retos de futuro
• Límites de las recolecciones
(geográficos, lingüísticos…)
• Almacenamiento
• Preservación
• Derecho al acceso universal a lo público
• Salvaguarda de los derechos de
propiedad intelectual
• Usos
• ¿Derecho al olvido?
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 25
26. Fuentes de información
Directrices de la UNESCO para la preservación del patrimonio digital (2003):
http://unesdoc.unesco.org/images/0013/001300/130071s.pdf
Proyecto de archivado web en la BNE:
http://www.bne.es/es/LaBNE/ArchivoWeb/index.html
Internet Archive: http://archive.org/index.php
Consorcio Internacional para la Preservación de Internet (IIPC):
http://www.netpreserve.org/
Wiki con todos los proyectos web:
http://en.wikipedia.org/wiki/List_of_Web_Archiving_Initiatives
La Revolución del Jazmín (Túnez, 2011): http://www.archive-
it.org/collections/2323
Recolección colaborativa de las Olimpiadas 2012:
http://digital2.library.unt.edu/nomination/olympics2012/
Grupo de trabajo ISO sobre aspectos de calidad de los archivos web:
http://www.iso.org/iso/home/standards_development/list_of_iso_technical_co
mmittees/iso_technical_committee.htm?commid=48826
Terry Kuny: “A Digital Dark Ages? Challenges in the Preservation of
Electronic Information”, 63RD IFLA Council and General Conference, 1997.
http://archive.ifla.org/IV/ifla63/63kuny1.pdf
BIBLIOTECA NACIONAL DE ESPAÑA
El archivo web de la Biblioteca Nacional de España 26
27. Mar Pérez Morillo
Jefe del Servicio Web
BIBLIOTECA NACIONAL DE ESPAÑA
mar.perez@bne.es
Pº de Recoletos 20-22
28071 Madrid
España
T +34 915 807 800
www.bne.es