Seminarul Internaţional „Implementarea tehnologiei IR (repozitorii instituţionale): Sistemul DSpace”, 14-15 aprilie 2011. Chişinău, Ambasada Regală a Norvegiei în România, Asociaţia Bibliotecarilor din Republica Moldova, Consorţiul REM, Programul EIFL-OA, Biblioteca Ştiinţifică a Academiei de Studii Economice din Moldova. Instructor: Kuzma KUDIM, Institutul Sisteme Software al Academiei de Ştiinţe din Kiev, Ucraina.
3. Рекомедуемая схема
Необходимо скопировать:
Сначала базу данных
Затем дерево файлов
из [dspace-source]
из [dspace]
Порядок важен
Выполнять регулярно
Периодически разворачивать
Хранить физически в другом месте
4. База данных
Копирование
pg_dump -U dspace dspace > backup.sql
Восстановление
psql -U dspace -d dspace -f backup.sql
psql -U dspace -f [dspace-source]/dspace/etc/update-sequences.sql
5. Дерево файлов
Копирование и архивирование
tar -сvfz dspace-source.tar.gz [dspace-source]
tar -сvfz dspace.tar.gz [dspace]
Восстановление
tar -xvf dspace-source.tar.gz
tar -xvf dspace.tar.gz
9. Перемещение документов
На странице редактирования документа:
→Переместить документ
Выбрать целевую коллекцию
Наследовать права от целевой коллекции?
11. Для чего
Массовое однотипное изменение
Массовое добавление метаданных
Массовое перемещение документов
[dspace]/bin/dspace metadata-export Параметры
[dspace]/bin/dspace metadata-import Параметры
12. Команды
Экспорт
[dspace]/bin/dspace metadata-export -f Файл -i Ид
Импорт
[dspace]/bin/dspace metadata-import -f Файл
Добавление новых документов (без файлов)
[dspace]/bin/dspace metadata-import -f Файл -e Email
13. Формат файла
CSV (Microsoft Excel, OpenOffice Calc)
Первая строка — заголовок
id,collection,dc.title,dc.contributor,dc.date.issued,...
Остальные строки — метаданные
350,2292,Какое-то название,"Иванов, Иван",2010,...
14. Редактирование метаданных
Переместить в другую коллекцию
Столбец collection
Добавить документ
Поставить + в поле id
Удалить данные
Удалить значение в строке
Отсутствующие столбцы не удаляются
17. Рекомедуемая схема
Необходимо скопировать:
Сначала базу данных
Затем дерево файлов
из [dspace-source]
из [dspace]
Порядок важен
Выполнять регулярно
Периодически разворачивать
Хранить физически в другом месте
Порядок копирования — сначала база, затем
файлы — важен для сохранения целостности
базы данных, чтобы не возникло ссылок на
несуществующие файлы.
Регулярное копирование обеспечит сохранность
данных. Лучше всего организовать
автоматическое регулярное копирование.
Например, на сервере DSpace по заданию cron
выполняется копирование и архивирование, а с
удалённой машины тоже по заданию cron
выполняется копирование архивных файлов на
эту машину.
Периодическая развертка резервной копии
(особенно в первый раз!) необходима для
проверки работоспособности резервной копии.
Физическое разделение копии и рабочего сервера
— необходимое условие сохранности данных.
18. База данных
Копирование
pg_dump -U dspace dspace > backup.sql
Восстановление
psql -U dspace -d dspace -f backup.sql
psql -U dspace -f [dspace-source]/dspace/etc/update-sequences.sql
Экспортирование базы данных Postgre в виде
файла SQL оcуществляется утилитой pg_dump.
Файл, полученный на выходе первой операции,
используется для восстановления базы данных
с помощью утилиты psql.
Второй вызов psql необходим для восстановления
последовательностей первичных ключей, чтобы
в новосозданной базе не пересоздавались
ключи, совпадающие с существующими.
19. Дерево файлов
Копирование и архивирование
tar -сvfz dspace-source.tar.gz [dspace-source]
tar -сvfz dspace.tar.gz [dspace]
Восстановление
tar -xvf dspace-source.tar.gz
tar -xvf dspace.tar.gz
Копирование, архивирование и восстановление
дерева файлов можно осуществить с помощью
утилиты tar.
22. Реорганизация разделов
Родители/дети/сироты
Связать раздел с подразделом:
[dspace]/bin/dspace community-filiator -s -p ИдРод -c ИдДет
Разорвать связь:
[dspace]/bin/dspace community-filiator -r -p ИдРод -c ИдДет
Например:
[dspace]/bin/dspace community-filiator -r -p 12345/3 -c 12345/8
Иерархия разделов объясняется привычной
метафорой родительских/дочерних узлов
дерева. Так, раздел верхнего уровня, назовём
сиротой. Раздел, который является подразделом
некоторого другого раздела, назовём дочерним,
а его надраздел — родительским. Устанавливая
либо убирая связи родительский-дочерний
между разделами, мы можем изменять
структуру архива.
Это позволяет делать команда community-filiator
административной утилиты dspace с
соответствующими параметрами. В качестве
идентификаторов разделов ИдР и ИдД можно
использовать как хэндлы, так и идентификаторы
из базы данных.
23. Перемещение документов
На странице редактирования документа:
→Переместить документ
Выбрать целевую коллекцию
Наследовать права от целевой коллекции?
Данный способ хорош, если перемещается один
или несколько документов. Если же нужно
переместить большое количество документов,
то легче воспользоваться способом, описанном
в следующем разделе.
25. Для чего
Массовое однотипное изменение
Массовое добавление метаданных
Массовое перемещение документов
[dspace]/bin/dspace metadata-export Параметры
[dspace]/bin/dspace metadata-import Параметры
Существует много ситуаций, когда нужно либо
совершить однотипное изменение в большом
количестве документов (например, исправить
опечатку), либо добавить одинаковое поле
метаданных к уже существующему множеству
документов, либо переместить документы
массово в другую коллекцию (если нужно
переместить небольшое количество документов,
то проще воспользоваться способом, описанном
в предыдущем разделе). Для облегчения этой
работы служат две команды, metadata-export и
metadata-import административной утилиты
dspace.
26. Команды
Экспорт
[dspace]/bin/dspace metadata-export -f Файл -i Ид
Импорт
[dspace]/bin/dspace metadata-import -f Файл
Добавление новых документов (без файлов)
[dspace]/bin/dspace metadata-import -f Файл -e Email
Это команды пакетного экспорта/импорта
метаданных с основными параметрами.
Формат файла описан далее.
Идентификатор — либо хэндл, либо из базы
данных.
Email пользователя, который вносит новые
записи.
27. Формат файла
CSV (Microsoft Excel, OpenOffice Calc)
Первая строка — заголовок
id,collection,dc.title,dc.contributor,dc.date.issued,...
Остальные строки — метаданные
350,2292,Какое-то название,"Иванов, Иван",2010,...
Метаданные экспортируются в CSV формате, то
есть в виде строк, данные в которых разделены
запятыми. Если запятая встречается в данных,
то такие значения следует заключитьв двойные
кавычки. Если в данных встречается двойная
кавычка, то её следует удвоить.
Первая строка-заголовок перечисляет через
запятую столбцы — экспортируемые поля
метаданных.
Последующие строки содержат значения
соответствующих полей через запятую.
Файлы CSV можно удобно редактировать в таких
программах, как Microsoft Excel и OpenOffice
Calc.
28. Редактирование метаданных
Переместить в другую коллекцию
Столбец collection
Добавить документ
Поставить + в поле id
Удалить данные
Удалить значение в строке
Отсутствующие столбцы не удаляются
Для перемещения документов между
коллекциями изменить значения в нужных
строках в столбце collection.
Данные из файла "накладываются" на
существующие в метаданные, поэтому
отсутствующие в файле столбцы удаляться не
будут. Этим можно воспользоваться, чтобы
удалить ненужные при редактировании столбцы,
— такое удаление не отразится в архиве.
Напротив, удаление значения в строке без
удаления соответствующего заголовка столбца
приводит к действительному удалению данных.