SlideShare une entreprise Scribd logo
1  sur  109
디지털 정보자원의 아카이빙(Digital Archiving) 생명주기 기반 관리의 필요성과 방향성 2010.04.07 국립중앙도서관 디지털총괄기획과 전문연구관 박진호
Preserved Flower [http://www.flickr.com/photos/8897269@N08/541851097/] 1
목차 1. 용어의 정의 2. 고민의 시작 3. 국립중앙도서관 프로젝트 4. 생명주기 기반 정보자원 처리 5. KISTI가 주목해야할 프로젝트 및 사례 6. 결론 및 제언 2
Archives,  Digital Archives, Digital Lifecycle 3
1. 용어의 정의 아카이브에 대한 최근의 정의들 디지털을 통해 공유되고 있는 막대한 양의 자료와 정보들에 대해 운영자관심별 혹은 정보 내용 별로 구분되어 저장, 관리, 공유되고 있는 웹사이트 인터넷상의 호스트 컴퓨터로 데이터나 소프트웨어를 보존하고 있는 곳 대규모 기록이나 자료의 수집 디지털화한 데이터를 압축하는 기술이나 방법 인터넷상의 호스트 컴퓨터로 데이터나 소프트웨어를 보존하고 있는 곳 4
1. 용어의 정의 아카이브 전통적으로 정부조직, 공공기관, 회사들이 공공 혹은 사적인 정보 소비자들이 이용할 수 있도록 기록을 보존하는 시설이나 조직 정보에 접근하는 자들의 이해를 도와야 하고, 정보의 진본성과 장기간의 안정성을 보장해야 함 5
1. 용어의 정의 디지털 아카이빙(Digital Archiving) 지속적인 가치를 가졌다고 판단되는 디지털 객체를 장기간 관리하는 활동 또는 가치 있는 디지털 정보자원을 선별하여 디지털 콘텐츠와 여러 기능들을 디지털 정보자원의 생명주기별 보존 관리하여 미래 이용자들이 어려움 없이 정보를 활용할 수 있도록 하는 전반적인 작업 디지털환경에서의 아카이브는 다양한 디지털 정보자원의 소장 및 보존, 접근 기능을 지닌 시스템 또는 그러한 기능을 가진 프로그램 자체 [출처 : Lord & MacDonald, e-Science Data Curation Report, 2003] 6
1. 용어의 정의 디지털 큐레이션(Curation) 디지털 정보(자산)의 유지, 보존과 관련된 활동 the preservation and maintenance of digital assets 디지털 정보(자산)의 아카이빙, 수집, 유지, 영구보존활동 현재 및 미래의 이용자들이 활용할 수 있도록 디지털 정보자원의 장기보존을 위한 프로세스 [출처 : http://www.dcc.ac.uk] 7
1. 용어의 정의 큐레이션 관점에서 Digital Archiving Digital archiving은 curation활동을 의미하며, 다음의 활동(과정)을 보장해야 함 정확한 데이터의 선택 정확한 데이터의 저장 접근 가능한 데이터 논리적 물리적 데이터 통합이 지속적으로 유지됨 데이터는 안전하고 확실함 [출처 : Lord & MacDonald, e-Science Data Curation Report, 2003] 8
1. 용어의 정의 큐레이션 관점에서 Digital Preservation Digital preservation은 아카이빙 활동의 일환 기술적인 변화에 상관없이 데이터에 지속적으로 접근 가능해야 하고, 이해할 수 있어야 함 메타데이터를 포함한 콘텐츠 파일을 갖고 있어야 함 디지털의 발전에 따른 퇴화/기존의 디지털 자료 보호 기술변화에 대항하여 데이터의 진본성 유지 [출처 : Lord & MacDonald, e-Science Data Curation Report, 2003] 9
2. 고민의 시작 문제는 디지털 디지털정보 생산량이 연평균 57%씩 성장해 2010년에는 9,880억GB의 정보가 생산될 것으로 전망 이는 한 사람이 일년간 만들어 내는 정보는 150GB에 이르며 이를 300페이지 책으로 환산하면 1만3,300권에 달하는 분량이다. 2007년 국내 생성·복제 정보 총량 : 약 2701PB  MP3 파일로는 6752억5천만곡 1메가바이트 용량인 500페이지 책으로 환산하면 서울시 면적 전체를 1.5m 높이로 쌓을 수 있는 분량(2조7000억권) 전세계 인구 1인당 평균 생산량 : 150GB 한국 인구 1인당 생산량 : 330GB [출처 : EMC, IDC ‘전세계 디지털정보 성장 전망 보고서’] 10
2. 고민의 시작 “ How Much Information, 2003, UC Berkeley” “ 얼마나 많은 정보가 세상에서 생겨나고 있는가?” http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/index.htm [지식정보의 구분] Stored Information Information Flows Paper Film Magnetic Optical Broadcast Telephony Internet ,[object Object]
2002년 한 해 생산정보가 지난 3년보다 2배 이상 많음
2002년 한 해에 약 18엑사바이트의 새로운 전화, 라이오, TV, 인터넷 정보가 저장11
3. 국립중앙도서관 프로젝트 3.1. OASIS 프로젝트 3.2. 디지털장서관리시스템 12
3.1. OASIS 프로젝트 온라인 자료 수집 및 보존 프로젝트(OASIS) Online Archiving and Searching Internet Source 디지털 지적 창작물들은 짧은 기간 동안 공개되었다가 사라져 버리는 소멸성을가짐 이러한 디지털 자원의 수집과 보존을 위해 2003년 10월 유네스코에서는 인터넷 지식자원의 보존 및 이용에 관한 내용을 "디지털 유산 보존 헌장"에서 천명함 또한 세계 각국의 주요 도서관은 90년대 중반부터 이미 인터넷 지적 자원을 수집하고 보존하는 프로젝트를 추진하여 현재 다양한 연구 성과들을 발표 국가적인 차원에서 디지털자원의 수집과 보존을 등한시 한다면 미래세대에 있어서 현 세대는 잊혀진 암흑의 시대로 구분될 수 있음을 경고 13
3.1. OASIS 프로젝트 주요추진 내용 14
3.1. OASIS 프로젝트 추진 실적 ※ 서비스자료(저작권이용허락자료) : 53,292건 15
3.1. OASIS 프로젝트 수집보존 프로세스 16
3.1. OASIS 프로젝트 해외 사례 17
18
3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium)  2003년 7월 호주, 캐나다, 덴마크, 핀란드, 프랑스, 아이슬랜드, 이탈리아, 노르웨이, 스웨덴, 영국의 국가도서관과 미의회도서관, Internet Archive(미국)는 미래 세대를 위해 인터넷 콘텐츠를 보존하기 위한 국제적인 협력의 중요성을 인지(초기 프랑스 국립도서관 주도) 12개 기관이 프로젝트에 필요한 자금을 지원하고 컨소시엄에 참여함. 초기 3년까지 12개 기관만으로 운영하다가 이 후 전 세계의 도서관, 기록관, 박물관, 문화유산기관으로 확장함 컨소시엄의 목적은 전 세계의 인터넷 콘텐츠에 장기적인 접근, 보존, 수집이 가능하도록 하는 것임 19
3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium)  IIPC 핵심목표 각 국의 법적 테두리 안에서 협력 작업을 수행하여 인터넷 콘텐츠의 선정, 수집, 보존 및 접근 제공을 위한 해결책의 파악 및 개발 촉진 각 국의 장서개발 정책과 맞추어 합법적이 국제적 인터넷 콘텐츠아카이브 활성화 인터넷 콘텐츠의 수집, 보존 및 접근을 돕는 선도 사업의 국제적 지지 획득 사업추진방안 표준의 개발 및 권장  웹 사이트 획득, 아카이빙, 접근 제공을 위한 상호운용성이 있는 도구 및 기법 개발 학술회의 및 교육 사업, 출판 등을 통해 인터넷 보존 문제와 선도 사업에 대한 인식 고취  20
3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 참여기관 21
3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 참여기관 22
3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 참여기관 전 세계 38개 기관의 참여 23
3.1. OASIS 프로젝트 IIPC 2010년 작업반(Working Group) 24
3.1. OASIS 프로젝트 IIPC 2010년 작업반(Working Group) Standards Working Group 폐지 WARC file format, 미래를 위한 타 표준, API, 메타데이터 등에 대한 연구/조사  25
3.2. 디지털 장서관리시스템 디지털도서관 건립과 디지털 정보자원의 일원화 된 관리 추진 모든 유형의 디지털 정보자원을 하나의 관리시스템에서 담당 OASIS 등 기존 시스템의 통합 26
3.2. 디지털 장서관리시스템 임무 “ 물리적 공간 / 가상공간을 동시에 가지면서 별도의 독립된 조직을 통해 망라적으로 디지털정보자원 수집∙ 보존하여 후대 전승, 서비스하기 위한 독립된 디지털도서관 정보시스템 구축” 별도의 독립된 조직 : 디지털 정보자원만 전담하여 업무를 추진하는 새로운 조직구성원이 도서관의 기존 정보자원 처리 방식(업무 흐름)과 새로운 디지털 정보자원 처리방식을 융합하여 활용가능한 새로운 웹 기반 정보시스템 구축 망라적 : 디지털 형태로 제작, 유통, 서비스되는 Born-Digital 자료와 기존에 이미 유통되고 있는 학술정보(전자책, 전자저널) 그리고 웹을 통해 유통되고 있는 새로운 흐름, 유형의 디지털 정보를 모두 다룰 수 있어야 함 27
3.2. 디지털 장서관리시스템 임무 수집/보존 프로세스 : 완전한 하나의 프로세스를 갖추도록 구성 S/W Process 1. 수집 2. 보존 3. 전승 4. 서비스 수집경로 및유형 정의 관리/서비스 영구적 보존 이중화 DRM 등 28
3.2. 디지털 장서관리시스템 임무 수집/보존 프로세스 : 완전한 하나의 프로세스를 갖추도록 구성 S/W 수집 보존 전승 서비스 입수 영구보존 서비스 관리 연계 H/W 29
3.2. 디지털 장서관리시스템 기본 설계 디지털장서관리시스템 디지털정보 입수 영구보존(StorageFarm) 장서수집기 장서등록기 영구보존시스템 콘텐츠관리기 콘텐츠관리기 H/W INFRA 메타데이터 이용자서비스 연계 DRM 30
3.2. 디지털 장서관리시스템 정보 입수 보상금 제작 납본 모 든 유 형  / 포 맷 구독 협력 Contents 구입 웹(Web) Site 31
3.2. 디지털 장서관리시스템 장서 수집기 장서 등록기 콘텐츠 관리기  TRIAL 서비스  수서  평가  재 구독 라이센스 관리  기타자료 관리 콘텐츠 관리  원문 관리 라이센스관리 장서 메타 관리  커뮤니티 관리  제공 DB관리 통합메타 수집메타 원문통합 FRBR기반 Ontology 구축 통합콘텐츠메타 메타구조 관리기 메타구조 관리  메타정보 반입  메타정보 반출 정보 관리  입 수 보 존 SDL엔진 SDL 엔진 Metadata Registry DRM 서 비 스 Adapter 표준메타데이터 통합연동(ESB) Transformation Web Service Content-Based Routing JMS 32
3.2. 디지털 장서관리시스템 영구보존  보 존 ISO 14721 OAIS 적용 영구보존 관리/서비스 영구보존시스템 영구보존 H/W INFRA 비상, 재난 복구 Storage Layer1-관리/서비스 비상, 재난 복구 등-LTO Storage Layer2-영구보존 33
3.2. 디지털 장서관리시스템 이슈 사항 이용자의 요구사항 : 미래의 이용자, 현재의 이용자는 어떤 서비스, 어떤 정보를 요구할 것인가? 메타데이터 처리 : 입수, 관리, 서비스, 영구보존에 사용할 메타데이터는 어떻게 처리해야 하는가?(생명주기와 관련된 재처리 시 메타데이터) 성문화된 정책과 전략 수립 필요 디지털정보자원의 입수, 관리, 서비스, 영구보존 등 전반에 대한 정책 수립 필요 타 시스템(리파지토리 등)과의 연계를 위한 전략 필요 디지털정보자원 자체의 보호(보안) 레코드의 생명주기 동안 하드웨어/소프트웨어 환경이 지속적으로 변화 스토리지 장치의 취약성(디스크 등) 장치의 노후화 데이터 품질저하 하드웨어/소프트웨어의 노후화 34
3.2. 디지털 장서관리시스템 이슈 사항 물리적인 인프라의 구성은 어떻게 할 것인가? 스토리지 이중화, 가상화 백업시스템 구성 DR 센터 구성(DR간 연계) 어떤 표준, 어떤 시스템을 적용할 것인가? Open standards Open source Open Archives Open access Open storage  Open repositories 35
3.2. 디지털 장서관리시스템 ,[object Object],36 36
3.2. 디지털 장서관리시스템 ,[object Object]
업무와 맞지 않는 시스템 설계
디지털도서관 운영조직의 업무에 맞고 디지털의 기본적인 속성(생성에서 소멸까지)을 반영할 수 있어야 함
생명주기에 대한 고민 시작37 37
4. 생명주기 기반 정보자원 처리 38 38
4.1 정의 디지털 생명주기(Digital Lifecycle)기반 정보자원 처리 시간 경과에 상관없이 지속적으로 서비스가 가능한 형태로(재현 가능한 형태) 디지털 정보를 유지 관리 대상 정보 : 보존 및 이용가치가 있는 디지털 형태의 모든 정보 소프트웨어 : 정보를 생성, 관리하기 위한 개발 및 상용 툴 하드웨어 : 정보, 소프트웨어를 운영, 관리, 보존하기 위한 물리적 장치 > 탄생 소멸 > 39
4.2. 배경 도서관법 개정 「도서관법」일부개정법률안(김소남의원 대표발의, 2008.7.24)  「도서관법」일부개정법률안(정병국의원 대표발의, 2008.11.6)  이상 2건의 법률안을 법안심사소위(2009.2.3)위원회의 대안으로 제안  「도서관법」일부개정법률안문방위에서 심사 보고한 위원회 대안으로 의결(09.2.4)  「도서관법」일부개정법률안 국회 본회의 통과(2009.3.2)  「도서관법」개정․공포(2009.3.25)  「도서관법 시행령ㆍ시행규칙」일부개정령(안) 제출 및 입법예고(2009.6.10)  「도서관법 시행령(9.21)·시행규칙(9.23)」법률 시행(2009.9.26)  고시 준비 중 40
4.2. 배경 도서관법 주요 개정 내용 도서관자료의 정의(제2조 제2호) “도서관자료”의 범위를 인쇄자료, 필사자료, 시청각자료, 마이크로 형태자료, 전자자료 그밖에 온라인 자료를 도서관자료의 범위에 포함  온라인 자료의 수집(제20조의 2)  국립중앙도서관은 국가차원의 보존가치가 높은 온라인 자료를 수집, 보존하고, 수집이 제한되는 경우 등에는 협조 요청  온라인 자료 수집 과정에서 개인정보침해 발생시 당사자의 정정·삭제 요구, 행정심판 청구, 행정소송 제기 등 권리구제 방안 대비  41
4.2. 배경 온라인 자료 수집 고시(안) 보존을 위한 수집대상 온라인 자료의 선정, 종류, 형태 수집 방법 및 보상 ,[object Object]
 형태 : ISO, ECMA, KS 등 표준 및 사실상 표준(시장 표준) 준수42
4.3. 고려사항 도서관법 개정에 따른 국립중앙도서관 디지털도서관 시스템 개편 첫 번째 고려 사항 메타데이터(관리 메타데이터, 보존 메타데이터, 서비스 메타데이터) 영구보존을 위한 하드웨어 인프라 구축(스토리지 이중화, 백업 이중화) DR(Disaster Recovery) 센터 구축 영구보존, 서비스를 위한 포맷 표준화(DRM 등 고려) 43
4.3. 고려사항 도서관법 개정에 따른 국립중앙도서관 디지털도서관 시스템 개편 문제점 “디지털”이 갖는 속성에 대한 이해 부족 1회적, 평면적 정보처리에 집중 보존에서의 순환구조에만 집중(파일 포맷, 소프트웨어 집중) 공간적, 하드웨어적 접근 조직, 직제 등 업무 프로세스 재정립 기존 아날로그(서적 등) 정보관리와 유사한 형태의 접근 성문화된 정책 부재 디지털 정보 선정/관리지침, 보존지침, 성과평가 지침 등  정보 = 디지털, 정보생산 도구 = 디지털, 정보저장 도구 = 디지털,  관리시스템 = 디지털 44
4.4. 해결방안 거대 정보시스템의 세분화 기존 시스템의 분화 도서관법 개정 내용에 따른 업무지원이 가능하도록 개편 신규 업무 영역 개발 및 전문화 디지털 생명주기 파악 시스템에서 생명주기 지원이 가능하도록 개편 신규 관리시스템 자체가 하나의 거대 “디지털 정보 자원” 45
4.4. 해결방안 거대 정보시스템의 세분화 1 2 4 입수 관리 서비스 3 영구보존 5 46
4.4. 해결방안 생명주기적 접근 및 적용 정보, 소프트웨어, 하드웨어의 생명주기 정보생명주기 : 도서관법 개정에 따라 보상금 적용 등 문제를 감안하여 비용처리를 수반한 정보생명주기 모형 조사 ISO 14721 OAIS 모형이 가장 대표적이나, 모형 자체가 너무 방대하고 현재의 국립중앙도서관 조직/인력 체계로 구성하기에 어려움이 있음 소프트웨어, 하드웨어 : 국립중앙도서관의 입장(구매자)에서 기업의 제품 생명주기 모형 조사(Product Life Cycle) 그 동안의 소프트웨어, 하드웨어의 기술적 관찰과 보존을 위한 메타데이터 정보 업데이트 등은 완성된 제품이 시장에 나오고 활성화 된 후 최종 제품에 대한 수동적인 접근으로 보다 능동적인 접근 필요 47
4.5. 사례 조사     LIFE(Lifecycle Information for E-Literature) JISC(Joint Information Systems Committee)와 RIN(Research Information Networks)의 자금 지원하에 런던대학(UCL, University College London)과영국국립도서관(the British Library) 공동 수행 디지털 생명주기를 모델화 하는 것과 5, 10년 혹은 20년 후까지 디지털 정보를 보존하기 위한 방법론 개발 LIFE는 디지털 콜렉션을 보유한 기관이 이를 효과적으로 보존할 수 있도록 함 LIFE 1기, 2기, 3기(현재 진행중): 기존업무 프로세스에 기반한 1기 모형에 초점을 둠 48
4.5. 사례 조사     LIFE(Lifecycle Information for E-Literature) LT Aq IT MT AcT ST PT = + + + + + [L= 0에서 T시간 까지 총 생명주기 비용, Aq: Acquisition, I: Ingest, M: Metadata, Ac: Access, S: Storage, P: Preservation] 49
4.5. 사례 조사     LIFE(Lifecycle Information for E-Literature) The Generic LIFE Preservation Model Preservation = t*TEW + (t/ULE + PON)*(CRS+UME+PPA+QAA) Tech Watch Frequency of  Action Preservation Action Preservation =  + * Monitoring formats and software for obsolescence Updating and managing metadata (Representation Information) The number of preservation actions within the time period calculated Updates of object and event Metadata  Cost of Preservation Action Tool Execution of the preservation Action QA if results 50
4.5. 사례 조사 Product Life Cycle Product Initiation Feasibility Design and Plan Development Testing Launch Operation Decommissioning  Product Initiation Feasibility Design and Plan Development Testing 제품 개발 제품 운영 제품 중지(폐기) Launch Operation Decommissioning  51
4.5. 사례 조사 DCC Curation Center 디지털 큐레이션(Digital Curation) 디지털 자원을 제공, 보존, 유지, 수집, 아카이빙 현재와 미래에 이용될 신뢰할 수 있는 디지털 정보를 유지하고, 가치를 부여하는 것 이 정의는 디지털 아키이빙과 보존 과정을 의미하는 것으로 보이지만, 우수한 데이터 생산과 관리에 필요한 과정, 새로운 정보와 지식이 되도록 데이터에 가치를 부여하는 것까지 모두 포함하는 용어 52
4.5. 사례 조사 Digital Curation Center(http://www.dcc.ac.uk/) 53
4.5. 사례 조사 ,[object Object],54 54
4.5. 사례 조사 ,[object Object],55 55
4.5. 사례 조사 ,[object Object],56 56
4.5. 사례 조사 The information life cycle 모든 정보의 가치는 동일하지 않고 라이프 사이클상에서 매 시점마다 차별화된 가치를 가짐. 정보 수명주기 관리(Information Lifecycle Management)는 정보의 계획에서부터 폐기에 이르기까지 전체 라이프 사이클 기간에 걸쳐 저렴한 비용으로 데이터 접근과 저장을 최적화하고 관리하는 프로세스[IBM] 지식관리, 정보관리 등과 연계하여 적용 하드웨어, 소프트웨어 등 주요 기업 주로 데이터베이스, 스토리지 등 유지, 관리에 적용 ☞ 기관의 정책과 표준 적용, 준수 등 필요 57
4.5. 사례 조사 The information life cycle Create/capture Index & Classify Retrieve/publish Process Archive Destroy Store/manage Policies and Standards [Steve Dale, 2009] 58
4.6. 디지털생명주기 프레임워크 디지털장서관리시스템 생명주기 (DCC) (PL) Tech Watch 입수유형별 생명주기 사이클 구입 영구보존 생명주기 (정보, 소프트웨어,  하드웨어) 관리시스템 내 생명주기 사이클 (LIFE, ILM) [무형 정보/소프트웨어, 유형 하드웨어] CD/DVD 구독 매체유형, 포맷별 생명주기 사이클 Text 제작 (OAIS) Image 납본 Video 서비스 생명주기 협력 OASIS 디지털 생명주기 정책, 표준 59
4.7. 위험요소(해결 과제) 비용 : 폐기 없이 영구보존에 들어가는 막대한 비용의 산정 보존 비용 대비 경제성 평가에 취약 초기 입수 비용 대비 시간 경과에 따른 보존 비용 감당의 어려움 외부 전문기업, 제품에 대한 정보 연계 소프트웨어, 하드웨어 등 외부 조직에 의한 … 유동적 조직체계 순환보직, 정보조직 개편 등에 영향을 받음 외부 기업 등 제품의 변화 양상 등(생명주기 변화) 하드, 소프트에 대한 정보원의 변화 등 새로운 매체의 출현 업무기반 프로세스 점검 필요 ITA/EA 정보의 가치 평가 영구보존할 것인가.. 필요한 정보인가.. 국가도서관으로서는 불가능 60
5. KISTI가 주목해야할 프로젝트 및 사례 61
5.1. InterPARES InterPARES(International Research on Permanent Authentic Records in Electronic Systems)  목적 : 진본전자기록의 장기적 보존을 위한 국제 다국적 연구프로젝트  InterPARES 1 Project(1999~2001년) : 진본 전가기록을 장기적으로 보존하기위한 이론적 방법론 개발  InterPARES 2 Project(2002~2006년) : 전자기록물의 생명주기 전 과정에 걸친 신뢰성, 정확성 확보방안 조사 연구(예술활동, 과학활동, 전자정부활동 전자기록물 연구)  InterPARES 3 Project(2007~2012) : 중소규모 기록관을 테스트베드로하여 전자기록의 진본성을 확인하기 위한 InterPARES 1/2 결과 활용 방안 탐구 62
5.1. InterPARES InterPARES 1 Project(1999~2001) 배경  진본 전가기록을 장기적으로 보존하기위한 이론적 방법론 개발  장기보존의 정책, 전략, 표준 모델 체계화    연구영역  진본성: 전자기록의 진본성에 대한 접근과 관리를 위한 개념적 요구사항 확인  평  가 : 장기적으로 보존할 가치가 있는 전자기록을 결정하는 과정에서 디지털기술이 평가방법에 어떻게 작용하는지, 전통적인 기록과 같은 방법으로 수행하거나 또는 상이한 평가 방법을 적용하는 방법론 개발  보존 : 진본 전자기록에 대한 보존 방법 개발  전략 : 진본 전자기록을 장기보존하기 위한 국제적, 국가적, 기관간의 유기적인 정책, 전략, 표준 프레임워크 개발  63
5.1. InterPARES InterPARES 1 Project(1999~2001) 주요 기능 및 활용  행정업무 처리에 관한 문서관리시스템이나 데이터베이스에서 생성되거나 유지되는 기록의 진본성 보존에 관한 연구  디지털 사운드의 장기보존에 관한 연구  성과물 및 활용방안  진본성의 개념적 요구사항, 진본 전자기록의 수집, 보존 방법  64
5.1. InterPARES InterPARES 2 Project(2002~2006) 배경  진본성에 관한 이슈, 기록의 생성에서 장기적 보존까지 전자기록 생명주기의 전 과정에 걸쳐 신뢰성과 정확성을 확보할 방안에 관한 조사 연구  전자시스템에서 운영되는 진본 기록을 장기적으로 보존하기 위한 방안에 관한 연구  경험적이고 상호작용적이며 동적인 컴퓨터 기술에 기반 한 디지털 환경에서 생산된 예술, 과학 및 전자정부분야에서 발생한 전자기록 보존  중점연구내용  중점연구내용 1 : 예술 활동으로부터의 전자기록 연구(창작과정과 관련 활동에 관한 기록을 조사) 중점연구내용 2 : 과학 활동으로부터의 전자기록 연구(신뢰성, 정확성, 진본성의 개념 연구) 중점연구내용 3 : 전자정부활동으로부터의 전자기록 연구(전자기록 사례 보존 방법과 목적 평가) 65
5.1. InterPARES InterPARES 2 Project(2002~2006) 성과물  전자기록, 정확성 진본성 개념 등 디지털 환경에 적용할 개념 구체화  개인이나 조직이 생산한 기록의 진본성을 입증하는 데 필요한 요건  신뢰할 만하고 정확한 기록 생산방법, 진본 기록을 유지하고 보존하기위한 방법  메타데이터 스키마 레지스트리, 보존 메타데이터 요소들의 권고안  전자기록의 실제 사례나 생산, 유지, 장기보존의 연구에 근거하여 기록보존자와 디지털기록 생산자를 대상으로 설계한 2세트의 가이드라인  전자 기록의 생성, 관리, 보존의 관점에서 정책, 전략, 표준 개발을 위한 2개의 프레임워크  보존 모델의 워크플로우, 비즈니스 프로세스 모델 등 보존 관련 2개의 모델  보존 모델의 워크플로우, 비즈니스 프로세스 모델 등 보존 관련 2개의 모델  전문용어 데이터베이스 : InterPARES프로젝트에 사용된 용어정의  지적재산권법, 개인정보보호법, 기록관리법 등 다양한 법률 관련 연구  InterPARES에서 사용된 개념이 다른 분야에서 어떻게 응용되고 해석되는지에 관한 연구  66
5.1. InterPARES InterPARES 3 Project(2007~) 배경  중소규모 기록관을 테스트베드로하여 전자기록의 진본성을 확인하기 위한 InterPARES 1/2 결과 활용 방안 탐구  주요기능 및 활용  전자 기록의 장기보존에 필요한 이론, 방법론, 전략 개발  프로그램이 운영되는 문화적, 법적, 행정적, 기능별 맥락  전자기록을 생산하는 조직이나 개인의 특성  생산된 기록의 유형과 그 기록의 기록상(documentary) 또는 기술상의 특징  재정 및 인적자원의 제한  기록 생산자와 보존 담당자의 조직 문화  훈련된 전문가 또는 교육 프로그램의 접근  67
5.1. InterPARES InterPARES 3 Project(2007~) 주요기능 및 활용  InterPARES 1, 2의 결과를 중소규모의 기록 관리기관이나 프로그램에 곧바로 적용하려면 다음과 같은 조건이 충족되어야 함  조정, 통제, 감사, 주체의 지원  권장하는 방법 또는 전략의 주요사항 적용  각 기록 또는 데이터에 대한 구체적인 실천 계획으로의 변환  담당자에 필요한 능력과 기술개발  68
5.1. InterPARES InterPARES 3 Project(2007~) 성과물 활용방안 중소규모 기록관리 기관 또는 프로그램을 위한 정책, 전략, 절차와 기록을 위한 지침  프로젝트 과정에서 수행되는 개별 사례 연구를 위한 실천 계획  서로 다른 기관과 환경, 국가에서 연구된 개별 사례로부터 도출한 Action Plan의 유효성, 응용가능성, 적용가능성 분석  기록의 생명주기의 각 단계별 보존을 위한 Action Plan 비교  생산일, 최종 열람일, 전달설비, 운영시스템, 소프트웨어, 장비 등  특수 유형의 전자기록에 필요한 보존 요건 지침  선택된 보존 활동의 성공을 평가하기 위한 모델  다양한 유형의 기록보존 프로그램, 기록물, 시스템 등을 위한 비용-편익 모델  다양한 유형의 기록보존 방법 또는 그 방법의 부재로 개인 또는 사회에 나타나는 결과를 식별하기 위한 윤리모델  중소규모 기록 관리기관 또는 프로그램에 본 연구 결과물을 무료로 제공하는 웹사이트  회의자료, 심포지엄, 참고 출판물에서 소개된 전자기록 보존에 대한 이론적, 방법론적 지식을 정리한 자료  기록관리 기관 또는 프로그램, 전문가 협회, 대학 프로그램을 위한 모듈과 IT 전문가, 판매상, 서비스 공급자, 인사 및 회계 담당자와 같은 비기록관리전문가를 위한 홍보 및 교육 모듈  핵심규제, 통제, 감사, 정책결정자에게 제시할 Position Paper  69
5.2. OAIS 참조모델 ISO 14721 Space data and information transfer systems -Open archival information system - Reference model 1999년 NASA(National Aeronautics and Space Administration), CCSDS(Consultative Committee for space Data Systems)제안 2002년 ISO 표준으로 확정 공포 (미국 중심으로 남미, 유럽 10여개 국가의 우주 항공국들이 공동 수행) 현재 디지털 아카이빙 관련 거의 모든 기관들이 참조하고 있는 모형 KISTI의 초기 프로젝트 추진 시 반드시 고려해야하는 사항들이 모두 반영되어 있음 70
5.2. OAIS 참조모델 ISO 14721 Space data and information transfer systems -Open archival information system - Reference model Content Management 콘텐츠를 만들고 이용하기 위해 사용하는 도구, 방법, 기술 등을 지칭 Records Management 정의된 생명주기에 적합하도록 콘텐츠를 보존하기 위해 사용하는 도구, 방법, 기술 등을 지칭 Archives 레코드의 보존, 장기 저장(storage-기억장치)을 위해 사용하는 저장소(Repository) 71
5.2. OAIS 참조모델 OAIS 참조모형은 개념적으로 최상위 차원에서 디지털아카이빙을 정의하는 것으로 앞으로 구축될 디지털 아카이브는 참조모형이 제시한 기능과 환경을 따라야 하지만 적용시키려는 모 기관의 목적, 시스템환경 및 제반 환경과 같은 다양한 요소들을 고려하여 개발되어야 함 72
5.2. OAIS 참조모델 기본 모형 OAIS Producer Consumer IP IP IP Management Information이 Package 형태로 소통 = IP 73
5.2. OAIS 참조모델 Information Package IP Content Information Preservation Description Information 콘텐츠 정보: 보존대상 (기관의 정책 등에 따라 결정) 보존기술정보: 시간 경과 후에도 콘텐츠 정보를 이해할 수 있도록 함 metadata 74
5.2. OAIS 참조모델 Information Package Content Information Preservation Description Information Packaging Information Package 1 Descriptive Information about Package1 75
5.2. OAIS 참조모델 Information Package 참조정보(Reference Information) CI의 식별자 제공. 이용자가 관심있는콘텐츠 정보에 접근가능하도록 함 Preservation Description Information 출처정보(Provenance Information) CI의 기원, 출처. 원본에 관한 신뢰성 문맥정보(Context Information) 다른 CI와의 관련성 인증정보(Fixty Information) CI의 물리적/논리적 무결성 인코딩 오류점검(validation/ verification keys) 76
5.2. OAIS 참조모델 Information Package AIP OAIS Producer Consumer IP IP IP DIP PI Management CI PDI SIP DIP 77
5.2. OAIS 참조모델 Information Package Preservation Planning P R O D U C E R C O N S U M E R Descriptive info Descriptive info Data Management queries result sets Ingest Access  order Archival Storage SIP DIP AIP AIP Administrator 78
5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근  보존 SIP DIP AIP AIP 운영 Ingest SIP입수 입수한 SIP 진본성 및 품질확인(quality scan) AIP생성 AIP로부터 DI 추출 AIP는 아카이브 보존기능으로 전송 DI는 데이터관리 기능으로 전송 79
5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근  보존 SIP DIP AIP AIP 운영 보존 흡수 기능으로부터 AIP입수 AIP를 장기보존(permanent storage)로 전송, 적절한 보존전략선정(포맷이전, 또는 하드웨어 에뮬레이션 등), 적절한 보존매체 선정 : 온라인, 오프라인 보존 포함 정기적 매체이전(periodic refreshment) : 새로운 저장매체로 정기적으로 이전 시킴. 정기적/지속적인 백업 수행, 예기치 못한 재난 방지를 위해 물리적으로 분리된 공간에 복제본 저장(Disaster Recovery) 오류점검 : 아카이브 보존기간 동안 AIP의 논리적, 물리적 무결성 보존을 위하여 주지적으로 CI와 PDI의 오류 여부 점검 접근기능으로부터 요청이 있을 경우 저장된 AIP의 복제본을 접근기능으로 전송 80
5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근  보존 SIP DIP AIP AIP 운영 데이터관리 흡수 기능으로부터 기술정보 입수 기술정보와 시스템 정보가 수록된 데이터베이스 유지/관리 접근모듈로부터 질문을 받아 결과를 생성 81
5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근  보존 SIP DIP AIP AIP 운영 접근 데이터관리모듈로부터 기술정보를, 아카이브 보존 모듈로부터 AIP를 입수 DIP를 생성 이용자의 질문과 요구사항들을 받아서 해당 DIP 전송 82
5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근  보존 SIP DIP AIP AIP 운영 운영 생산자와의 data submission 관련 정책적 협상 OAIS의 핵심모듈 정기적 점검 및 업데이트 시스템 하드웨어, 소프트웨어 관련 기술 점검 및 모니터링 아카이브 내 콘텐츠무결성 점검 및 업데이트 아카이브 관련 정책과 구체적 절차 점검 및 업데이트 이용자 요구사항 점검 및 모니터링, 시스템에 반영 83
5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근  보존 SIP DIP AIP AIP 운영 보존계획 생산자와 이용자 커뮤니티의 요구사항 점검 최근 기술변화 점검 요구사항에 부합하는 기술변화 점검 : 데이터포맷, 미디어선정, 선호하는 소프트웨어패키지, 새로운 컴퓨터 플랫폼, 아카이브와의 커뮤니케이션 메커니즘 새롭게 출현하는 디지털기술, 정보표준, 컴퓨팅 플랫폼(소프트웨어, 하드웨어) 점검하여, 매체이전 고려 보존전략과 표준개발 생산자, 이용자 커뮤니티, 최근 정보기술의 경향과 변화를 조사/파악하여 현 보존시스템을 수정, 업그레이드하고, 향후 중장기적으로 적절한 보존전략과 표준을 개발 패키징 디자인과 마이그레이션 계획 개발 새로운 정보패키지 디자인 84
5.3. XML.gov(접근전략관점) 보존을 위한 전략 구성은 보통 마이그레이션, 애뮬레이션, 표준화(XML 등)  3가지로 XML.gov는 이에 대한 구체적인 고려사항과 접근점에 대해 참고할 만 함 기록 보존소는 수년 간 전자 레코드(전자기록)을 보존해왔음 대부분의 전자기록은 단지 텍스트형태의 제한된 범위에 의해서 행해져 왔음 실질적으로 최근에 생산되는 모든 전자 기록물은 위기에 처해있음 역사적 가치가 있는 복잡하고 막대한 전자기록물은 가까운 미래에 보관되어야 함 1990년 중반에서 2001년까지의 연방정부의 웹사이트의 대부분의 기록은 돌이킬 수 없을 정도로 손실되었음 전자기록물의 장기보존을 위한 실행 가능한 (실용적인) 전략은 지속적으로 막대한 요구, 모든 포맷, 소프트웨어, 하드웨어 패러다임, 문서 형태 혹은 레코드 키핑 실행 변화 등의 새로운 개입을 반복하지 않는 해결책을 요구함 장기보존을 위한 솔루션은 아직까지 없다고 보는 것이 옳음. 아카이브는 다양한 접근과 조합을 시도해야 함 85
5.3. XML.gov(접근전략관점) 접근전략1: Technology Preservation 기록에 대한 접근을 보장하기 위해 오래된 정보 시스템을 유지 기술보존은 점점 더 어려워지고 비용문제도 발생함 노화 애플리케이션은 사용자 친숙도의 부족 문제를 증가시킴 노화되고 쇠퇴한 스토리지 미디어를 포함하고 있어야 함 목록작업(카달로깅)과 메타데이터 처리문제 확장성 단기간의 솔루션만으로 해결해야 함 접근전략2: emulation 오래된 소프트웨어의 기능을 모방한 (일반적) 운영 체제와 하드웨어. 지적 재산권문제의 증가 노화 애플리케이션과 사용자 친숙도 부족 문제 잠재적인 Y2K 유형 소프트웨어의 위험 복합적 컴포넌트를 포함한 작업은 실패할 위험성 증가  대규모 아카이빙에 아직 적용되지 않음 86
5.3. XML.gov(접근전략관점) 접근전략3: Migration 하나의 포맷에서 다른 포맷으로 주기적으로 디지털자료의 전송 레코드의 경솔한 변조 위험 : 레코드가 복잡(complex)할 수록 위험은 더 높아짐 원래 소프트웨어와 파일 포맷에 대한 상세한 지식의 필요 지속적인 프로세스 필요 광범위하게 사용되기 어려움 특정한 레코드에 대해서만 비용효과적 접근전략4: Encapsulation 새로운 디지털 객체를 창조하기 위해 여러 개의 요소들을 결합 보통 XML 컨테이너에 캡슐화함  다양한 포맷, 메타데이터 혹은 뷰어안에 레코드를 포함하고 있어야 함 기록을 자신의 원래 형태대로 남아있게 함 87
5.3. XML.gov(접근전략관점) 접근전략5: Conversion to standard formats ASCII 나 XML등과 같은 표준 형식으로 기록 변환  하드웨어나 소프트웨어에 대한 의존도 감소(XML, ASCII) 선택 표준의 장수(longevity)에 의존적임 널리 사용되는 다른 형식을 포함할 수 있는가?  판단(word, PDF) 변환된 기록의 기능적 손실을 막을 수 있는가?  판단 복합적 파일(complex file)에 어려움이 있는가? 판단     Open Document Format(ODF Vs Open XML) 접근전략6: Documenting archived records 전자장서를 묘사하기 위해 필요한 정보(메타데이터) 콜렉션 생산 88
5.4. 호주 국립기록관 Xena 개요 XENA는 XML Electronic Normalising of Archives의 약자임 XENA 소프트웨어는 디지털보존 과정에서 사용되는 핵심 소프트웨어 애플리케이션으로 독립형으로 존재하지만, 기록보존소에서는API로써 사용함 Xena는 전자문서를 원래 형태로부터 국립기록관에의해서 보존용으로 사용하기에 적합한 개방되고 완벽한 문서 형태로 변환함(비트스트림, 노말라이즈드)  변환 결과는 데이터 객체(object)는 AIPs(Archival Information Packages)로서 회부됨  비트스트림 버전 유형 비트스트림 버전 : Xena는 기록물의 원래 복사본을 메타데이터로 둘러싸인 비트스림을 만들며, 원본의 하드웨어, 운영체제, 소프트웨어에서만 읽을 수 있는 모든 정보를 포함한다.  노말라이즈드 버전 : 노말라이즈드 버전, 제나는 또한 메타데이터로 싸여있다. (wrapped in metadata). 노말라이징 버전 : 기록을 오리지날 포맷으로부터 개방 형 표준 기반 포맷으로 변환한다. 노말리아즈 버전은 기록물의 원 포맷을 고려하지 않는다. 노말라이징 버전은 계속해서 원본에 근접하게 변환이 되도록 기능 개선을 수행할 예정이다.  89
5.4. 호주 국립기록관 Xena 특징 호주국립기록관은 내부용 디지털 보존 소프트웨어로 개발하였으나 개인이나 다른 조직들에서도 유용하게 사용가능 함 아카이브 조직의 자체적인 디지털보존 프로그램 개발에 Xena활용 정부기관 등은 기록관리시스템과 Xena를 통합하여 전자기록물 노말라이즈에 활용하여 접근성과 보존성을 위한 기록물 저장소 배치나 캡처에 활용 개인이나 기타 사용자들은 미래 컴퓨팅 시스템에서 접근 가능하도록 현재 사용하고 있는 전자문서 등을 Xena를 통해 포맷 변환 가능함 Xena는 광범위한 플랫폼과 애플리케이션에 적용가능함 현재, 기록물은 오피스 문서, 이메일, 이미지 등을 개방형 파일포맷으로 변환 가능함 ☞ 지원가능 포맷 : AIFF, BMP, CSS, CSV, CUR, DOC, FLAC, GIF, gzip, HTML, jar, JPEG, MP3,  MacBinary, MPP, ODP, ODS, ODT, PCX, PDF, PNG, PPS, PPT, PSD, RTF, sql, SVG, SXC, SXI, SXW, SYLK, tar, tar.gz, TIFF, TSV, TXT, war, WAV, WPD, WRI, XBM, XHTML, XLS,  XML, XSLT, zip 기존 바이너리 포맷 데이터에 대한 변환 고려 필요 90
5.5. 좋은디지털 자료 좋은 디지털 자료의 기준 진본성, 신뢰성, 접근가능성 등 장기보존을 위한 기존의 원칙들 이외에 Born Digital 자료,  가치 있는 디지털자료로서의 다양한 기준과 원칙들을 분석 91
5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 개요 우수한 디지털 컬렉션을 구축을 위해 미국정보표준화기구가 발표한 4가지 핵심개체에 대한 지침으로 미국박물관도서관기구(IMLS) 지원으로 추진(현재 3판 발행). 컬렉션이 지침에서 제시한4가지 기본 개체 Collection, Object, Metadata, Initiatives 4개 기본 개체에 대한 기본 원칙 설명 목적 우수 디지털 컬렉션 구축을 위한 핵심 구성요소와 활동 설명 우수 디지털 컬렉션을 생산하고 관리하기 위한 지역의 성공적인 실무 사례 개발을 지원 디지털 컬렉션 구축을 위한 우수실무사례의 지속적인 개발을 위한 지역사회 참여 장려 주요대상 디지털 컬렉션을 개발하기 위한 사업을 계획하고 실행하는 문화유산기관 우수 디지털 컬렉션 개발을 지원하는 단체 * “우수” = 유용성, 접근성, 적합성, 비용대 가치, 지속가능성, 신뢰성을 충족해야함때문에 “우수”는 상호운용성, 재이용성, 지속성, 검증, 문서화, 지적재산권 보호 등의  모든 요소를 충족시켜야 함 92
5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection ,[object Object],93
5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 94
5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 95
5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 96
5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 97
5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 개요 전자자원이 급속한 발전에 대비 2년에 한 번 지침 검토 지침은 일반적인 내용으로 자원 수집 범위에 제한을 두지 않으며, 기술 발전 속도에 상관없이 필요한 자원을 이용할 수 있도록 함 전자자원역시 영구적인 접근을 보존해야함 특정 자원의 전자, 아날로그 자료가 모두 존재할 경우 양 쪽 모두를 영구보존 함 정보에 대한 방문 접근과 원격접근을 위해 보장할 수 있도록 보존해야 함 전자자원 제공자가 더 이상 자료를 제공할 수 없을 경우 LC가 자료를 수집하거나 영구보존할 수 있도록 협의 전자자원은 웹사이트,온라인 데이터베이스,전자저널, 전자단행본, 전자통합자원, 모든 형태를 저장하고 있는 물리적 매체 등을 포함 98
5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 정의 전자자원 : 컴퓨터를 통해 이용할 수 있는 모든 저작 입수(acquire) : 의회도서관이 공식계약, 라이선스 또는 기타 협정(이들 전자자원을 LC의 소장 및 보유 여부를 결정하는 협정)을 체결하여 제공하는 전자자원 또는 도서관의 입수 절차(예를 들어 구매,기증,교환,납본,ISSN요청,이전)에 의해 입수한 전자자원 수집(Collect) : LC가 소장하고 영구적으로 보존하기 위해 선정된 전자자원 링크: LC의 웹 자원이나 서지레코드에서 원격으로 데이터에 접근하게 해주는 포인터 아카이브(Archive): LC가 관리하거나 혹은 LC의 이익을 위해 안정적이고 영구적인 디지털 저장소에서 전자자원을 우지하는 과정 상세기준 콘텐츠: 전자자원은 규정된 목표에 부합하고 명백한 연구 가치를 가져야 한다. 부가가치 : 전자자원을 대학에서 이용할 수 있도록 하고 LC의 재택근무직원이 자원에 접근할 수 있도록 우선순위를 둠) 접근가능성 : 서버의 신뢰성, 접근을 위해 등록이 필요하다면, 그것이 적절한지 평가해야 하며 개인정보보호정책이 수반되어야 함, 필요한 경우 플러그인 소프트웨어를 위해 출처에 대한 링크를 제공해야 함 99
5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 상세기준 디자인,이용자 인터페이스, 내항성: 조직화와 자료 탐색의 용이성, 검색 및 도움말 기능, 사이트맵의 존재여부, 완벽하게 기능하는 디자인 요소, 쉽게 이용할 수 있도록 도와주는 쌍방향 기능,  표준 : 유료 자원은 보편적인 기술표준과 컴퓨터 설비 기준을 따름 영구적 보존 : 전자자원은 의회도서관 소장 장서의 일부로서 전자자원의 영구보존 결정을 위한 기준이 다른 매체와 동일하며, 전자자원의 영구적 보존은 연구자와 의회의 연구목적을 충족시키고자 하는 의회도서관의 사명에 기반을 둠 LC가 가능한 전자자원을 입수하거나 직접 생산하여 장기간의 연구 가치를 지닌 전자자원에 대한 영구적인 접근을 제공 전자자원의 영구적 보유 범위에는 관련서지메타데이터, 관리 메타데이터 및 보존 메타데이터까지 포함 LC가 디지털 리포지토리를 개발하고 기타 신뢰받는 디지털 리포지토리와 협의하여 전자자원으로의 접근을 보장할 수 있음 100
5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 보존 우선순위 LC가 생산한 전자자원으로 아메리칸 메모리(American Memory), 웹 아카이브, 포탈 투 더 월드(Portals to the World)등과 같이 다른 형태로는 존재하지 않는 전자자원 다른 형태로는 존재하지 않는 전자자원 LC가 더 이상 수집하지 않는 인쇄 자료의 전자판 부가가치를 지닌 전자적 등가물 LC가 디지털화한 자료 입수한 유일한 전자자원 컴퓨터 프로그램 : LC의 영구적인 장서를 위해 컴퓨터 기술의 발전과 역사를 실제로 보여주는 대표적인 소프트웨어들을 선정 원격 이용하거나 직접 방문으로 이용하기 위해 필요한 소프트웨어를 보존하기 위해 컴퓨터프로그램과 허가를 구할 것임 101
6. 결론 및 제언

Contenu connexe

Tendances

20100401 신진섭 아카이빙 관련 법제도정리
20100401 신진섭 아카이빙 관련 법제도정리20100401 신진섭 아카이빙 관련 법제도정리
20100401 신진섭 아카이빙 관련 법제도정리glorykim
 
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 JM code group
 
오픈사이언스와 연구데이터
오픈사이언스와 연구데이터오픈사이언스와 연구데이터
오픈사이언스와 연구데이터Suntae Kim
 
연구데이터 관리와 데이터 관리 계획서 (DMP) - part02
연구데이터 관리와 데이터 관리 계획서 (DMP) - part02연구데이터 관리와 데이터 관리 계획서 (DMP) - part02
연구데이터 관리와 데이터 관리 계획서 (DMP) - part02Suntae Kim
 
오픈 데이터와 인공지능
오픈 데이터와 인공지능오픈 데이터와 인공지능
오픈 데이터와 인공지능Myungjin Lee
 
연구데이터! 기승전도서관
연구데이터! 기승전도서관연구데이터! 기승전도서관
연구데이터! 기승전도서관Suntae Kim
 
D bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdms
D bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdmsD bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdms
D bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdmsSuntae Kim
 
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04Suntae Kim
 
BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2고포릿 default
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)Hong-Seok Kim
 
LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인Hansung University
 
도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향Hansung University
 

Tendances (12)

20100401 신진섭 아카이빙 관련 법제도정리
20100401 신진섭 아카이빙 관련 법제도정리20100401 신진섭 아카이빙 관련 법제도정리
20100401 신진섭 아카이빙 관련 법제도정리
 
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구 빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
빅데이터 분석/처리에 따른 생활밀착형 서비스의 프라이버시 보호 측면에서의 구조혈 연구
 
오픈사이언스와 연구데이터
오픈사이언스와 연구데이터오픈사이언스와 연구데이터
오픈사이언스와 연구데이터
 
연구데이터 관리와 데이터 관리 계획서 (DMP) - part02
연구데이터 관리와 데이터 관리 계획서 (DMP) - part02연구데이터 관리와 데이터 관리 계획서 (DMP) - part02
연구데이터 관리와 데이터 관리 계획서 (DMP) - part02
 
오픈 데이터와 인공지능
오픈 데이터와 인공지능오픈 데이터와 인공지능
오픈 데이터와 인공지능
 
연구데이터! 기승전도서관
연구데이터! 기승전도서관연구데이터! 기승전도서관
연구데이터! 기승전도서관
 
D bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdms
D bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdmsD bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdms
D bguide 데이터 기반 연구 패러다임(최종회)_데이터 관리 계획서와 rdms
 
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
 
BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2BigData, Hadoop과 Node.js, R2
BigData, Hadoop과 Node.js, R2
 
빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)빅데이터와 로봇 (Big Data in Robotics)
빅데이터와 로봇 (Big Data in Robotics)
 
LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인LOD 구축 공정 가이드라인
LOD 구축 공정 가이드라인
 
도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향도서관 분야의 링크드 데이터 구축 동향
도서관 분야의 링크드 데이터 구축 동향
 

Similaire à 20100407 박진호 d_lifecycle_kisti

20100401 황혜경 디지털아카이빙계획v03312010
20100401 황혜경 디지털아카이빙계획v0331201020100401 황혜경 디지털아카이빙계획v03312010
20100401 황혜경 디지털아카이빙계획v03312010glorykim
 
20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)
20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)
20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)glorykim
 
20171026_일본에서의 오픈 사이언스 개요
20171026_일본에서의  오픈 사이언스 개요20171026_일본에서의  오픈 사이언스 개요
20171026_일본에서의 오픈 사이언스 개요Yasuyuki Minamiyama
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)Steve Min
 
20100526 노경란 우선적용분야및대상
20100526 노경란 우선적용분야및대상20100526 노경란 우선적용분야및대상
20100526 노경란 우선적용분야및대상glorykim
 
문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 -
문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 - 문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 -
문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 - Baro Kim
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
IBM Cloud Object Storage 오브젝트 스토리지
IBM Cloud Object Storage 오브젝트 스토리지IBM Cloud Object Storage 오브젝트 스토리지
IBM Cloud Object Storage 오브젝트 스토리지오윤 권
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdf1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdfssuserde0b2d
 
빅데이터캠퍼스 소개및데이터설명 최종
빅데이터캠퍼스 소개및데이터설명 최종빅데이터캠퍼스 소개및데이터설명 최종
빅데이터캠퍼스 소개및데이터설명 최종bigdatacampus
 
실감영상 에트리
실감영상 에트리실감영상 에트리
실감영상 에트리JM code group
 
[경북] I'mcloud information
[경북] I'mcloud information[경북] I'mcloud information
[경북] I'mcloud informationstartupkorea
 
인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009Han Woo PARK
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기Kangwook Lee
 
특허전쟁 승리 위한 R&d 전략
특허전쟁 승리 위한 R&d 전략특허전쟁 승리 위한 R&d 전략
특허전쟁 승리 위한 R&d 전략atelier t*h
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기iron han
 

Similaire à 20100407 박진호 d_lifecycle_kisti (20)

20100401 황혜경 디지털아카이빙계획v03312010
20100401 황혜경 디지털아카이빙계획v0331201020100401 황혜경 디지털아카이빙계획v03312010
20100401 황혜경 디지털아카이빙계획v03312010
 
20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)
20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)
20100413 노경란 선진-주요국의_디지털_아카이빙_프로젝트_사례조사(0407)
 
20171026_일본에서의 오픈 사이언스 개요
20171026_일본에서의  오픈 사이언스 개요20171026_일본에서의  오픈 사이언스 개요
20171026_일본에서의 오픈 사이언스 개요
 
(2010.12.23)iipc oasis
(2010.12.23)iipc oasis(2010.12.23)iipc oasis
(2010.12.23)iipc oasis
 
[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)[SSA] 01.bigdata database technology (2014.02.05)
[SSA] 01.bigdata database technology (2014.02.05)
 
20100526 노경란 우선적용분야및대상
20100526 노경란 우선적용분야및대상20100526 노경란 우선적용분야및대상
20100526 노경란 우선적용분야및대상
 
국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향국내외 공간빅데이터 정책 및 기술동향
국내외 공간빅데이터 정책 및 기술동향
 
문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 -
문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 - 문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 -
문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례 -
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
IBM Cloud Object Storage 오브젝트 스토리지
IBM Cloud Object Storage 오브젝트 스토리지IBM Cloud Object Storage 오브젝트 스토리지
IBM Cloud Object Storage 오브젝트 스토리지
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdf1. 개방형 데이터 허브 핵심 기술 V2.pdf
1. 개방형 데이터 허브 핵심 기술 V2.pdf
 
빅데이터캠퍼스 소개및데이터설명 최종
빅데이터캠퍼스 소개및데이터설명 최종빅데이터캠퍼스 소개및데이터설명 최종
빅데이터캠퍼스 소개및데이터설명 최종
 
실감영상 에트리
실감영상 에트리실감영상 에트리
실감영상 에트리
 
링크드 데이터 사례
링크드 데이터 사례링크드 데이터 사례
링크드 데이터 사례
 
[경북] I'mcloud information
[경북] I'mcloud information[경북] I'mcloud information
[경북] I'mcloud information
 
인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009인터넷 연구방법으로 E 사이언스 20 Oct2009
인터넷 연구방법으로 E 사이언스 20 Oct2009
 
빅데이터전문가교육 2학기
빅데이터전문가교육 2학기빅데이터전문가교육 2학기
빅데이터전문가교육 2학기
 
특허전쟁 승리 위한 R&d 전략
특허전쟁 승리 위한 R&d 전략특허전쟁 승리 위한 R&d 전략
특허전쟁 승리 위한 R&d 전략
 
Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기
 

Plus de glorykim

2010 0603 최명석_웹 아카이빙-글꼴포함-20100602
2010 0603 최명석_웹 아카이빙-글꼴포함-201006022010 0603 최명석_웹 아카이빙-글꼴포함-20100602
2010 0603 최명석_웹 아카이빙-글꼴포함-20100602glorykim
 
2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호glorykim
 
20100511 최선희 사업추친체계_20100511 최선희 송부용
20100511 최선희 사업추친체계_20100511 최선희 송부용20100511 최선희 사업추친체계_20100511 최선희 송부용
20100511 최선희 사업추친체계_20100511 최선희 송부용glorykim
 
20100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.0
20100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.020100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.0
20100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.0glorykim
 
6호 디지털자료 보존과 저작권
6호  디지털자료 보존과 저작권6호  디지털자료 보존과 저작권
6호 디지털자료 보존과 저작권glorykim
 
20100401 정영임 da 전략 tft_0330
20100401 정영임 da 전략 tft_033020100401 정영임 da 전략 tft_0330
20100401 정영임 da 전략 tft_0330glorykim
 

Plus de glorykim (6)

2010 0603 최명석_웹 아카이빙-글꼴포함-20100602
2010 0603 최명석_웹 아카이빙-글꼴포함-201006022010 0603 최명석_웹 아카이빙-글꼴포함-20100602
2010 0603 최명석_웹 아카이빙-글꼴포함-20100602
 
2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호2010 0603 이상호_과학데이터 아카이빙-이상호
2010 0603 이상호_과학데이터 아카이빙-이상호
 
20100511 최선희 사업추친체계_20100511 최선희 송부용
20100511 최선희 사업추친체계_20100511 최선희 송부용20100511 최선희 사업추친체계_20100511 최선희 송부용
20100511 최선희 사업추친체계_20100511 최선희 송부용
 
20100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.0
20100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.020100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.0
20100511 신진섭 [발표자료]디지털 자료의 보존과 저작권20100511v1.0
 
6호 디지털자료 보존과 저작권
6호  디지털자료 보존과 저작권6호  디지털자료 보존과 저작권
6호 디지털자료 보존과 저작권
 
20100401 정영임 da 전략 tft_0330
20100401 정영임 da 전략 tft_033020100401 정영임 da 전략 tft_0330
20100401 정영임 da 전략 tft_0330
 

20100407 박진호 d_lifecycle_kisti

  • 1. 디지털 정보자원의 아카이빙(Digital Archiving) 생명주기 기반 관리의 필요성과 방향성 2010.04.07 국립중앙도서관 디지털총괄기획과 전문연구관 박진호
  • 3. 목차 1. 용어의 정의 2. 고민의 시작 3. 국립중앙도서관 프로젝트 4. 생명주기 기반 정보자원 처리 5. KISTI가 주목해야할 프로젝트 및 사례 6. 결론 및 제언 2
  • 4. Archives, Digital Archives, Digital Lifecycle 3
  • 5. 1. 용어의 정의 아카이브에 대한 최근의 정의들 디지털을 통해 공유되고 있는 막대한 양의 자료와 정보들에 대해 운영자관심별 혹은 정보 내용 별로 구분되어 저장, 관리, 공유되고 있는 웹사이트 인터넷상의 호스트 컴퓨터로 데이터나 소프트웨어를 보존하고 있는 곳 대규모 기록이나 자료의 수집 디지털화한 데이터를 압축하는 기술이나 방법 인터넷상의 호스트 컴퓨터로 데이터나 소프트웨어를 보존하고 있는 곳 4
  • 6. 1. 용어의 정의 아카이브 전통적으로 정부조직, 공공기관, 회사들이 공공 혹은 사적인 정보 소비자들이 이용할 수 있도록 기록을 보존하는 시설이나 조직 정보에 접근하는 자들의 이해를 도와야 하고, 정보의 진본성과 장기간의 안정성을 보장해야 함 5
  • 7. 1. 용어의 정의 디지털 아카이빙(Digital Archiving) 지속적인 가치를 가졌다고 판단되는 디지털 객체를 장기간 관리하는 활동 또는 가치 있는 디지털 정보자원을 선별하여 디지털 콘텐츠와 여러 기능들을 디지털 정보자원의 생명주기별 보존 관리하여 미래 이용자들이 어려움 없이 정보를 활용할 수 있도록 하는 전반적인 작업 디지털환경에서의 아카이브는 다양한 디지털 정보자원의 소장 및 보존, 접근 기능을 지닌 시스템 또는 그러한 기능을 가진 프로그램 자체 [출처 : Lord & MacDonald, e-Science Data Curation Report, 2003] 6
  • 8. 1. 용어의 정의 디지털 큐레이션(Curation) 디지털 정보(자산)의 유지, 보존과 관련된 활동 the preservation and maintenance of digital assets 디지털 정보(자산)의 아카이빙, 수집, 유지, 영구보존활동 현재 및 미래의 이용자들이 활용할 수 있도록 디지털 정보자원의 장기보존을 위한 프로세스 [출처 : http://www.dcc.ac.uk] 7
  • 9. 1. 용어의 정의 큐레이션 관점에서 Digital Archiving Digital archiving은 curation활동을 의미하며, 다음의 활동(과정)을 보장해야 함 정확한 데이터의 선택 정확한 데이터의 저장 접근 가능한 데이터 논리적 물리적 데이터 통합이 지속적으로 유지됨 데이터는 안전하고 확실함 [출처 : Lord & MacDonald, e-Science Data Curation Report, 2003] 8
  • 10. 1. 용어의 정의 큐레이션 관점에서 Digital Preservation Digital preservation은 아카이빙 활동의 일환 기술적인 변화에 상관없이 데이터에 지속적으로 접근 가능해야 하고, 이해할 수 있어야 함 메타데이터를 포함한 콘텐츠 파일을 갖고 있어야 함 디지털의 발전에 따른 퇴화/기존의 디지털 자료 보호 기술변화에 대항하여 데이터의 진본성 유지 [출처 : Lord & MacDonald, e-Science Data Curation Report, 2003] 9
  • 11. 2. 고민의 시작 문제는 디지털 디지털정보 생산량이 연평균 57%씩 성장해 2010년에는 9,880억GB의 정보가 생산될 것으로 전망 이는 한 사람이 일년간 만들어 내는 정보는 150GB에 이르며 이를 300페이지 책으로 환산하면 1만3,300권에 달하는 분량이다. 2007년 국내 생성·복제 정보 총량 : 약 2701PB MP3 파일로는 6752억5천만곡 1메가바이트 용량인 500페이지 책으로 환산하면 서울시 면적 전체를 1.5m 높이로 쌓을 수 있는 분량(2조7000억권) 전세계 인구 1인당 평균 생산량 : 150GB 한국 인구 1인당 생산량 : 330GB [출처 : EMC, IDC ‘전세계 디지털정보 성장 전망 보고서’] 10
  • 12.
  • 13. 2002년 한 해 생산정보가 지난 3년보다 2배 이상 많음
  • 14. 2002년 한 해에 약 18엑사바이트의 새로운 전화, 라이오, TV, 인터넷 정보가 저장11
  • 15. 3. 국립중앙도서관 프로젝트 3.1. OASIS 프로젝트 3.2. 디지털장서관리시스템 12
  • 16. 3.1. OASIS 프로젝트 온라인 자료 수집 및 보존 프로젝트(OASIS) Online Archiving and Searching Internet Source 디지털 지적 창작물들은 짧은 기간 동안 공개되었다가 사라져 버리는 소멸성을가짐 이러한 디지털 자원의 수집과 보존을 위해 2003년 10월 유네스코에서는 인터넷 지식자원의 보존 및 이용에 관한 내용을 "디지털 유산 보존 헌장"에서 천명함 또한 세계 각국의 주요 도서관은 90년대 중반부터 이미 인터넷 지적 자원을 수집하고 보존하는 프로젝트를 추진하여 현재 다양한 연구 성과들을 발표 국가적인 차원에서 디지털자원의 수집과 보존을 등한시 한다면 미래세대에 있어서 현 세대는 잊혀진 암흑의 시대로 구분될 수 있음을 경고 13
  • 17. 3.1. OASIS 프로젝트 주요추진 내용 14
  • 18. 3.1. OASIS 프로젝트 추진 실적 ※ 서비스자료(저작권이용허락자료) : 53,292건 15
  • 19. 3.1. OASIS 프로젝트 수집보존 프로세스 16
  • 20. 3.1. OASIS 프로젝트 해외 사례 17
  • 21. 18
  • 22. 3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) 2003년 7월 호주, 캐나다, 덴마크, 핀란드, 프랑스, 아이슬랜드, 이탈리아, 노르웨이, 스웨덴, 영국의 국가도서관과 미의회도서관, Internet Archive(미국)는 미래 세대를 위해 인터넷 콘텐츠를 보존하기 위한 국제적인 협력의 중요성을 인지(초기 프랑스 국립도서관 주도) 12개 기관이 프로젝트에 필요한 자금을 지원하고 컨소시엄에 참여함. 초기 3년까지 12개 기관만으로 운영하다가 이 후 전 세계의 도서관, 기록관, 박물관, 문화유산기관으로 확장함 컨소시엄의 목적은 전 세계의 인터넷 콘텐츠에 장기적인 접근, 보존, 수집이 가능하도록 하는 것임 19
  • 23. 3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 핵심목표 각 국의 법적 테두리 안에서 협력 작업을 수행하여 인터넷 콘텐츠의 선정, 수집, 보존 및 접근 제공을 위한 해결책의 파악 및 개발 촉진 각 국의 장서개발 정책과 맞추어 합법적이 국제적 인터넷 콘텐츠아카이브 활성화 인터넷 콘텐츠의 수집, 보존 및 접근을 돕는 선도 사업의 국제적 지지 획득 사업추진방안 표준의 개발 및 권장 웹 사이트 획득, 아카이빙, 접근 제공을 위한 상호운용성이 있는 도구 및 기법 개발 학술회의 및 교육 사업, 출판 등을 통해 인터넷 보존 문제와 선도 사업에 대한 인식 고취 20
  • 24. 3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 참여기관 21
  • 25. 3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 참여기관 22
  • 26. 3.1. OASIS 프로젝트 IIPC(International Internet Preservation Consortium) IIPC 참여기관 전 세계 38개 기관의 참여 23
  • 27. 3.1. OASIS 프로젝트 IIPC 2010년 작업반(Working Group) 24
  • 28. 3.1. OASIS 프로젝트 IIPC 2010년 작업반(Working Group) Standards Working Group 폐지 WARC file format, 미래를 위한 타 표준, API, 메타데이터 등에 대한 연구/조사 25
  • 29. 3.2. 디지털 장서관리시스템 디지털도서관 건립과 디지털 정보자원의 일원화 된 관리 추진 모든 유형의 디지털 정보자원을 하나의 관리시스템에서 담당 OASIS 등 기존 시스템의 통합 26
  • 30. 3.2. 디지털 장서관리시스템 임무 “ 물리적 공간 / 가상공간을 동시에 가지면서 별도의 독립된 조직을 통해 망라적으로 디지털정보자원 수집∙ 보존하여 후대 전승, 서비스하기 위한 독립된 디지털도서관 정보시스템 구축” 별도의 독립된 조직 : 디지털 정보자원만 전담하여 업무를 추진하는 새로운 조직구성원이 도서관의 기존 정보자원 처리 방식(업무 흐름)과 새로운 디지털 정보자원 처리방식을 융합하여 활용가능한 새로운 웹 기반 정보시스템 구축 망라적 : 디지털 형태로 제작, 유통, 서비스되는 Born-Digital 자료와 기존에 이미 유통되고 있는 학술정보(전자책, 전자저널) 그리고 웹을 통해 유통되고 있는 새로운 흐름, 유형의 디지털 정보를 모두 다룰 수 있어야 함 27
  • 31. 3.2. 디지털 장서관리시스템 임무 수집/보존 프로세스 : 완전한 하나의 프로세스를 갖추도록 구성 S/W Process 1. 수집 2. 보존 3. 전승 4. 서비스 수집경로 및유형 정의 관리/서비스 영구적 보존 이중화 DRM 등 28
  • 32. 3.2. 디지털 장서관리시스템 임무 수집/보존 프로세스 : 완전한 하나의 프로세스를 갖추도록 구성 S/W 수집 보존 전승 서비스 입수 영구보존 서비스 관리 연계 H/W 29
  • 33. 3.2. 디지털 장서관리시스템 기본 설계 디지털장서관리시스템 디지털정보 입수 영구보존(StorageFarm) 장서수집기 장서등록기 영구보존시스템 콘텐츠관리기 콘텐츠관리기 H/W INFRA 메타데이터 이용자서비스 연계 DRM 30
  • 34. 3.2. 디지털 장서관리시스템 정보 입수 보상금 제작 납본 모 든 유 형 / 포 맷 구독 협력 Contents 구입 웹(Web) Site 31
  • 35. 3.2. 디지털 장서관리시스템 장서 수집기 장서 등록기 콘텐츠 관리기 TRIAL 서비스 수서 평가 재 구독 라이센스 관리 기타자료 관리 콘텐츠 관리 원문 관리 라이센스관리 장서 메타 관리 커뮤니티 관리 제공 DB관리 통합메타 수집메타 원문통합 FRBR기반 Ontology 구축 통합콘텐츠메타 메타구조 관리기 메타구조 관리 메타정보 반입 메타정보 반출 정보 관리 입 수 보 존 SDL엔진 SDL 엔진 Metadata Registry DRM 서 비 스 Adapter 표준메타데이터 통합연동(ESB) Transformation Web Service Content-Based Routing JMS 32
  • 36. 3.2. 디지털 장서관리시스템 영구보존 보 존 ISO 14721 OAIS 적용 영구보존 관리/서비스 영구보존시스템 영구보존 H/W INFRA 비상, 재난 복구 Storage Layer1-관리/서비스 비상, 재난 복구 등-LTO Storage Layer2-영구보존 33
  • 37. 3.2. 디지털 장서관리시스템 이슈 사항 이용자의 요구사항 : 미래의 이용자, 현재의 이용자는 어떤 서비스, 어떤 정보를 요구할 것인가? 메타데이터 처리 : 입수, 관리, 서비스, 영구보존에 사용할 메타데이터는 어떻게 처리해야 하는가?(생명주기와 관련된 재처리 시 메타데이터) 성문화된 정책과 전략 수립 필요 디지털정보자원의 입수, 관리, 서비스, 영구보존 등 전반에 대한 정책 수립 필요 타 시스템(리파지토리 등)과의 연계를 위한 전략 필요 디지털정보자원 자체의 보호(보안) 레코드의 생명주기 동안 하드웨어/소프트웨어 환경이 지속적으로 변화 스토리지 장치의 취약성(디스크 등) 장치의 노후화 데이터 품질저하 하드웨어/소프트웨어의 노후화 34
  • 38. 3.2. 디지털 장서관리시스템 이슈 사항 물리적인 인프라의 구성은 어떻게 할 것인가? 스토리지 이중화, 가상화 백업시스템 구성 DR 센터 구성(DR간 연계) 어떤 표준, 어떤 시스템을 적용할 것인가? Open standards Open source Open Archives Open access Open storage Open repositories 35
  • 39.
  • 40.
  • 41. 업무와 맞지 않는 시스템 설계
  • 42. 디지털도서관 운영조직의 업무에 맞고 디지털의 기본적인 속성(생성에서 소멸까지)을 반영할 수 있어야 함
  • 44. 4. 생명주기 기반 정보자원 처리 38 38
  • 45. 4.1 정의 디지털 생명주기(Digital Lifecycle)기반 정보자원 처리 시간 경과에 상관없이 지속적으로 서비스가 가능한 형태로(재현 가능한 형태) 디지털 정보를 유지 관리 대상 정보 : 보존 및 이용가치가 있는 디지털 형태의 모든 정보 소프트웨어 : 정보를 생성, 관리하기 위한 개발 및 상용 툴 하드웨어 : 정보, 소프트웨어를 운영, 관리, 보존하기 위한 물리적 장치 > 탄생 소멸 > 39
  • 46. 4.2. 배경 도서관법 개정 「도서관법」일부개정법률안(김소남의원 대표발의, 2008.7.24) 「도서관법」일부개정법률안(정병국의원 대표발의, 2008.11.6) 이상 2건의 법률안을 법안심사소위(2009.2.3)위원회의 대안으로 제안 「도서관법」일부개정법률안문방위에서 심사 보고한 위원회 대안으로 의결(09.2.4) 「도서관법」일부개정법률안 국회 본회의 통과(2009.3.2) 「도서관법」개정․공포(2009.3.25) 「도서관법 시행령ㆍ시행규칙」일부개정령(안) 제출 및 입법예고(2009.6.10) 「도서관법 시행령(9.21)·시행규칙(9.23)」법률 시행(2009.9.26) 고시 준비 중 40
  • 47. 4.2. 배경 도서관법 주요 개정 내용 도서관자료의 정의(제2조 제2호) “도서관자료”의 범위를 인쇄자료, 필사자료, 시청각자료, 마이크로 형태자료, 전자자료 그밖에 온라인 자료를 도서관자료의 범위에 포함 온라인 자료의 수집(제20조의 2) 국립중앙도서관은 국가차원의 보존가치가 높은 온라인 자료를 수집, 보존하고, 수집이 제한되는 경우 등에는 협조 요청 온라인 자료 수집 과정에서 개인정보침해 발생시 당사자의 정정·삭제 요구, 행정심판 청구, 행정소송 제기 등 권리구제 방안 대비 41
  • 48.
  • 49. 형태 : ISO, ECMA, KS 등 표준 및 사실상 표준(시장 표준) 준수42
  • 50. 4.3. 고려사항 도서관법 개정에 따른 국립중앙도서관 디지털도서관 시스템 개편 첫 번째 고려 사항 메타데이터(관리 메타데이터, 보존 메타데이터, 서비스 메타데이터) 영구보존을 위한 하드웨어 인프라 구축(스토리지 이중화, 백업 이중화) DR(Disaster Recovery) 센터 구축 영구보존, 서비스를 위한 포맷 표준화(DRM 등 고려) 43
  • 51. 4.3. 고려사항 도서관법 개정에 따른 국립중앙도서관 디지털도서관 시스템 개편 문제점 “디지털”이 갖는 속성에 대한 이해 부족 1회적, 평면적 정보처리에 집중 보존에서의 순환구조에만 집중(파일 포맷, 소프트웨어 집중) 공간적, 하드웨어적 접근 조직, 직제 등 업무 프로세스 재정립 기존 아날로그(서적 등) 정보관리와 유사한 형태의 접근 성문화된 정책 부재 디지털 정보 선정/관리지침, 보존지침, 성과평가 지침 등 정보 = 디지털, 정보생산 도구 = 디지털, 정보저장 도구 = 디지털, 관리시스템 = 디지털 44
  • 52. 4.4. 해결방안 거대 정보시스템의 세분화 기존 시스템의 분화 도서관법 개정 내용에 따른 업무지원이 가능하도록 개편 신규 업무 영역 개발 및 전문화 디지털 생명주기 파악 시스템에서 생명주기 지원이 가능하도록 개편 신규 관리시스템 자체가 하나의 거대 “디지털 정보 자원” 45
  • 53. 4.4. 해결방안 거대 정보시스템의 세분화 1 2 4 입수 관리 서비스 3 영구보존 5 46
  • 54. 4.4. 해결방안 생명주기적 접근 및 적용 정보, 소프트웨어, 하드웨어의 생명주기 정보생명주기 : 도서관법 개정에 따라 보상금 적용 등 문제를 감안하여 비용처리를 수반한 정보생명주기 모형 조사 ISO 14721 OAIS 모형이 가장 대표적이나, 모형 자체가 너무 방대하고 현재의 국립중앙도서관 조직/인력 체계로 구성하기에 어려움이 있음 소프트웨어, 하드웨어 : 국립중앙도서관의 입장(구매자)에서 기업의 제품 생명주기 모형 조사(Product Life Cycle) 그 동안의 소프트웨어, 하드웨어의 기술적 관찰과 보존을 위한 메타데이터 정보 업데이트 등은 완성된 제품이 시장에 나오고 활성화 된 후 최종 제품에 대한 수동적인 접근으로 보다 능동적인 접근 필요 47
  • 55. 4.5. 사례 조사 LIFE(Lifecycle Information for E-Literature) JISC(Joint Information Systems Committee)와 RIN(Research Information Networks)의 자금 지원하에 런던대학(UCL, University College London)과영국국립도서관(the British Library) 공동 수행 디지털 생명주기를 모델화 하는 것과 5, 10년 혹은 20년 후까지 디지털 정보를 보존하기 위한 방법론 개발 LIFE는 디지털 콜렉션을 보유한 기관이 이를 효과적으로 보존할 수 있도록 함 LIFE 1기, 2기, 3기(현재 진행중): 기존업무 프로세스에 기반한 1기 모형에 초점을 둠 48
  • 56. 4.5. 사례 조사 LIFE(Lifecycle Information for E-Literature) LT Aq IT MT AcT ST PT = + + + + + [L= 0에서 T시간 까지 총 생명주기 비용, Aq: Acquisition, I: Ingest, M: Metadata, Ac: Access, S: Storage, P: Preservation] 49
  • 57. 4.5. 사례 조사 LIFE(Lifecycle Information for E-Literature) The Generic LIFE Preservation Model Preservation = t*TEW + (t/ULE + PON)*(CRS+UME+PPA+QAA) Tech Watch Frequency of Action Preservation Action Preservation = + * Monitoring formats and software for obsolescence Updating and managing metadata (Representation Information) The number of preservation actions within the time period calculated Updates of object and event Metadata Cost of Preservation Action Tool Execution of the preservation Action QA if results 50
  • 58. 4.5. 사례 조사 Product Life Cycle Product Initiation Feasibility Design and Plan Development Testing Launch Operation Decommissioning Product Initiation Feasibility Design and Plan Development Testing 제품 개발 제품 운영 제품 중지(폐기) Launch Operation Decommissioning 51
  • 59. 4.5. 사례 조사 DCC Curation Center 디지털 큐레이션(Digital Curation) 디지털 자원을 제공, 보존, 유지, 수집, 아카이빙 현재와 미래에 이용될 신뢰할 수 있는 디지털 정보를 유지하고, 가치를 부여하는 것 이 정의는 디지털 아키이빙과 보존 과정을 의미하는 것으로 보이지만, 우수한 데이터 생산과 관리에 필요한 과정, 새로운 정보와 지식이 되도록 데이터에 가치를 부여하는 것까지 모두 포함하는 용어 52
  • 60. 4.5. 사례 조사 Digital Curation Center(http://www.dcc.ac.uk/) 53
  • 61.
  • 62.
  • 63.
  • 64. 4.5. 사례 조사 The information life cycle 모든 정보의 가치는 동일하지 않고 라이프 사이클상에서 매 시점마다 차별화된 가치를 가짐. 정보 수명주기 관리(Information Lifecycle Management)는 정보의 계획에서부터 폐기에 이르기까지 전체 라이프 사이클 기간에 걸쳐 저렴한 비용으로 데이터 접근과 저장을 최적화하고 관리하는 프로세스[IBM] 지식관리, 정보관리 등과 연계하여 적용 하드웨어, 소프트웨어 등 주요 기업 주로 데이터베이스, 스토리지 등 유지, 관리에 적용 ☞ 기관의 정책과 표준 적용, 준수 등 필요 57
  • 65. 4.5. 사례 조사 The information life cycle Create/capture Index & Classify Retrieve/publish Process Archive Destroy Store/manage Policies and Standards [Steve Dale, 2009] 58
  • 66. 4.6. 디지털생명주기 프레임워크 디지털장서관리시스템 생명주기 (DCC) (PL) Tech Watch 입수유형별 생명주기 사이클 구입 영구보존 생명주기 (정보, 소프트웨어, 하드웨어) 관리시스템 내 생명주기 사이클 (LIFE, ILM) [무형 정보/소프트웨어, 유형 하드웨어] CD/DVD 구독 매체유형, 포맷별 생명주기 사이클 Text 제작 (OAIS) Image 납본 Video 서비스 생명주기 협력 OASIS 디지털 생명주기 정책, 표준 59
  • 67. 4.7. 위험요소(해결 과제) 비용 : 폐기 없이 영구보존에 들어가는 막대한 비용의 산정 보존 비용 대비 경제성 평가에 취약 초기 입수 비용 대비 시간 경과에 따른 보존 비용 감당의 어려움 외부 전문기업, 제품에 대한 정보 연계 소프트웨어, 하드웨어 등 외부 조직에 의한 … 유동적 조직체계 순환보직, 정보조직 개편 등에 영향을 받음 외부 기업 등 제품의 변화 양상 등(생명주기 변화) 하드, 소프트에 대한 정보원의 변화 등 새로운 매체의 출현 업무기반 프로세스 점검 필요 ITA/EA 정보의 가치 평가 영구보존할 것인가.. 필요한 정보인가.. 국가도서관으로서는 불가능 60
  • 68. 5. KISTI가 주목해야할 프로젝트 및 사례 61
  • 69. 5.1. InterPARES InterPARES(International Research on Permanent Authentic Records in Electronic Systems) 목적 : 진본전자기록의 장기적 보존을 위한 국제 다국적 연구프로젝트 InterPARES 1 Project(1999~2001년) : 진본 전가기록을 장기적으로 보존하기위한 이론적 방법론 개발 InterPARES 2 Project(2002~2006년) : 전자기록물의 생명주기 전 과정에 걸친 신뢰성, 정확성 확보방안 조사 연구(예술활동, 과학활동, 전자정부활동 전자기록물 연구) InterPARES 3 Project(2007~2012) : 중소규모 기록관을 테스트베드로하여 전자기록의 진본성을 확인하기 위한 InterPARES 1/2 결과 활용 방안 탐구 62
  • 70. 5.1. InterPARES InterPARES 1 Project(1999~2001) 배경 진본 전가기록을 장기적으로 보존하기위한 이론적 방법론 개발 장기보존의 정책, 전략, 표준 모델 체계화   연구영역 진본성: 전자기록의 진본성에 대한 접근과 관리를 위한 개념적 요구사항 확인 평  가 : 장기적으로 보존할 가치가 있는 전자기록을 결정하는 과정에서 디지털기술이 평가방법에 어떻게 작용하는지, 전통적인 기록과 같은 방법으로 수행하거나 또는 상이한 평가 방법을 적용하는 방법론 개발 보존 : 진본 전자기록에 대한 보존 방법 개발 전략 : 진본 전자기록을 장기보존하기 위한 국제적, 국가적, 기관간의 유기적인 정책, 전략, 표준 프레임워크 개발 63
  • 71. 5.1. InterPARES InterPARES 1 Project(1999~2001) 주요 기능 및 활용 행정업무 처리에 관한 문서관리시스템이나 데이터베이스에서 생성되거나 유지되는 기록의 진본성 보존에 관한 연구 디지털 사운드의 장기보존에 관한 연구 성과물 및 활용방안 진본성의 개념적 요구사항, 진본 전자기록의 수집, 보존 방법 64
  • 72. 5.1. InterPARES InterPARES 2 Project(2002~2006) 배경 진본성에 관한 이슈, 기록의 생성에서 장기적 보존까지 전자기록 생명주기의 전 과정에 걸쳐 신뢰성과 정확성을 확보할 방안에 관한 조사 연구 전자시스템에서 운영되는 진본 기록을 장기적으로 보존하기 위한 방안에 관한 연구 경험적이고 상호작용적이며 동적인 컴퓨터 기술에 기반 한 디지털 환경에서 생산된 예술, 과학 및 전자정부분야에서 발생한 전자기록 보존 중점연구내용 중점연구내용 1 : 예술 활동으로부터의 전자기록 연구(창작과정과 관련 활동에 관한 기록을 조사) 중점연구내용 2 : 과학 활동으로부터의 전자기록 연구(신뢰성, 정확성, 진본성의 개념 연구) 중점연구내용 3 : 전자정부활동으로부터의 전자기록 연구(전자기록 사례 보존 방법과 목적 평가) 65
  • 73. 5.1. InterPARES InterPARES 2 Project(2002~2006) 성과물 전자기록, 정확성 진본성 개념 등 디지털 환경에 적용할 개념 구체화 개인이나 조직이 생산한 기록의 진본성을 입증하는 데 필요한 요건 신뢰할 만하고 정확한 기록 생산방법, 진본 기록을 유지하고 보존하기위한 방법 메타데이터 스키마 레지스트리, 보존 메타데이터 요소들의 권고안 전자기록의 실제 사례나 생산, 유지, 장기보존의 연구에 근거하여 기록보존자와 디지털기록 생산자를 대상으로 설계한 2세트의 가이드라인 전자 기록의 생성, 관리, 보존의 관점에서 정책, 전략, 표준 개발을 위한 2개의 프레임워크 보존 모델의 워크플로우, 비즈니스 프로세스 모델 등 보존 관련 2개의 모델 보존 모델의 워크플로우, 비즈니스 프로세스 모델 등 보존 관련 2개의 모델 전문용어 데이터베이스 : InterPARES프로젝트에 사용된 용어정의 지적재산권법, 개인정보보호법, 기록관리법 등 다양한 법률 관련 연구 InterPARES에서 사용된 개념이 다른 분야에서 어떻게 응용되고 해석되는지에 관한 연구 66
  • 74. 5.1. InterPARES InterPARES 3 Project(2007~) 배경 중소규모 기록관을 테스트베드로하여 전자기록의 진본성을 확인하기 위한 InterPARES 1/2 결과 활용 방안 탐구 주요기능 및 활용 전자 기록의 장기보존에 필요한 이론, 방법론, 전략 개발 프로그램이 운영되는 문화적, 법적, 행정적, 기능별 맥락 전자기록을 생산하는 조직이나 개인의 특성 생산된 기록의 유형과 그 기록의 기록상(documentary) 또는 기술상의 특징 재정 및 인적자원의 제한 기록 생산자와 보존 담당자의 조직 문화 훈련된 전문가 또는 교육 프로그램의 접근 67
  • 75. 5.1. InterPARES InterPARES 3 Project(2007~) 주요기능 및 활용 InterPARES 1, 2의 결과를 중소규모의 기록 관리기관이나 프로그램에 곧바로 적용하려면 다음과 같은 조건이 충족되어야 함 조정, 통제, 감사, 주체의 지원 권장하는 방법 또는 전략의 주요사항 적용 각 기록 또는 데이터에 대한 구체적인 실천 계획으로의 변환 담당자에 필요한 능력과 기술개발 68
  • 76. 5.1. InterPARES InterPARES 3 Project(2007~) 성과물 활용방안 중소규모 기록관리 기관 또는 프로그램을 위한 정책, 전략, 절차와 기록을 위한 지침 프로젝트 과정에서 수행되는 개별 사례 연구를 위한 실천 계획 서로 다른 기관과 환경, 국가에서 연구된 개별 사례로부터 도출한 Action Plan의 유효성, 응용가능성, 적용가능성 분석 기록의 생명주기의 각 단계별 보존을 위한 Action Plan 비교 생산일, 최종 열람일, 전달설비, 운영시스템, 소프트웨어, 장비 등 특수 유형의 전자기록에 필요한 보존 요건 지침 선택된 보존 활동의 성공을 평가하기 위한 모델 다양한 유형의 기록보존 프로그램, 기록물, 시스템 등을 위한 비용-편익 모델 다양한 유형의 기록보존 방법 또는 그 방법의 부재로 개인 또는 사회에 나타나는 결과를 식별하기 위한 윤리모델 중소규모 기록 관리기관 또는 프로그램에 본 연구 결과물을 무료로 제공하는 웹사이트 회의자료, 심포지엄, 참고 출판물에서 소개된 전자기록 보존에 대한 이론적, 방법론적 지식을 정리한 자료 기록관리 기관 또는 프로그램, 전문가 협회, 대학 프로그램을 위한 모듈과 IT 전문가, 판매상, 서비스 공급자, 인사 및 회계 담당자와 같은 비기록관리전문가를 위한 홍보 및 교육 모듈 핵심규제, 통제, 감사, 정책결정자에게 제시할 Position Paper 69
  • 77. 5.2. OAIS 참조모델 ISO 14721 Space data and information transfer systems -Open archival information system - Reference model 1999년 NASA(National Aeronautics and Space Administration), CCSDS(Consultative Committee for space Data Systems)제안 2002년 ISO 표준으로 확정 공포 (미국 중심으로 남미, 유럽 10여개 국가의 우주 항공국들이 공동 수행) 현재 디지털 아카이빙 관련 거의 모든 기관들이 참조하고 있는 모형 KISTI의 초기 프로젝트 추진 시 반드시 고려해야하는 사항들이 모두 반영되어 있음 70
  • 78. 5.2. OAIS 참조모델 ISO 14721 Space data and information transfer systems -Open archival information system - Reference model Content Management 콘텐츠를 만들고 이용하기 위해 사용하는 도구, 방법, 기술 등을 지칭 Records Management 정의된 생명주기에 적합하도록 콘텐츠를 보존하기 위해 사용하는 도구, 방법, 기술 등을 지칭 Archives 레코드의 보존, 장기 저장(storage-기억장치)을 위해 사용하는 저장소(Repository) 71
  • 79. 5.2. OAIS 참조모델 OAIS 참조모형은 개념적으로 최상위 차원에서 디지털아카이빙을 정의하는 것으로 앞으로 구축될 디지털 아카이브는 참조모형이 제시한 기능과 환경을 따라야 하지만 적용시키려는 모 기관의 목적, 시스템환경 및 제반 환경과 같은 다양한 요소들을 고려하여 개발되어야 함 72
  • 80. 5.2. OAIS 참조모델 기본 모형 OAIS Producer Consumer IP IP IP Management Information이 Package 형태로 소통 = IP 73
  • 81. 5.2. OAIS 참조모델 Information Package IP Content Information Preservation Description Information 콘텐츠 정보: 보존대상 (기관의 정책 등에 따라 결정) 보존기술정보: 시간 경과 후에도 콘텐츠 정보를 이해할 수 있도록 함 metadata 74
  • 82. 5.2. OAIS 참조모델 Information Package Content Information Preservation Description Information Packaging Information Package 1 Descriptive Information about Package1 75
  • 83. 5.2. OAIS 참조모델 Information Package 참조정보(Reference Information) CI의 식별자 제공. 이용자가 관심있는콘텐츠 정보에 접근가능하도록 함 Preservation Description Information 출처정보(Provenance Information) CI의 기원, 출처. 원본에 관한 신뢰성 문맥정보(Context Information) 다른 CI와의 관련성 인증정보(Fixty Information) CI의 물리적/논리적 무결성 인코딩 오류점검(validation/ verification keys) 76
  • 84. 5.2. OAIS 참조모델 Information Package AIP OAIS Producer Consumer IP IP IP DIP PI Management CI PDI SIP DIP 77
  • 85. 5.2. OAIS 참조모델 Information Package Preservation Planning P R O D U C E R C O N S U M E R Descriptive info Descriptive info Data Management queries result sets Ingest Access order Archival Storage SIP DIP AIP AIP Administrator 78
  • 86. 5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근 보존 SIP DIP AIP AIP 운영 Ingest SIP입수 입수한 SIP 진본성 및 품질확인(quality scan) AIP생성 AIP로부터 DI 추출 AIP는 아카이브 보존기능으로 전송 DI는 데이터관리 기능으로 전송 79
  • 87. 5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근 보존 SIP DIP AIP AIP 운영 보존 흡수 기능으로부터 AIP입수 AIP를 장기보존(permanent storage)로 전송, 적절한 보존전략선정(포맷이전, 또는 하드웨어 에뮬레이션 등), 적절한 보존매체 선정 : 온라인, 오프라인 보존 포함 정기적 매체이전(periodic refreshment) : 새로운 저장매체로 정기적으로 이전 시킴. 정기적/지속적인 백업 수행, 예기치 못한 재난 방지를 위해 물리적으로 분리된 공간에 복제본 저장(Disaster Recovery) 오류점검 : 아카이브 보존기간 동안 AIP의 논리적, 물리적 무결성 보존을 위하여 주지적으로 CI와 PDI의 오류 여부 점검 접근기능으로부터 요청이 있을 경우 저장된 AIP의 복제본을 접근기능으로 전송 80
  • 88. 5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근 보존 SIP DIP AIP AIP 운영 데이터관리 흡수 기능으로부터 기술정보 입수 기술정보와 시스템 정보가 수록된 데이터베이스 유지/관리 접근모듈로부터 질문을 받아 결과를 생성 81
  • 89. 5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근 보존 SIP DIP AIP AIP 운영 접근 데이터관리모듈로부터 기술정보를, 아카이브 보존 모듈로부터 AIP를 입수 DIP를 생성 이용자의 질문과 요구사항들을 받아서 해당 DIP 전송 82
  • 90. 5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근 보존 SIP DIP AIP AIP 운영 운영 생산자와의 data submission 관련 정책적 협상 OAIS의 핵심모듈 정기적 점검 및 업데이트 시스템 하드웨어, 소프트웨어 관련 기술 점검 및 모니터링 아카이브 내 콘텐츠무결성 점검 및 업데이트 아카이브 관련 정책과 구체적 절차 점검 및 업데이트 이용자 요구사항 점검 및 모니터링, 시스템에 반영 83
  • 91. 5.2. OAIS 참조모델 보존계획 DI DI P R O D U C E R C O N S U M E R 데이터관리 흡수 접근 보존 SIP DIP AIP AIP 운영 보존계획 생산자와 이용자 커뮤니티의 요구사항 점검 최근 기술변화 점검 요구사항에 부합하는 기술변화 점검 : 데이터포맷, 미디어선정, 선호하는 소프트웨어패키지, 새로운 컴퓨터 플랫폼, 아카이브와의 커뮤니케이션 메커니즘 새롭게 출현하는 디지털기술, 정보표준, 컴퓨팅 플랫폼(소프트웨어, 하드웨어) 점검하여, 매체이전 고려 보존전략과 표준개발 생산자, 이용자 커뮤니티, 최근 정보기술의 경향과 변화를 조사/파악하여 현 보존시스템을 수정, 업그레이드하고, 향후 중장기적으로 적절한 보존전략과 표준을 개발 패키징 디자인과 마이그레이션 계획 개발 새로운 정보패키지 디자인 84
  • 92. 5.3. XML.gov(접근전략관점) 보존을 위한 전략 구성은 보통 마이그레이션, 애뮬레이션, 표준화(XML 등) 3가지로 XML.gov는 이에 대한 구체적인 고려사항과 접근점에 대해 참고할 만 함 기록 보존소는 수년 간 전자 레코드(전자기록)을 보존해왔음 대부분의 전자기록은 단지 텍스트형태의 제한된 범위에 의해서 행해져 왔음 실질적으로 최근에 생산되는 모든 전자 기록물은 위기에 처해있음 역사적 가치가 있는 복잡하고 막대한 전자기록물은 가까운 미래에 보관되어야 함 1990년 중반에서 2001년까지의 연방정부의 웹사이트의 대부분의 기록은 돌이킬 수 없을 정도로 손실되었음 전자기록물의 장기보존을 위한 실행 가능한 (실용적인) 전략은 지속적으로 막대한 요구, 모든 포맷, 소프트웨어, 하드웨어 패러다임, 문서 형태 혹은 레코드 키핑 실행 변화 등의 새로운 개입을 반복하지 않는 해결책을 요구함 장기보존을 위한 솔루션은 아직까지 없다고 보는 것이 옳음. 아카이브는 다양한 접근과 조합을 시도해야 함 85
  • 93. 5.3. XML.gov(접근전략관점) 접근전략1: Technology Preservation 기록에 대한 접근을 보장하기 위해 오래된 정보 시스템을 유지 기술보존은 점점 더 어려워지고 비용문제도 발생함 노화 애플리케이션은 사용자 친숙도의 부족 문제를 증가시킴 노화되고 쇠퇴한 스토리지 미디어를 포함하고 있어야 함 목록작업(카달로깅)과 메타데이터 처리문제 확장성 단기간의 솔루션만으로 해결해야 함 접근전략2: emulation 오래된 소프트웨어의 기능을 모방한 (일반적) 운영 체제와 하드웨어. 지적 재산권문제의 증가 노화 애플리케이션과 사용자 친숙도 부족 문제 잠재적인 Y2K 유형 소프트웨어의 위험 복합적 컴포넌트를 포함한 작업은 실패할 위험성 증가 대규모 아카이빙에 아직 적용되지 않음 86
  • 94. 5.3. XML.gov(접근전략관점) 접근전략3: Migration 하나의 포맷에서 다른 포맷으로 주기적으로 디지털자료의 전송 레코드의 경솔한 변조 위험 : 레코드가 복잡(complex)할 수록 위험은 더 높아짐 원래 소프트웨어와 파일 포맷에 대한 상세한 지식의 필요 지속적인 프로세스 필요 광범위하게 사용되기 어려움 특정한 레코드에 대해서만 비용효과적 접근전략4: Encapsulation 새로운 디지털 객체를 창조하기 위해 여러 개의 요소들을 결합 보통 XML 컨테이너에 캡슐화함 다양한 포맷, 메타데이터 혹은 뷰어안에 레코드를 포함하고 있어야 함 기록을 자신의 원래 형태대로 남아있게 함 87
  • 95. 5.3. XML.gov(접근전략관점) 접근전략5: Conversion to standard formats ASCII 나 XML등과 같은 표준 형식으로 기록 변환 하드웨어나 소프트웨어에 대한 의존도 감소(XML, ASCII) 선택 표준의 장수(longevity)에 의존적임 널리 사용되는 다른 형식을 포함할 수 있는가? 판단(word, PDF) 변환된 기록의 기능적 손실을 막을 수 있는가? 판단 복합적 파일(complex file)에 어려움이 있는가? 판단 Open Document Format(ODF Vs Open XML) 접근전략6: Documenting archived records 전자장서를 묘사하기 위해 필요한 정보(메타데이터) 콜렉션 생산 88
  • 96. 5.4. 호주 국립기록관 Xena 개요 XENA는 XML Electronic Normalising of Archives의 약자임 XENA 소프트웨어는 디지털보존 과정에서 사용되는 핵심 소프트웨어 애플리케이션으로 독립형으로 존재하지만, 기록보존소에서는API로써 사용함 Xena는 전자문서를 원래 형태로부터 국립기록관에의해서 보존용으로 사용하기에 적합한 개방되고 완벽한 문서 형태로 변환함(비트스트림, 노말라이즈드) 변환 결과는 데이터 객체(object)는 AIPs(Archival Information Packages)로서 회부됨 비트스트림 버전 유형 비트스트림 버전 : Xena는 기록물의 원래 복사본을 메타데이터로 둘러싸인 비트스림을 만들며, 원본의 하드웨어, 운영체제, 소프트웨어에서만 읽을 수 있는 모든 정보를 포함한다. 노말라이즈드 버전 : 노말라이즈드 버전, 제나는 또한 메타데이터로 싸여있다. (wrapped in metadata). 노말라이징 버전 : 기록을 오리지날 포맷으로부터 개방 형 표준 기반 포맷으로 변환한다. 노말리아즈 버전은 기록물의 원 포맷을 고려하지 않는다. 노말라이징 버전은 계속해서 원본에 근접하게 변환이 되도록 기능 개선을 수행할 예정이다. 89
  • 97. 5.4. 호주 국립기록관 Xena 특징 호주국립기록관은 내부용 디지털 보존 소프트웨어로 개발하였으나 개인이나 다른 조직들에서도 유용하게 사용가능 함 아카이브 조직의 자체적인 디지털보존 프로그램 개발에 Xena활용 정부기관 등은 기록관리시스템과 Xena를 통합하여 전자기록물 노말라이즈에 활용하여 접근성과 보존성을 위한 기록물 저장소 배치나 캡처에 활용 개인이나 기타 사용자들은 미래 컴퓨팅 시스템에서 접근 가능하도록 현재 사용하고 있는 전자문서 등을 Xena를 통해 포맷 변환 가능함 Xena는 광범위한 플랫폼과 애플리케이션에 적용가능함 현재, 기록물은 오피스 문서, 이메일, 이미지 등을 개방형 파일포맷으로 변환 가능함 ☞ 지원가능 포맷 : AIFF, BMP, CSS, CSV, CUR, DOC, FLAC, GIF, gzip, HTML, jar, JPEG, MP3, MacBinary, MPP, ODP, ODS, ODT, PCX, PDF, PNG, PPS, PPT, PSD, RTF, sql, SVG, SXC, SXI, SXW, SYLK, tar, tar.gz, TIFF, TSV, TXT, war, WAV, WPD, WRI, XBM, XHTML, XLS, XML, XSLT, zip 기존 바이너리 포맷 데이터에 대한 변환 고려 필요 90
  • 98. 5.5. 좋은디지털 자료 좋은 디지털 자료의 기준 진본성, 신뢰성, 접근가능성 등 장기보존을 위한 기존의 원칙들 이외에 Born Digital 자료, 가치 있는 디지털자료로서의 다양한 기준과 원칙들을 분석 91
  • 99. 5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 개요 우수한 디지털 컬렉션을 구축을 위해 미국정보표준화기구가 발표한 4가지 핵심개체에 대한 지침으로 미국박물관도서관기구(IMLS) 지원으로 추진(현재 3판 발행). 컬렉션이 지침에서 제시한4가지 기본 개체 Collection, Object, Metadata, Initiatives 4개 기본 개체에 대한 기본 원칙 설명 목적 우수 디지털 컬렉션 구축을 위한 핵심 구성요소와 활동 설명 우수 디지털 컬렉션을 생산하고 관리하기 위한 지역의 성공적인 실무 사례 개발을 지원 디지털 컬렉션 구축을 위한 우수실무사례의 지속적인 개발을 위한 지역사회 참여 장려 주요대상 디지털 컬렉션을 개발하기 위한 사업을 계획하고 실행하는 문화유산기관 우수 디지털 컬렉션 개발을 지원하는 단체 * “우수” = 유용성, 접근성, 적합성, 비용대 가치, 지속가능성, 신뢰성을 충족해야함때문에 “우수”는 상호운용성, 재이용성, 지속성, 검증, 문서화, 지적재산권 보호 등의 모든 요소를 충족시켜야 함 92
  • 100.
  • 101. 5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 94
  • 102. 5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 95
  • 103. 5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 96
  • 104. 5.5. 좋은디지털 자료 NISO: A Framework of Guidance for Good Digital Collection 97
  • 105. 5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 개요 전자자원이 급속한 발전에 대비 2년에 한 번 지침 검토 지침은 일반적인 내용으로 자원 수집 범위에 제한을 두지 않으며, 기술 발전 속도에 상관없이 필요한 자원을 이용할 수 있도록 함 전자자원역시 영구적인 접근을 보존해야함 특정 자원의 전자, 아날로그 자료가 모두 존재할 경우 양 쪽 모두를 영구보존 함 정보에 대한 방문 접근과 원격접근을 위해 보장할 수 있도록 보존해야 함 전자자원 제공자가 더 이상 자료를 제공할 수 없을 경우 LC가 자료를 수집하거나 영구보존할 수 있도록 협의 전자자원은 웹사이트,온라인 데이터베이스,전자저널, 전자단행본, 전자통합자원, 모든 형태를 저장하고 있는 물리적 매체 등을 포함 98
  • 106. 5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 정의 전자자원 : 컴퓨터를 통해 이용할 수 있는 모든 저작 입수(acquire) : 의회도서관이 공식계약, 라이선스 또는 기타 협정(이들 전자자원을 LC의 소장 및 보유 여부를 결정하는 협정)을 체결하여 제공하는 전자자원 또는 도서관의 입수 절차(예를 들어 구매,기증,교환,납본,ISSN요청,이전)에 의해 입수한 전자자원 수집(Collect) : LC가 소장하고 영구적으로 보존하기 위해 선정된 전자자원 링크: LC의 웹 자원이나 서지레코드에서 원격으로 데이터에 접근하게 해주는 포인터 아카이브(Archive): LC가 관리하거나 혹은 LC의 이익을 위해 안정적이고 영구적인 디지털 저장소에서 전자자원을 우지하는 과정 상세기준 콘텐츠: 전자자원은 규정된 목표에 부합하고 명백한 연구 가치를 가져야 한다. 부가가치 : 전자자원을 대학에서 이용할 수 있도록 하고 LC의 재택근무직원이 자원에 접근할 수 있도록 우선순위를 둠) 접근가능성 : 서버의 신뢰성, 접근을 위해 등록이 필요하다면, 그것이 적절한지 평가해야 하며 개인정보보호정책이 수반되어야 함, 필요한 경우 플러그인 소프트웨어를 위해 출처에 대한 링크를 제공해야 함 99
  • 107. 5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 상세기준 디자인,이용자 인터페이스, 내항성: 조직화와 자료 탐색의 용이성, 검색 및 도움말 기능, 사이트맵의 존재여부, 완벽하게 기능하는 디자인 요소, 쉽게 이용할 수 있도록 도와주는 쌍방향 기능, 표준 : 유료 자원은 보편적인 기술표준과 컴퓨터 설비 기준을 따름 영구적 보존 : 전자자원은 의회도서관 소장 장서의 일부로서 전자자원의 영구보존 결정을 위한 기준이 다른 매체와 동일하며, 전자자원의 영구적 보존은 연구자와 의회의 연구목적을 충족시키고자 하는 의회도서관의 사명에 기반을 둠 LC가 가능한 전자자원을 입수하거나 직접 생산하여 장기간의 연구 가치를 지닌 전자자원에 대한 영구적인 접근을 제공 전자자원의 영구적 보유 범위에는 관련서지메타데이터, 관리 메타데이터 및 보존 메타데이터까지 포함 LC가 디지털 리포지토리를 개발하고 기타 신뢰받는 디지털 리포지토리와 협의하여 전자자원으로의 접근을 보장할 수 있음 100
  • 108. 5.5. 좋은디지털 자료 미의회도서관 디지털장서개발정책_전자자원지침 보존 우선순위 LC가 생산한 전자자원으로 아메리칸 메모리(American Memory), 웹 아카이브, 포탈 투 더 월드(Portals to the World)등과 같이 다른 형태로는 존재하지 않는 전자자원 다른 형태로는 존재하지 않는 전자자원 LC가 더 이상 수집하지 않는 인쇄 자료의 전자판 부가가치를 지닌 전자적 등가물 LC가 디지털화한 자료 입수한 유일한 전자자원 컴퓨터 프로그램 : LC의 영구적인 장서를 위해 컴퓨터 기술의 발전과 역사를 실제로 보여주는 대표적인 소프트웨어들을 선정 원격 이용하거나 직접 방문으로 이용하기 위해 필요한 소프트웨어를 보존하기 위해 컴퓨터프로그램과 허가를 구할 것임 101
  • 109. 6. 결론 및 제언
  • 110. 결론 및 제언 디지털 아카이빙 프로젝트 진행 정보시스템을 구축하기 위한 사업의 일환으로 생각하면 실패 조직의 업무프로세스, 직원의 역량, 성문화된 정책, 구체화된 전략, 명확한 대상, 명확한 이용자, 명확한 관리자 등 정의 정보시스템은 디지털 아카이빙 업무(Business)가 보다 효과적으로 진행될 수 있도록 도와주는 종합적인 툴(Data, System, Application, Security) ITA/EA의 본래 의미를 생각해 보십시오. 103
  • 111. 결론 및 제언 디지털 아카이빙 프로젝트 진행 디지털 객체에 붙어 있는 다양한 또 다른 디지털들을 고려 디지털 정보를 만드는 도구 : 디지털(Office Program) 디지털 정보를 관리하는 도구 : 디지털(아카이빙 시스템, 업무관리 시스템) 디지털 정보를 담고 있는 도구 : 디지털(서버/스토리지) 디지털 정보를 이용하는 도구 : 디지털(Web Browser, PDF Reader) 디지털아카이빙 시스템도 디지털입니다. 이 것도 보존하고 관리해야합니다. 디지털 아카이빙 시스템에 마지막은 존재하지 않습니다. 기술이 발달하면 다시 꺼내서 관리정보입력, 마이그레이션 등 과정을 거쳐야 합니다. 104
  • 112. 결론 및 제언 기존 정보자원 관리와 확연히 다른 업무를 요구하는가? 현재 디지털 정보, 웹 정보들이 아직까지 앉고 있는 많은 문제들을 그대로 앉고 있음 데이터 관리, 호환성유지, 검색 활용을 위한 MDR의 필요성(DC, MODS, PREMEIS, METS) 관리, 향후 활용을 위한 조직화(XML Schema, RDF/OWL) 105
  • 113. 결론 및 제언 우리 기관의 정보지만 혼자서는 절대 해결 못하는 문제들 106
  • 114. 참고자료 박진호. 2007. 국립디지털도서관 운영방안.『 전국도서관대회』, 2007년 10월 11일. [제주도 : 제주국제컨벤션센터] 박진호. 2007. 국립디지털도서관 장서개발정책(NDL CDP).『 제10회 디지털도서관 컨퍼런스』, 2007년 11월 29일.[서울 : 코엑스] 박진호. 2009. 디지털 생명주기 기반 정보자원처리. 『2009 추계 한국정보관리학회 학술발표회』, 2009년 11월 13일.[서울 : 이화여자대학교 ECC] 박진호. 2008. 디지털도서관의 정보자원 처리 방안. 『제11회디지털도서관 컨퍼런스』, 2008년 11월 5일.[서울 : 코엑스] 박진호. 디지털정보자원아카이빙. 2008, 2009년 국립중앙도서관 사서교육훈련과정 강의자료. http://www.dlib.org/dlib/january00/01hodge.html http://www.life.ac.uk/2/documentation.shtml http://www.slideshare.net/stephendale/information-management-life-cycle-presentation http://www.life.ac.uk/ http://www.slideshare.net/maheshpanchal1/splc http://www.flickr.com/photos/gauravonomics/3208349922/sizes/o/ http://www.flickr.com/photos/8897269@N08/541851097 http://www.flickr.com/photos/frankdouwes/4029186481/sizes/l/ 107