2. 목차
➊ 공공데이터란?
➋ 공공데이터 국가별 사례
➌ 공공데이터 활용사례
➍ 국내 공공데이터에 대한 평가
➎ 공공데이터의 품질 기준
➏ 더 나은 공공데이터를 위해
3. ‘데이터’의 정의
공공데이터란?1
DIKW Pyramid
Raw data,
관찰된 객관적 사실 그 자체
Processed data,
처리 또는 가공한 데이터
정보에 기반해 찾은 패턴 혹은 규칙
지식에 유연성(Flexible)을 더한 것
상황이나 맥락(Context)에 맞게 규칙을 적용하는 것
4. 공공데이터의 정의 (Wikipedia)
• 데이터베이스, 전자화된 파일 등 공공기관이 법령 등에서 정하는 목적을 위하여 생성
또는 취득하여 관리하고 있는 광(光) 또는 전자적 방식으로 처리된 자료 또는 정보
• 개별 공공기관이 일상적 업무수행의 결과물로 생성 또는 수집‧취득한 다양한
형태(텍스트, 수치, 이미지, 동영상, 오디오 등)의 모든 자료 또는 정보
• "기계 판독이 가능한 형태"로 "제공“
• "기계 판독이 가능한 형태"란 소프트웨어로 데이터의 개별 내용 또는 내부 구조를 확인하거나
수정, 변환, 추출 등 가공할 수 있는 상태
• "제공" 이란 공공기관이 이용자로 하여금 기계 판독이 가능한 형태의 공공데이터에 접근할 수
있게 하거나 이를 다양한 방식으로 전달하는 것
공공데이터란?1
5. OECD의 Open Government Data에 대한 정의
• Open Government Data
• Government Data: 공공기관에 의해 생산되거나 위임된
모든 데이터와 정보
• Open Data: 누구나 자유롭게 사용, 재사용 및 배포할 수
있는 데이터
• 왜 공공데이터가 중요한가?
• 열린 정부(Open Government)를 위한 하나의 중요한
구성요소(building block)
• 정부와 시민들 사이의 더 나은 관계를 위한 향상된 서비스의
제공, 투명성, 대중의 공적인 참여의 핵심 요소
공공데이터란?1
6. ‘오픈’의 정의 (Open Definition 2.1)
• 누구나 자유롭게 접근, 사용, 수정 및 공유할 수 있음을 의미
• 특성 (must satisfy)
• Open License or Status: 공개 도메인에 있거나 공개 라이선스를 따라야 함
• Access: 비용 부담 없이 반드시 완전한 형태로 인터넷을 통해 다운로드 받을 수 있어야 함
• Machine Readability: 컴퓨터로 쉽게 처리될 수 있고 개별 요소에 쉽게 접근 및 수정을 할 수
있는 형태로 제공되어야 함
• Open Format: 오픈 포맷으로 제공되어야 함
공공데이터란?1
7. 결국, 공공데이터란?
• 공공기관에 의해 생산된 혹은 수집된 것으로써,
• 공개 라이선스에 따라 누구나 자유롭고 쉽게 이용할 수 있으며,
• 기계가 읽고 처리할 수 있는 오픈 포맷 형태의 데이터
공공데이터란?1
24. BankLocal
• 기능
• 지역사회 발전을 위해 지역사회에 투자하는 은행을
연결
• 지도 서비스와 은행에 대한 보고서 정보 제공을 통해
은행 및 은행업무를 결정하는 필요한 지식을 제공
• 활용 데이터셋
• Federal Deposit Insurance Corporation
• Institutions & Locations, Financial Data, Branch
Office Deposits, Time Series Data
• Federal Financial Institutions Examination Council
• All Commercial Banks
• National Credit Union Administration (NCUA)
공공데이터 활용사례3
25. Bonnie
• 기능
• 리콜된 제품이나 다른 소비자에게 유해하다는
정보가 발견되었을 경우 경고 메시지 전송
• 활용 데이터셋
• General Services Administration
• Recalls API
공공데이터 활용사례3
26. City-Data
• 기능
• 미국의 모든 도시에 대한 상세한 정보 제공
• 범죄율, 기상패턴, 부동산 가격 및 거래, 고용, 종교,
기업 등 다양한 유형의 통합적인 도시 정보 제공
• 월 1400만 명의 사용자가 이용 중
• 활용 데이터셋
• American Community Survey
• Bureau of Labor Statistics
• National Weather Service
• US Census TIGER Database
• Federal Housing Finance Agency Mortgage Data
공공데이터 활용사례3
27. IP Neural Open-Data Visualisation and Analysis
• 기능
• 호주 IP 데이터베이스를 활용하여 특허, 상표 등에
대한 비즈니스 인텔리전스 검색 지원
• 시간, 위치, 주요 업체 및 산업분야의 지적 자산
활동을 탐색하고 분석을 수행할 수 있는 기능 제공
• 활용 데이터셋
• Intellectual Property Government Open Live
Data
공공데이터 활용사례3
28. 어뮤즈트래블
• 기능
• 장애인을 위한 여행정보 서비스 제공
• 장애인 각각의 특징을 고려한 여행 패키지 개발 및
판매
• 활용 데이터셋
• 전국 공중화장실표준데이터
• 장애인활동지원기관정보조회서비스
• 항공기 운항정보
• 전국장애인편의시설정보조회
• 국문 관광정보 서비스
공공데이터 활용사례3
29. OECD의 Government at a Glance 2017 평가기준
• 데이터 가용성 (Data Availability)
• 기본 정책과 데이터 가용성에 따른 개방의 범위
• 정부 데이터의 개방을 제한하는 정당한 근거
• 데이터 개방에 대한 이해관계자와의 협의
• 데이터 접근성 (Data Accessibility)
• 가격 및 라이선스
• 형식 및 메타데이터
• 데이터 품질 및 업데이트
• 공공데이터 재사용을 위한 지원 (Government support to the reuse of open government data)
• 사업
• 시민사회
• 공무원
국내 공공데이터에 대한 평가4
30. OECD의 Government at a Glance 2017 평가결과
국내 공공데이터에 대한 평가4
http://dx.doi.org/10.1
787/gov_glance-2017-
en
31. Open Data Barometer 평가 기준
국내 공공데이터에 대한 평가4
http://opendatabarometer.o
rg/doc/4thEdition/ODB-
4thEdition-Methodology.pdf
32. Open Data Barometer 2016 결과
국내 공공데이터에 대한 평가4
http://devodb.wpengine.
com/?_year=2016&indica
tor=ODB
33. Open Data Barometer 2016 결과
국내 공공데이터에 대한 평가4
http://devodb.wpengine.com/
4thedition/detail-
country/?_year=2016&indicato
r=ODB&detail=KOR
34. Open Data Barometer 2016 결과
국내 공공데이터에 대한 평가4
http://devod
b.wpengine.c
om/doc/4thE
dition/ODB-
4thEdition-
GlobalReport
.pdf
36. Global Open Data Index 2015 평가지표
국내 공공데이터에 대한 평가4
Question Weighting
Does the data exist? 5
Is data in digital form? 5
Publicly available? 5
Is the data available for free? 15
Is the data available online? 5
Is the data machine- readable? 15
Available in bulk? 10
Openly licensed? 30
Is the data provided on a timely and up to date basis? 10
37. Global Open Data Index 2015 평가
국내 공공데이터에 대한 평가4
http://2015.inde
x.okfn.org/place/
38. Global Open Data Index 2015 상세내용
국내 공공데이터에 대한 평가4
Place Dataset Score Is Open Exists Digital Public Online Free Machine Readable Bulk Open License Uptodate Format Date Available
kr weather 25 No Yes Yes No Yes Unsure No No No Yes None None
kr water 75 No Yes Yes Yes Yes Yes No Yes Yes No None None
kr statistics 70 No Yes Yes Yes Yes Yes Yes Yes No Yes Excel None
kr spending 10 No Yes Yes No No No No No No No None None
kr procurement 75 No Yes Yes Yes Yes Yes No No Yes Yes None None
kr postcodes 35 No Yes Yes No No No Yes No No Yes Shapefile None
kr map 35 No Yes Yes No No No Yes No No Yes Shapefile None
kr legislation 90 Yes Yes Yes Yes Yes Yes Yes No Yes Yes
XML, HTML,
HWP, DOC,
and PDF
None
39. 공공데이터를 위한 8가지 원칙
1. 완전성(Complete)
• 개인정보, 보안 혹은 권한과 관련된 정보를 제외하고 모든 공공데이터는 개방되어야 함
2. 원시 자료(Primary)
• 집계되거나 수정된 형식이 아닌 데이터 원천으로부터 수집된 데이터를 제공해야 함
3. 실시간성(Timely)
• 데이터의 가치를 보존하기 위해 빠르게 제공되어야 함
4. 접근 가능성(Accessible)
• 다양한 사용자가 다양한 목적으로 사용할 수 있도록 제공되어야 함
공공데이터의 품질 기준5
40. 공공데이터를 위한 8가지 원칙
5. 기계 가독성(Machine processible)
• 기계에 의해 자동화된 처리가 가능하도록 제공되어야 함
6. 비차별성(Non-discriminatory)
• 누구나 별도의 등록 과정 없이 데이터를 사용할 수 있어야 함
7. 비독점성(Non-proprietary)
• 비독점적인 데이터 형식을 사용하여 함
8. 라이선스 프리(License-free)
• 라이선스 및 법적 제한 등을 명확히 하고, 공공데이터에 대해 개방된 라이선스임을 명시해야 함
공공데이터의 품질 기준5
41. 공공데이터를 위한 8가지 원칙 + 추가 7가지 원칙
1. 온라인 및 무료(Online & Free)
• 데이터는 인터넷을 통해 무료로 제공되어야 함
2. 영구적(Permanent)
• 동일한 주소를 이용하여 영구적인 접근이 가능해야 함
3. 신뢰성(Trusted)
• 디지털 서명을 이용하여 데이터가 수정되지 않았음에 대한 신뢰성을 보장하여야 함
4. 개방을 전제로 함(A Presumption of Openness)
• 생산되는 모든 데이터는 개방을 전제로 하며, 이를 위한 법률 및 절차, 도구를 마련해야 함
공공데이터의 품질 기준5
42. 공공데이터를 위한 8가지 원칙 + 추가 7가지 원칙
5. 문서화(Documented)
• 데이터의 형식과 의미에 대해 문서 형태로 제공되어야 함
6. 안전성(Safe to Open)
• 실행 가능한 컨텐츠를 포함하지 않는 데이터 형식으로 보안 위험을 초래하지 않아야 함
7. 대중 의견에 따른 설계(Designed with Public Input)
• 대중의 의견을 받아 이를 적용하여 정보를 배포할 수 있어야 함
공공데이터의 품질 기준5
43. 개방 데이터: 중요 항목 평가
• 규정 준수 환경
공공데이터의 품질 기준5
마일스톤 상태 주기
개방 데이터를 위한 정책 구현
예정, 지연, 완료 주, 월, 분기
대중의 참여를 통한 혁신 촉진
시각화 플랫폼을 통한 데이터 이용 향상
공간 데이터에 대한 노력
입법 추진 보고서
44. 개방 데이터: 중요 항목 평가
• 데이터
공공데이터의 품질 기준5
측정 항목 목표 주기
데이터 셋 목록을 완성한 부서의 비율 100% 월, 분기
공개 계획을 완성한 부서의 비율 100% 월, 분기
목록화 된 데이터 셋 중 공개된 데이터 셋의 비율 시간에 따른 증가 주, 월
데이터 셋 분류에 따라 공개된 데이터 셋의 비율 공용 데이터의 100% 주, 월
호스팅 되고 있는 확보 가능한 데이터 셋의 비율 시간에 따른 증가 / 90% 주, 월
제 시간에 업데이트되는 데이터 셋의 비율 100% 일
게시 지연 없이 확보 가능한 데이터 셋의 비율 확보 가능한 데이터 셋의 100% 일
게시 지연이 있는 데이터 셋의 평균 지연 일 수 30 미만 주, 월
필요한 메타데이터를 가진 데이터 셋의 비율 100% 주, 월
45. 개방 데이터: 중요 항목 평가
• 데이터의 사용 (1)
공공데이터의 품질 기준5
측정 항목 목표 수집 주기 내부/외부
행위 / 상황의 내부적 변화
개방 데이터가 분석 작업을 어떻게 변화 시켰는지에 대한 응답:
• 더 쉽고,
• 더 빠르고,
• 더 효율적으로
시간에 따른 증가 년 내부
데이터 포털을 사용하여 내부 및 다른 부서의 데이터에 접근한다는 응답자의 비율 시간에 따른 증가 년 내부
다음과 같은 것들을 중간 또는 주요 장애물임에 대한 응답:
• 데이터 셋에 대한 지식 및 관심(부서 간 및 부서내)
• 정보 시스템으로부터의 데이터 획득(부서 간 및 부서내)
• 연락할 사람을 누구인지 알지 못함
• 표준 프로세스가 없음
• 디지털 형식으로 사용할 수 없는 데이터
시간에 따른 감소 년 내부
다음과 같은 것에 대해 도움이 되거나 매우 도움이 될 것이라는 응답:
• 다른 부서에서 생성하거나 수집한 데이터에 대한 접근성 향상
시간에 따른 증가 년 내부
46. 개방 데이터: 중요 항목 평가
• 데이터의 사용 (2)
공공데이터의 품질 기준5
측정 항목 목표 수집 주기 내부/외부
개방 데이터를 활용한 제품
개방 데이터(유형별)를 활용한 제품의 수 시간에 따른 증가 계속 모두
개방 데이터가 제품 개발에 필수적이었거나 중요하다고 응답한 응답자 >50% 계속 모두
개방 데이터의 사용 지표
새로운 뷰(view)의 생성 시간에 따른 증가 최소 매일 모두
계정을 반환하는 사용자의 비율 유지 최소 매일 모두
데이터 셋 다운로드 수 시간에 따른 증가 최소 매일 모두
데이터 포털 계정의 수 시간에 따른 증가 최소 매일 모두
API 히트 수 시간에 따른 증가 최소 매일 모두
API 토큰을 보유한 사용자의 수 시간에 따른 증가 최소 매일 모두
47. 개방 데이터: 중요 항목 평가
• 영향 (1)
공공데이터의 품질 기준5
측정 항목 목표 주기
시민 참여
주, 월, 분기
개방 데이터를 제안하는 응답의 수 시간에 따른 증가
소셜 미디어에서 개방 데이터의 존재 시간에 따른 증가
개방 데이터(유형별)로 만들어진 프로젝트의 수 시간에 따른 증가
개방 데이터 포털의 데이터와 관련된 커뮤니티 이벤트의 참가자 수
(예를 들어, 해커톤, 전략 계획 수립, 데이터 개방 행사 등)
시간에 따른 증가
48. 개방 데이터: 중요 항목 평가
• 영향 (2)
공공데이터의 품질 기준5
측정 항목 목표 주기
시 정부의 효과
주, 월, 분기
데이터 요청의 수 시간에 따른 감소
FOIA 요청의 수 시간에 따른 감소
도시 서비스에 대한 만족을 나타내는 응답자 시간에 따른 증가
내부 또는 부서 내 데이터 요청의 수 시간에 따른 감소
데이터 요청에 응답하는 직원의 시간 시간에 따른 감소
경제 발전
개방 데이터가 제품을 개발하는데 있어 필수적이거나 중요한 것이라 응답한 응답자 시간에 따른 증가
공공/민간 부문에서 개방 데이터가 창출하는 경제적 가치 시간에 따른 증가
49. 5 ★ 오픈 데이터
공공데이터의 품질 기준5
★ 데이터를 웹 상에 오픈 라이선스로 공개
(형식에 상관 없이)
★★ 구조화된 데이터 형태로 제공
(예를 들어, 표를 스캔한 이미지 대신 엑셀 사용)
★★★ 비독점적 오픈 포맷으로 제공
(예를 들어, 엑셀 대신 CSV 사용)
★★★★ 사람들이 데이터를 가리킬 수 있도록 개체를 나타내기
위해 URI 사용
★★★★★ 컨텍스트를 제공하기 위해 다른 데이터와 연결
50. 개방을 전제한 데이터 프로세스
• Barometer 4th 통계에 따르면, 7%의 데이터 셋만이 개방되어 있음
• 공공기관에 의해 생성되고 수집 및 보유한 모든 공공데이터는 개방되어야 함
더 나은 공공데이터를 위해6
52. 개방 프로세스의 통합
• 공공데이터에 대한 개방은 추가적인 프로세스가 아닌 시스템에 통합되어야 하는 하나의
데이터 프로세스임
• 중앙집중화된 프로세스를 벗어나 수동 업로드의 의존도를 낮춤
더 나은 공공데이터를 위해6
53. 메타데이터에 대한 표준 마련
• 공공데이터 포털의 역할은 메타데이터 수집 및 이를 통한 데이터 발견의 기회 제공
• Data Catalog Vocabulary (DCAT)
• 2014년 W3C 권고안(Recommendation)
• 웹에 존재하는 데이터 목록 간의 상호운용성을 높이기 위해 설계된 RDF 어휘
• Project Open Data Metadata Schema v1.1
• DCAT을 기반으로 한 미국 정부의 공공데이터에 대한 메타데이터 표준
• JSON 기반의 공통 어휘를 사용함으로써 데이터 목록에 대한 표준 마련
더 나은 공공데이터를 위해6
54. 데이터에 대한 공통 표현 모델 마련
• 서로 다른 용어 체계로 발생할 수 있는 데이터의 의미적 모호성을 해소가 필요함
• 이를 위해, 서로 간의 이질적 정보를 교환할 수 있는 공통의 어휘 필요
더 나은 공공데이터를 위해6
• NIEM (National
Information Exchange
Model)
• 미국의 다양한 공공 및 민간
조직에서 효율적으로
정보를 교환하기 위해
설계된 공통된 어휘
55. 기계 가독형 파일 형식의 활용
• 기계가 읽고 처리할 수 있는 형식을 이용하여 공공데이터의 활용성 향상
• 국내 공공데이터 포털 통계
더 나은 공공데이터를 위해6
파일 형식 건수 %
CSV 19230 81.0
XLS 1801 7.6
HWP 1416 6.0
XLSX 847 3.6
XML 190 0.8
TXT 87 0.4
JPG 67 0.3
ZIP 47 0.2
SHP 32 0.1
DOCX 25 0.1
81.9
18.1
기계 가독형 데이터 셋
비 가독형 데이터 셋
56. 데이터 셋의 양보다 질(quality)에 집중
• 사용자가 필요로 하는 데이터를 보다 쉽게 활용할 수 있도록 제공
더 나은 공공데이터를 위해6
웹 사이트 게시 정보
다운로드 받은 공공데이터
57. 시민 참여를 통한 공공데이터 개선
• 사용자가 데이터를 개선하고 이를 다시 제공하여 공공데이터가 선순환 될 수 있는
구조 마련
• 공공데이터의 질적 향상 및 시민 참여의 활성화
더 나은 공공데이터를 위해6
다운로드
개선
업로드
사용자
확산
다운로드
개선
사용자
58. 참고문헌
• 5 Star Open Data, http://5stardata.info/ko/
• DIKW 피라미드(데이터・정보・지식・지혜), https://her7845.blog.me/220866459917
• European Data Portal e-learning programme, https://www.europeandataportal.eu/elearning/en/#/id/co-01
• Nick Hadjigeorge (2016), “Open Data: Measuring What Matters”, https://govex.jhu.edu/wiki/open-data-measuring-what-matters/
• ODB Methodology, http://opendatabarometer.org/doc/4thEdition/ODB-4thEdition-Methodology.pdf
• OECD (2017), Government at a Glance 2017, OECD Publishing, Paris http://dx.doi.org/10.1787/gov_glance-2017-en
• OECD Survey on Open Government Data 3.0, http://www.oecd.org/gov/2016-OECD-Survey-on-Open-Government-Data-3.0.pdf
• Open Definition, http://opendefinition.org/od/2.1/ko/
• Project Open Data Metadata Schema v1.1, https://project-open-data.cio.gov/v1.1/schema/
• The Annotated 8 Principles of Open Government Data, https://opengovdata.org/
• The Global Open Data Index, https://index.okfn.org/
• The Open Data Barometer, http://devodb.wpengine.com/?_year=2016&indicator=ODB
• The Open Data Barometer Global Report Fourth Edition, http://devodb.wpengine.com/doc/4thEdition/ODB-4thEdition-GlobalReport.pdf
• Ubaldi, B. (2013), “Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives”, OECD Working Papers on Public Governance, No. 22,
OECD Publishing, Paris. http://dx.doi.org/10.1787/5k46bj4f03s7-en
부록A
59. Myungjin Lee
LiST, Linked Data and Semantic Web Technology
Ph.D. / CTO
e-Mail : mjlee@LiSTInc.kr
Twitter : http://twitter.com/MyungjinLee
Facebook : http://www.facebook.com/mjinlee
SlideShare : http://www.slideshare.net/onlyjiny/