CKAT (Connected Knowledge and Tools) #1 - Seoul City
1. Connected Knowledge and Tools #1 – Seoul City
오픈 데이터에서 링크드 데이터로 진화
Open Knowledge South Korea, 2015
2. 목차
1. Connected Knowledge and Tools #1 - Seoul City
2. Linked Data 서비스 플랫폼
- 시스템 아키텍처
- 시각화 도구
3. Linked Data 모델링
- 행정구역 모델링 사례
- 참고 문헌
2
3. 1. Connected Knowledge and Tools #1 - Seoul City
오픈 데이터에서 링크드 데이터로 진화
( https://github.com/Open-Knowledge-Korea/ )
4. 열린 데이터의 품질 및 접근성의 향상을 통한 활용성 증가
필요성
- 서로 다른 데이터셋
사이의 관계 정의 어려
움
- 서로 다른 유형의 데이터
를
연결 및 통합하기 어려
움
- 상세한 정보보다 단순한
메타데이터 리스트를 제공하고
있음
- 이종의 데이터셋에 존재하는
동일한 값을 구분하기 어려움
- 한글 데이터는 한국어를
이해하는 사용자로 접근이 제
한
- 도시 중심의 오픈 데이터 공
개
통한 협력 가능성 제한
332211 단편적인 데이터 연결되지 않은 데이터 접근이 제한된 데이터
4
5. 데이터 사이의 의미적 연결을 통한 Data Enrichment 실현
목표
개별 데이터셋과 외부 데이터 연결을 통한 데이터 표현력 향상11
* 서울시 열린 데이터 사이의 연결 관계 구축을 통한 데이터 활용성 증가
* Linked Data 와 연결을 통한 데이터 항목의 상세 정보 및 관련 정보 확보
* 콘텐트 생산 및 유지 비용 감소
웹 표준 기반 열린 데이터셋의 의미적 연결 관계 구축22
* 서로 다른 형식의 데이터셋을 웹 표준에 기반하여 표현 및 통합할 수 있음
* 새로운 데이터셋을 연계하기 위한 수정 비용 최소화 및 확장 용이성 확보
* 타기관 데이터셋과 연계 및 통합을 위한 데이터모델 확보
데이터 영문 변환 및 Linked Data 적용을 통한 접근성 확대33
* 비한국어 사용자의 데이터 접근성 향상을 통한 데이터 활용 사례의 다변화
* 세계 도시와 데이터 공개 전략 및 사례 공유를 할 수 있는 기반 확보
* 서울 열린 데이터와 외부 오픈 데이터의 연계를 통한 데이터 레퍼런스 역할 확보
5
6. 2. Linked Data 서비스 플랫폼
오픈 데이터에서 링크드 데이터로 진화
( https://github.com/Open-Knowledge-Korea/ckat-seoul-web )
7. 데이터 분석 및 변환
Linked Data
시스템 구현
구축 방법 및 범위
데이터 모델링 데이터 상세화
열린 데이터 광장의 데이터를 RDF (Linked Data) 로 변환
11 22 33 44
- 문화재 데이터
- 문화시설 데이터
- 지하철 데이터
- 행정구역 데이터
- Excel to RDB
- 공통 항목 추출
- RDF 어휘 검토 및
공통 어휘 추출
- 온톨로지 모델링
- 온톨로지 명세서 개
발
- Named Entity URI
설계 규칙 명세서
개발
- Linked Data 설계
- SameAs 관계 도출
* 동일한 관계 표현
- seeAlso 관계 도출
* 추가 정보 표현
- 데이터 연결
* 내부 데이터 간
연계
* 외부 데이터 연계
- RDF 데이터 유효성 검
사
- RDF 파일 생성
- SPARQL Endpoint 구현
- Visualization 구현
수행 기간 : 1 주 수행 기간 : 3 주수행 기간 : 3 주 수행 기간 : 3 주
총 10 주총 10 주
7
10. Seoul City 프로젝트 결과
https://github.com/Open-Knowledge-Korea/ckat-seoul-web
산출물
10
- 다양한 옵션에 따라 데이터
를
탐색할 수 있는 도구
- 데이터 사이의 의미적 관계
를
시각적으로 보여주는 도구
- 시범사업에서 구축한
데이터를 질의 / 검색하는
인터페이스
332211 시맨틱 관계 탐색 패싯 네비게이션 시맨틱 질의 / 검색
11. 시각화 도구 1
서비스
11
1) 시맨틱 관계 탐색 : http://lod.datahub.kr/projects/seoul/relFinder/ad/
13. 13
3) 시맨틱 질의 검색 : http://lod.datahub.kr/projects/seoul/endpoint/ad
시각화 도구 3
서비스
14. 3. Linked Data 모델링
오픈 데이터에서 링크드 데이터로 진화
( https://github.com/Open-Knowledge-Korea/ckat-ontology/ )
15. 구축절차
모델링
데이터셋 선정
15
11
* 서울시 열린데이터 광장에서 모델링 대상 데이터셋 선정 ( 문화시설 )
* 문화재청 , 행정구역 모델링 추가
데이터셋 항목 검토 및 매핑22
* 데이터셋의 개별 항목과 온톨로지 ( 클래스 , 속성 ) 의 매핑 관계 검토
* 외부 어휘의 재사용 여부 및 범위 결정
* 어휘와 데이터셋 항목 매핑
URI 체계 결정 및 온톨로지 설계 완료33
* 클래스 , 속성 , 인스턴스 URI 체계 결정
* 온톨로지 모델링
16. 구축 범위
모델링
16
- 서울시 열린데이터광장 데이터 중 시범과제에 적합한 데이터셋 선정 ( 문화시설
- 문화재청 데이터와 행정구역 데이터 통합을 위한 모델링 실시
문화재
( 문화재
청 )
문화재
( 문화재
청 )
문화시설
( 열린데이
터광장 )
문화시설
( 열린데이
터광장 )
행정구역행정구역
17. 모델링 주안점 ( 방향 )
모델링
17
표현력 보다는 기존 데이터의 연결을 통한 Linked Data
구성
기존 Vocabulary 의 재사용을 통한 모델링
- dc, dcterm, foaf, sioc, schem.org 등
11
22
33
44
외부 데이터셋과의 연결성 강화 (dbpedia)
- 구축된 데이터의 silo 경계
영어권에서도 활용 가능한 영문 레이블 동시 제공
18. 대한민국 행정구역을 의미적으로 표현하기 위한 정의
행정구역은 국가마다 다름
- 특별시 , 광역시 , 도 , 시 , 군 , 구 , 읍 , 면 , 동 , 리로 구분
- 1 개의 특별시 , 6 개의 광역시 , 8 개의 도 , 1 개의 특별자치시 , 1 개의 특별자치
도로 구성
18
모델링
행정구역 온톨로지 모델링
https://github.com/Open-Knowledge-Korea/ckat-knowledge-model
23. URI 모델링 가이드라인
참고문헌
23
1. Cool URIs for the Semantic Web, http://www.w3.org/TR/cooluris/
2. Creating URIs, http://data.gov.uk/resources/uris
3. Designing URI Sets for Location, http://location.defra.gov.uk/
wp-content/uploads/2010/04/Designing_URI_Sets_for_Location-
Ver0.5.pdf
4. 223 Best Practices URI Construction,
www.w3.org/2011/gld/wiki/223_Best_Practices_URI_Construction
5. Cool URIs don’t change, http://www.w3.org/Provider/Style/URI
6. URI Design Principles: Creating Unique URIs for Government Linked Data,
http://logd.tw.rpi.edu/instance-hub-uri-design
24. 24
For more information
contact
Open Knowledge Korea
via
- http://okfn.kr
-
https://www.facebook.com/
groups/OKFNKorea/
- okfn.korea@gmail.com
Or see more activities at:
http://lod.datahub.kr