SlideShare une entreprise Scribd logo
1  sur  50
데이터 시각화의 스위스칼,
태블로(Tableau) 활용하기
언론정보학과 김예경
언론정보학과 김선지
문화인류학과 이지언
태블로는
-1999년 미 스탠포드 컴퓨터 과학 연
구실의 교내 벤처회사에서 개발한 데
이터 베이스 관리 기술 을 기반으로
만든 소프트 웨어
-별도의 학습 없이도 누구나 효과적
이고 다양한 깊이 있는 시각화 분석이
가능하다.
-데이터 항목을 마우스로 끌어다가
중앙 창에 던져놓아 표나 그래프를 만
드는 Drag and Drop 방식
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.1 엑셀파일 태블로형 데이터로 변환하기
태블로 홈페이지에서 tableau add-in 설치
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.2 Tableau Public을 설치
- 엑셀 파일 열기
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
- 파일 불러오기
- Columns(시.도)
와 Rows(실업률)
을 드래그 한다
- 선반
- 청색(분리형)
- 초록색(연속형,
특정값)
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
- Show Me 사용하기
Tooltip 활
용
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.3 타블로의 데이터 분류 방식
청색커버는 ‘분리형’ , 녹색커버는 ‘연속형’
분리형(Discrete):
각 데이터를 분절된 형태로 처리. 막대 그래프 그릴 때 ‘연도’는 분리형으로,
‘실업률’은 연속형으로 설정
연속형(Continuos):
각 데이터 사이에 자릿수, 소수점 상관없이 또 다른 측정값이 존재할 수 있다고
가정. 선그래프 그릴 때는 ‘실업률’과 ‘연도’ 모두 연속형으로 설정
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.4 그래프 정렬하기
이거
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
- 그래프 필터링하기
Y축 누르면 오름차 내림차 순 정렬
필터로 연령대를 드래그하면 특정
값만 도출
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.5 버블 차트 만들기 (연령대별 실업률)
컬러와 라벨에 시도를 넣으면 지역별 실업률 버블차트
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
- 지역별 실업률 버블 차트
아웃라이어:
통계학적으로 평균에서 크게 벗어난 수치, 정상적인 분포를 벗어난 데이터를
말한다.
이상치 라고도 한다.
아웃라이어 파악하는 방법:
여러 가지가 있다. 대표적으로는 평균을 중심으로 표준편차의 2배나 3배 정도
의 범위를
벗어난 값을 아웃라이어로 잡는 방법이다. 혹은 사분위수를 활용할 수도 있다.
사분 위는 자료를 크기 순으로 배열하여 4등분한 값을 말한다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.6 Box Plot으로 데이터 분포 파악하기
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
지역별 연령대별 실업률 평균치 중에서 특히 튀는 데이터 골라내기
Ctrl을 누른 상태에서 ‘시도’,’연도’,’연령대’,’실업률’을 클
릭한 뒤, Show me 박스에서 Whisker Plot을 선택해 차트
를 그린다. 실업률은 AVG로 바꾼다
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
아웃라이어가 한 눈에 들어온다.
상자를 넘어 양측 경계선을 넘은 점들이
바로 아웃라이어이다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.7 피벗 테이블에 날개 달기 : 하이라이트 테이블
스프레드 시트의 각 셀을 데이터에 연동해 색상 농담으로
각기 다르게 표시한 ‘하이라이트 테이블’도 데이터 분포를
한 눈에 파악하는 데 매우 효과적이다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
‘시도’를 Columns 선반에, ‘연령대’와 ‘연도’를 각각 Rows 선반에 넣고,
색상마크와 라벨(텍스트) 마크(책이 잘못됨)에 각각 ‘실업률’ 데이터를 집
어넣은 뒤 Marks 유형을 Automatic에서 Square로 변경하면 된다. 연도를
디멘드에 넣고 표에 집어넣어야함(책이 잘못됨)
실업률을 컬러에 넣고
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
Ctrl키를 누른 상태에서 4가지 데이터 항목을 다 선택하고 Show Me 박스의
오른편 맨 위의 하이라이트 테이블 유형을 클릭하면 위와 같이 바로 시각화가 된다
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
실업률을 끌어다가 라벨 마크에 넣으면 이렇게 라벨이 붙어진다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
하이라이트 테이블은 피벗 테이블을 좀 더 이해하기 쉽도록 추가로 색상을 입힌
것이다.
색상농담의 변화가 급격한 부분과 짙은 색상이 뭉쳐 나타난 부분은 어디인지 살
펴보자.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.8 관심 데이터 표시하기: 피벗 테이블 Spotlighting 기법
한발 더 나아가 일정 기준 이상의 데이터만 골라 차별화된 색상으로 표시할 수 있는 방
법이다.
실업률을 오른쪽 클릭하여 Create Calculated Field 메뉴에서
이와 같이 조건식을 입력한다.
공식 / 계산이 유효하다
컬럼 시도 로우 연령대 연도 모두 파란색
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
생성된 ‘실업률 스폿라이트’ 필드를 색상 마크에 집어넣고,
Columns엔 ‘시도’, Rows에는 ‘연령대’와 ‘연도’를 이동시킨
상태에서 표를 만든다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
또 필터로 연령대를 ‘15-29세’만 걸러낸다.
그 후 원하는 대로 연도 또한 필터링 할 수 있다.
그러면 위와 같이 특정 범위 데이터가 붉은색으로 스폿라이팅된다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.9 셀 색상+크기로 데이터 파악하기: 히트맵 작성
하이라이트 테이블을 변형해 각 셀의 색상뿐 아니라 크기로도 데이터 분포를
살펴볼 수 있도록 한 것이 히트맵이다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
TIP: 태블로의 필터와 마크 작업창의 활용법
마크의 각 상자에 데이터 항복을 끌어다 넣으면 그래프나 표는 새롭게 변신한다.
Color는 특정 기호의 위치나 크기에 추가해 색상으로 표현하는 방법이다.
Size 역시 X, Y축의 좌푯값이 아닌 특정 기호의 크기로서 데이터를 표시한다.
Text는 그래프나 표에 데이터값을 표시하는 기능이다.
Page 상자는 필터와 유사하나, X, Y축 상의 데이터 표시에 변화를 주지 않는 필터
기능이라고 생각하면 된다. 이 때문에 각 연도별로 그래프의 변화 추이를 동적으로
시각화하는 데 편리하게 이용할 수 있다.
각 기능 파악 / 툴팁 기능
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.10 데이터 쪼개고 묶어 새롭게 배열하기
태블로는 시각화뿐 아니라 다양한 데이터 편집과 분석이 가능한 것도 강점이다.
대표적으로 Field calculator 기능과 그룹과 세트, 빈 생성 기능을 꼽을 수 있다.
데이트를 일정 범주로 다시 나누고 묶어 배열해 새로운 시각으로 조명해 보는 기
이다. 편집 기능과 논리계산식으로 데이터를 가공하는 방법을 살펴보자.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
아래와 같이 그래프 상에서 지역별
실업률 평균 데이터에서 축상의
서울과 경기, 인천을 클릭해 클립
모양의 기호를 누르면
그룹이 만들어진다.
여기서 수도권을
시도 / 실업률
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
마우스 우클릭한 뒤
Edit Alias 기능을 선택하여
이름을 ‘수도권’으로 바꿔준다.
컬럼에 시도(그룹) 되어있는 것
을 한번더 옮겨줘야 이런 모양
이 나옴
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
수도권이라는 새 그룹을 생성한 데 이어 호남, 영남 등 또 다른 그룹도 같은 방식으로 만
수 있다.
그 밖에는 논리식으로 그룹을 만드는 방법이 있는데 이 때는 Calculated Field를 이용한
위와 같이 IF 조건식을 입력하는 방식이다.
서울과 경기도와 인천은 수도권으로 설정하고, 나머지는 ‘시도’ 필드 그대로 두라
의미이다. IF 문에서 AND를 사용하지 않고 OR을 연산자로 쓴 점을 기억하자.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
5.11 특정 집단과 다른 집단 비교하기
• 세트(set) 생성하는 방법: 왼편 dimension
창의 ‘시도’ 항목에서 create set 선택
• ‘수도권’ set가 만들어진다
• 컬럼 수도권 로우 실업률
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• Columns 선반과 color 마크상자에 ‘수도권’ set를 넣는다.
• Edit Alias 메뉴로 IN을 ‘수도권’ OUT은 ‘다른지역’ 으로 바꾼다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 연도를 Columns 선반으로 이동 시키면 수도권과 다른 지역의 연도별 실업률 그래
프가 나온다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
12. 태블로에서 지도 시각화 하기
• 태블로에서 한글 주소는 거의 인식하지 못
한다.
• Create Calculated Field 메뉴에서 변환
하면 된다.
• 인천은 한글로 인식하지 못하므로
Incheon 으로 바꿔야 한다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• Geographic Role 메뉴로 들어가 ‘시도’ 항목을 위치 데이터로 인식시킨다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• ‘실업률’ 데이터를 각각 Color와 Size
마크에 넣는다.
• Show me에서 지도 항목을 선택하면
각 광역시도의 위치가 시각화 된다.
• 점 지도 (Point Map) 아이콘 선택
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 광역시도별 실업률 지도 시각화
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• Show me의 두 번째 지도 아이콘을 선택하면 각 광역시
도의 실업률에 연동해 영역을 색칠한 지도가 그려질 것
이다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• Show Quick Filter로 필터 조정기를 생성한 뒤, 필터 조정기에서 메뉴
를 꺼내 single value slider를 선택한다.
• 슬라이더를 움직이면 각 연도별로 색상주제도의 색상이 변하며 시기별,
지역별, 실업률의 추이를 볼 수 있다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
13. 2개 이상의 데이터 ‘가로’ 결합하기
• 실업률 데이터를 불러온 상태에서, 상단 메뉴의 Data → ‘지역별 연령별 실업
률’ → Edit Data Source로 가서 결합시킨다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 실업률, 자살률 데이터 1차 자동 결합
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 앞의 창에서 보면 ‘연도’는 결합됐지만, ‘시도’와 ‘연령대’는 잘못 붙어있다.
• 두 데이터 사이의 교집합 표시 기호 클릭한다.
• 그림의 중간의 두 원을 클릭하면 된다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• Inner Join으로 표시된 상태에서 ‘연도’만 임시로 결합 되어있으므로 ‘Add new
join clause’를 눌러 ‘시도’와 ‘연령대’도 결합기준에 추가하면 된다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 여기서는 자살률과 실업률을 블렌
딩 메뉴를 활용해 합친다.
• Data → Connect to Data로 가서
불러온다.
• 왼편 위쪽에 자살률 데이터가 새로
표시될 것이다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• ‘시도’, ‘연도’, ‘연령대’ 3가지가 모
두 Dimensions창에 있어야 한다.
• 자동 설정이 되어 있지 않다면
Custom 메뉴로 들어가 수동으로 공
통 필드를 지정하면 된다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• ‘실업률’과 ‘자살률’을 각기 Row에 옮기고, ‘연도’는 Columns에 넣는
• 실업률, 자살률 데이터 차트 나란히 그리기
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 두 데이터 간의 상관 관계를 파
악하기 위해 산포도(Scatter
Plot)를 그려보자.
• Show Me 상자에서 하단 두 번
째 왼편 아이콘 클릭. (파란색
테두리가 있는 아이콘)
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 자살률, 실업률 산포도 (상관 관계 불명확)
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 이번에는 자살률은 색상농담으로, 실
업률은 크기로 표시한 Tree Map을 그
려보자.
• 그 다음으로는 Heatmap을 그려보자.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 실업률, 자살률 트리맵 시각화
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
• 자살률, 실업률 트리맵
• 트리맵이나 히트맵은 일반인들에게는 다소 생소하지만, 데이터의 패턴
을 직관적으로 파악하고 취재의 단서를 얻는데 유용하다.
5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
감사합니다.

Contenu connexe

Plus de Hyochan PARK

페이스북 댓글을 통해 살펴본 대구경북촛불 집회
페이스북 댓글을 통해 살펴본 대구경북촛불 집회페이스북 댓글을 통해 살펴본 대구경북촛불 집회
페이스북 댓글을 통해 살펴본 대구경북촛불 집회Hyochan PARK
 
Youtube api key 받는 법
Youtube api key 받는 법Youtube api key 받는 법
Youtube api key 받는 법Hyochan PARK
 
공공데이터 찾기와 태블로형 데이터 만들기
공공데이터 찾기와 태블로형 데이터 만들기공공데이터 찾기와 태블로형 데이터 만들기
공공데이터 찾기와 태블로형 데이터 만들기Hyochan PARK
 
UCINET과 NodeXL 실습 - 21110554 박효찬
UCINET과 NodeXL 실습 - 21110554 박효찬UCINET과 NodeXL 실습 - 21110554 박효찬
UCINET과 NodeXL 실습 - 21110554 박효찬Hyochan PARK
 
로드킬 관련 인포그래픽스 2차 - 21110554 박효찬
로드킬 관련 인포그래픽스 2차 - 21110554 박효찬로드킬 관련 인포그래픽스 2차 - 21110554 박효찬
로드킬 관련 인포그래픽스 2차 - 21110554 박효찬Hyochan PARK
 
동물과 관련한 인포그래픽스 21110554 박효찬
동물과 관련한 인포그래픽스 21110554 박효찬동물과 관련한 인포그래픽스 21110554 박효찬
동물과 관련한 인포그래픽스 21110554 박효찬Hyochan PARK
 
7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기
7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기
7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기Hyochan PARK
 
6장 공간패턴을 읽으면 세상이 보인다
6장 공간패턴을 읽으면 세상이 보인다6장 공간패턴을 읽으면 세상이 보인다
6장 공간패턴을 읽으면 세상이 보인다Hyochan PARK
 
5장 tableau 를 활용하여 데이터 시각화하기 첫번째
5장 tableau 를 활용하여 데이터 시각화하기 첫번째5장 tableau 를 활용하여 데이터 시각화하기 첫번째
5장 tableau 를 활용하여 데이터 시각화하기 첫번째Hyochan PARK
 
4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기
4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기
4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기Hyochan PARK
 
3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지Hyochan PARK
 
2장 데이터 저널리즘의 탄생과 현주소
2장 데이터 저널리즘의 탄생과 현주소2장 데이터 저널리즘의 탄생과 현주소
2장 데이터 저널리즘의 탄생과 현주소Hyochan PARK
 
1장 기자데이터와만나다
1장 기자데이터와만나다1장 기자데이터와만나다
1장 기자데이터와만나다Hyochan PARK
 

Plus de Hyochan PARK (13)

페이스북 댓글을 통해 살펴본 대구경북촛불 집회
페이스북 댓글을 통해 살펴본 대구경북촛불 집회페이스북 댓글을 통해 살펴본 대구경북촛불 집회
페이스북 댓글을 통해 살펴본 대구경북촛불 집회
 
Youtube api key 받는 법
Youtube api key 받는 법Youtube api key 받는 법
Youtube api key 받는 법
 
공공데이터 찾기와 태블로형 데이터 만들기
공공데이터 찾기와 태블로형 데이터 만들기공공데이터 찾기와 태블로형 데이터 만들기
공공데이터 찾기와 태블로형 데이터 만들기
 
UCINET과 NodeXL 실습 - 21110554 박효찬
UCINET과 NodeXL 실습 - 21110554 박효찬UCINET과 NodeXL 실습 - 21110554 박효찬
UCINET과 NodeXL 실습 - 21110554 박효찬
 
로드킬 관련 인포그래픽스 2차 - 21110554 박효찬
로드킬 관련 인포그래픽스 2차 - 21110554 박효찬로드킬 관련 인포그래픽스 2차 - 21110554 박효찬
로드킬 관련 인포그래픽스 2차 - 21110554 박효찬
 
동물과 관련한 인포그래픽스 21110554 박효찬
동물과 관련한 인포그래픽스 21110554 박효찬동물과 관련한 인포그래픽스 21110554 박효찬
동물과 관련한 인포그래픽스 21110554 박효찬
 
7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기
7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기
7장 네트워크로 세상을 읽다 : 사회 관계망 분석 입문하기
 
6장 공간패턴을 읽으면 세상이 보인다
6장 공간패턴을 읽으면 세상이 보인다6장 공간패턴을 읽으면 세상이 보인다
6장 공간패턴을 읽으면 세상이 보인다
 
5장 tableau 를 활용하여 데이터 시각화하기 첫번째
5장 tableau 를 활용하여 데이터 시각화하기 첫번째5장 tableau 를 활용하여 데이터 시각화하기 첫번째
5장 tableau 를 활용하여 데이터 시각화하기 첫번째
 
4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기
4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기
4장 구글 퓨전테이블 생애 첫 데이터 지도 만들기
 
3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지3장 데이터 수집, 정제에서 분석까지
3장 데이터 수집, 정제에서 분석까지
 
2장 데이터 저널리즘의 탄생과 현주소
2장 데이터 저널리즘의 탄생과 현주소2장 데이터 저널리즘의 탄생과 현주소
2장 데이터 저널리즘의 탄생과 현주소
 
1장 기자데이터와만나다
1장 기자데이터와만나다1장 기자데이터와만나다
1장 기자데이터와만나다
 

5장 tableau 를 활용하여 데이터 시각화하기 두번째

  • 1. 데이터 시각화의 스위스칼, 태블로(Tableau) 활용하기 언론정보학과 김예경 언론정보학과 김선지 문화인류학과 이지언
  • 2. 태블로는 -1999년 미 스탠포드 컴퓨터 과학 연 구실의 교내 벤처회사에서 개발한 데 이터 베이스 관리 기술 을 기반으로 만든 소프트 웨어 -별도의 학습 없이도 누구나 효과적 이고 다양한 깊이 있는 시각화 분석이 가능하다. -데이터 항목을 마우스로 끌어다가 중앙 창에 던져놓아 표나 그래프를 만 드는 Drag and Drop 방식 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하
  • 3. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.1 엑셀파일 태블로형 데이터로 변환하기 태블로 홈페이지에서 tableau add-in 설치
  • 4. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.2 Tableau Public을 설치 - 엑셀 파일 열기
  • 5. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 - 파일 불러오기 - Columns(시.도) 와 Rows(실업률) 을 드래그 한다 - 선반 - 청색(분리형) - 초록색(연속형, 특정값)
  • 6. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 - Show Me 사용하기 Tooltip 활 용
  • 7. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.3 타블로의 데이터 분류 방식 청색커버는 ‘분리형’ , 녹색커버는 ‘연속형’ 분리형(Discrete): 각 데이터를 분절된 형태로 처리. 막대 그래프 그릴 때 ‘연도’는 분리형으로, ‘실업률’은 연속형으로 설정 연속형(Continuos): 각 데이터 사이에 자릿수, 소수점 상관없이 또 다른 측정값이 존재할 수 있다고 가정. 선그래프 그릴 때는 ‘실업률’과 ‘연도’ 모두 연속형으로 설정
  • 8. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.4 그래프 정렬하기 이거
  • 9. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 - 그래프 필터링하기 Y축 누르면 오름차 내림차 순 정렬 필터로 연령대를 드래그하면 특정 값만 도출
  • 10. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.5 버블 차트 만들기 (연령대별 실업률) 컬러와 라벨에 시도를 넣으면 지역별 실업률 버블차트
  • 11. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 - 지역별 실업률 버블 차트
  • 12. 아웃라이어: 통계학적으로 평균에서 크게 벗어난 수치, 정상적인 분포를 벗어난 데이터를 말한다. 이상치 라고도 한다. 아웃라이어 파악하는 방법: 여러 가지가 있다. 대표적으로는 평균을 중심으로 표준편차의 2배나 3배 정도 의 범위를 벗어난 값을 아웃라이어로 잡는 방법이다. 혹은 사분위수를 활용할 수도 있다. 사분 위는 자료를 크기 순으로 배열하여 4등분한 값을 말한다. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.6 Box Plot으로 데이터 분포 파악하기
  • 13. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 지역별 연령대별 실업률 평균치 중에서 특히 튀는 데이터 골라내기 Ctrl을 누른 상태에서 ‘시도’,’연도’,’연령대’,’실업률’을 클 릭한 뒤, Show me 박스에서 Whisker Plot을 선택해 차트 를 그린다. 실업률은 AVG로 바꾼다
  • 14. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 아웃라이어가 한 눈에 들어온다. 상자를 넘어 양측 경계선을 넘은 점들이 바로 아웃라이어이다.
  • 15. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.7 피벗 테이블에 날개 달기 : 하이라이트 테이블 스프레드 시트의 각 셀을 데이터에 연동해 색상 농담으로 각기 다르게 표시한 ‘하이라이트 테이블’도 데이터 분포를 한 눈에 파악하는 데 매우 효과적이다.
  • 16. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 ‘시도’를 Columns 선반에, ‘연령대’와 ‘연도’를 각각 Rows 선반에 넣고, 색상마크와 라벨(텍스트) 마크(책이 잘못됨)에 각각 ‘실업률’ 데이터를 집 어넣은 뒤 Marks 유형을 Automatic에서 Square로 변경하면 된다. 연도를 디멘드에 넣고 표에 집어넣어야함(책이 잘못됨) 실업률을 컬러에 넣고
  • 17. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 Ctrl키를 누른 상태에서 4가지 데이터 항목을 다 선택하고 Show Me 박스의 오른편 맨 위의 하이라이트 테이블 유형을 클릭하면 위와 같이 바로 시각화가 된다
  • 18. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 실업률을 끌어다가 라벨 마크에 넣으면 이렇게 라벨이 붙어진다.
  • 19. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 하이라이트 테이블은 피벗 테이블을 좀 더 이해하기 쉽도록 추가로 색상을 입힌 것이다. 색상농담의 변화가 급격한 부분과 짙은 색상이 뭉쳐 나타난 부분은 어디인지 살 펴보자.
  • 20. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.8 관심 데이터 표시하기: 피벗 테이블 Spotlighting 기법 한발 더 나아가 일정 기준 이상의 데이터만 골라 차별화된 색상으로 표시할 수 있는 방 법이다. 실업률을 오른쪽 클릭하여 Create Calculated Field 메뉴에서 이와 같이 조건식을 입력한다. 공식 / 계산이 유효하다 컬럼 시도 로우 연령대 연도 모두 파란색
  • 21. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 생성된 ‘실업률 스폿라이트’ 필드를 색상 마크에 집어넣고, Columns엔 ‘시도’, Rows에는 ‘연령대’와 ‘연도’를 이동시킨 상태에서 표를 만든다.
  • 22. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 또 필터로 연령대를 ‘15-29세’만 걸러낸다. 그 후 원하는 대로 연도 또한 필터링 할 수 있다. 그러면 위와 같이 특정 범위 데이터가 붉은색으로 스폿라이팅된다.
  • 23. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.9 셀 색상+크기로 데이터 파악하기: 히트맵 작성 하이라이트 테이블을 변형해 각 셀의 색상뿐 아니라 크기로도 데이터 분포를 살펴볼 수 있도록 한 것이 히트맵이다.
  • 24. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 TIP: 태블로의 필터와 마크 작업창의 활용법 마크의 각 상자에 데이터 항복을 끌어다 넣으면 그래프나 표는 새롭게 변신한다. Color는 특정 기호의 위치나 크기에 추가해 색상으로 표현하는 방법이다. Size 역시 X, Y축의 좌푯값이 아닌 특정 기호의 크기로서 데이터를 표시한다. Text는 그래프나 표에 데이터값을 표시하는 기능이다. Page 상자는 필터와 유사하나, X, Y축 상의 데이터 표시에 변화를 주지 않는 필터 기능이라고 생각하면 된다. 이 때문에 각 연도별로 그래프의 변화 추이를 동적으로 시각화하는 데 편리하게 이용할 수 있다. 각 기능 파악 / 툴팁 기능
  • 25. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.10 데이터 쪼개고 묶어 새롭게 배열하기 태블로는 시각화뿐 아니라 다양한 데이터 편집과 분석이 가능한 것도 강점이다. 대표적으로 Field calculator 기능과 그룹과 세트, 빈 생성 기능을 꼽을 수 있다. 데이트를 일정 범주로 다시 나누고 묶어 배열해 새로운 시각으로 조명해 보는 기 이다. 편집 기능과 논리계산식으로 데이터를 가공하는 방법을 살펴보자.
  • 26. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 아래와 같이 그래프 상에서 지역별 실업률 평균 데이터에서 축상의 서울과 경기, 인천을 클릭해 클립 모양의 기호를 누르면 그룹이 만들어진다. 여기서 수도권을 시도 / 실업률
  • 27. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 마우스 우클릭한 뒤 Edit Alias 기능을 선택하여 이름을 ‘수도권’으로 바꿔준다. 컬럼에 시도(그룹) 되어있는 것 을 한번더 옮겨줘야 이런 모양 이 나옴
  • 28. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 수도권이라는 새 그룹을 생성한 데 이어 호남, 영남 등 또 다른 그룹도 같은 방식으로 만 수 있다. 그 밖에는 논리식으로 그룹을 만드는 방법이 있는데 이 때는 Calculated Field를 이용한 위와 같이 IF 조건식을 입력하는 방식이다. 서울과 경기도와 인천은 수도권으로 설정하고, 나머지는 ‘시도’ 필드 그대로 두라 의미이다. IF 문에서 AND를 사용하지 않고 OR을 연산자로 쓴 점을 기억하자.
  • 29. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 5.11 특정 집단과 다른 집단 비교하기 • 세트(set) 생성하는 방법: 왼편 dimension 창의 ‘시도’ 항목에서 create set 선택 • ‘수도권’ set가 만들어진다 • 컬럼 수도권 로우 실업률
  • 30. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • Columns 선반과 color 마크상자에 ‘수도권’ set를 넣는다. • Edit Alias 메뉴로 IN을 ‘수도권’ OUT은 ‘다른지역’ 으로 바꾼다.
  • 31. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 연도를 Columns 선반으로 이동 시키면 수도권과 다른 지역의 연도별 실업률 그래 프가 나온다.
  • 32. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 12. 태블로에서 지도 시각화 하기 • 태블로에서 한글 주소는 거의 인식하지 못 한다. • Create Calculated Field 메뉴에서 변환 하면 된다. • 인천은 한글로 인식하지 못하므로 Incheon 으로 바꿔야 한다.
  • 33. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • Geographic Role 메뉴로 들어가 ‘시도’ 항목을 위치 데이터로 인식시킨다.
  • 34. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • ‘실업률’ 데이터를 각각 Color와 Size 마크에 넣는다. • Show me에서 지도 항목을 선택하면 각 광역시도의 위치가 시각화 된다. • 점 지도 (Point Map) 아이콘 선택
  • 35. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 광역시도별 실업률 지도 시각화
  • 36. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • Show me의 두 번째 지도 아이콘을 선택하면 각 광역시 도의 실업률에 연동해 영역을 색칠한 지도가 그려질 것 이다.
  • 37. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • Show Quick Filter로 필터 조정기를 생성한 뒤, 필터 조정기에서 메뉴 를 꺼내 single value slider를 선택한다. • 슬라이더를 움직이면 각 연도별로 색상주제도의 색상이 변하며 시기별, 지역별, 실업률의 추이를 볼 수 있다.
  • 38. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 13. 2개 이상의 데이터 ‘가로’ 결합하기 • 실업률 데이터를 불러온 상태에서, 상단 메뉴의 Data → ‘지역별 연령별 실업 률’ → Edit Data Source로 가서 결합시킨다.
  • 39. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 실업률, 자살률 데이터 1차 자동 결합
  • 40. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 앞의 창에서 보면 ‘연도’는 결합됐지만, ‘시도’와 ‘연령대’는 잘못 붙어있다. • 두 데이터 사이의 교집합 표시 기호 클릭한다. • 그림의 중간의 두 원을 클릭하면 된다.
  • 41. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • Inner Join으로 표시된 상태에서 ‘연도’만 임시로 결합 되어있으므로 ‘Add new join clause’를 눌러 ‘시도’와 ‘연령대’도 결합기준에 추가하면 된다.
  • 42. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 여기서는 자살률과 실업률을 블렌 딩 메뉴를 활용해 합친다. • Data → Connect to Data로 가서 불러온다. • 왼편 위쪽에 자살률 데이터가 새로 표시될 것이다.
  • 43. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • ‘시도’, ‘연도’, ‘연령대’ 3가지가 모 두 Dimensions창에 있어야 한다. • 자동 설정이 되어 있지 않다면 Custom 메뉴로 들어가 수동으로 공 통 필드를 지정하면 된다.
  • 44. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • ‘실업률’과 ‘자살률’을 각기 Row에 옮기고, ‘연도’는 Columns에 넣는 • 실업률, 자살률 데이터 차트 나란히 그리기
  • 45. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 두 데이터 간의 상관 관계를 파 악하기 위해 산포도(Scatter Plot)를 그려보자. • Show Me 상자에서 하단 두 번 째 왼편 아이콘 클릭. (파란색 테두리가 있는 아이콘)
  • 46. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 자살률, 실업률 산포도 (상관 관계 불명확)
  • 47. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 이번에는 자살률은 색상농담으로, 실 업률은 크기로 표시한 Tree Map을 그 려보자. • 그 다음으로는 Heatmap을 그려보자.
  • 48. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 실업률, 자살률 트리맵 시각화
  • 49. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 • 자살률, 실업률 트리맵 • 트리맵이나 히트맵은 일반인들에게는 다소 생소하지만, 데이터의 패턴 을 직관적으로 파악하고 취재의 단서를 얻는데 유용하다.
  • 50. 5장 데이터 시각화의 스위스칼, 태블로(tableau) 활용하 감사합니다.