12월 22일 스타트업 얼라이언스에서 있었던 데이터 사이언스 관련 공개 강연 슬라이드 입니다. 실제 사용했던 슬라이드에 시간 관계상 생략했던 슬라이드와 각종 링크를 추가한 확장판입니다.
- 데이터에 대한 오해와 진실
- 데이터 과학의 절차와 유의사항
- 비즈니스 성장을 위한 데이터 과학사례
- 데이터 과학을 활용한 책 쓰기
데이터 과학에 관련된 다양한 자료를 제 홈페이지와 페북, 트위터, 브런치에서 만나보실 수 있습니다.
http://www.hellodatascience.com/
이벤트에 관련된 좀더 자세한 사항은 온오프믹스 링크 참조하세요: http://onoffmix.com/event/59334
7. 행복 측정의 핵심: 행복도 입력의 기준
순간적인 행복의 느낌
Awesome Positive So So Awful
장기적행복에의
기여도
Very Successful
Perfect
5
Excellent
5
Good
4
Fair
3
Successful
Excellent
5
Good
4
Fair
3
Fair
3
So so
Good
4
Fair
3
Fair
3
Bad
2
Unsuccessful
Fair
3
Fair
3
Bad
2
Nightmare
1
발표영상 (Vimeo)
시애틀 타임즈 기사
32. 분석에 최적화된 표준 테이블로 변환한다
속성1 … 속성n … 속성m
항목1
…
항목x
…
항목y
….
속성n … 속성m
항목1
…
항목x
…
항목y
….
각 행에
단일 항목
각 열에 단일 속성
공통
속성
공통
속성
테이블간
공통 속성
표준 테이블 테이블간 연결
http://vita.had.co.nz/papers/tidy-data.pdf
33. 사용자 및 데이터 크기에 따른 도구의 선택
스몰
데이터
빅데이터
최종사용자
개발자
엑셀
관계형
데이터베이스
클라우드
R
파이썬
C / 자바
온라인
서비스
http://www.hellodatascience.com/?p=136
34. 데이터 분석 프로세스에 따른 도구의 선택
데이터 준비
탐험적
데이터 분석
통계적
추론 / 예측
해결책 구현 결과 소통
엑셀클라우드
데이터-
베이스
파이썬엑셀
R
파이썬
커스텀
코드
R
http://www.hellodatascience.com/?p=136
35. 데이터 과학의 3단계: 먹음직스럽게 차려내기
데이터의 핵심을 한눈에 담아내는 시각화
청중의 관심사와 눈높이에 맞는 발표
36. 데이터의 유형에 따른 시각화의 선택
위치 데이터
텍스트 데이터 시계열 데이터
http://www.hellodatascience.com/?p=323
37. 살아있는 시각화: 미국의 총기 사망자 수
http://guns.periscopic.com/?year=2013
38. 데이터 과학의 절차는 요리로 이해하자!
양질의 데이터를 구하거나 수집한다.
적절한 도구와 기법으로 데이터를 다룬다.
분석의 결과를 맛깔스럽게 담아낸다.
55. 변화경영 전문가로서 나에게 적용되는 엄격한 규율을 만들었다.
먼저 나에게 적용할 것, 반드시 성공할 것
이것이 내가 요구하는 품질 기준이다.
故 구본형 작가의 품질 기준
어떻게 책을 쓰는 과정에 데이터 과학을 적용할 수 있을까?
56. 헬로 데이터 과학: 집필 원칙
• 최신의 지식과 자신의 노하우를 결합
• 관련 서적 및 자료를 모두 탐독
• 자신만의 목소리를 더한다
• 매일 읽고 쓰되, 억지로는 하지 않는다
• 재미있게 쓴 글이 읽기도 재미있다
• 집필 과정에 데이터 과학을 최대한 활용한다
• 가장 좋은 교육은 본보기를 보여주는 것
57. 헬로 데이터 과학: 집필 프로세스
컨텐츠 계획
• 주제 및 범위 선정
• 출판사 접촉 & 계약
컨텐츠 작성
• 관련 분야 리서치
• 장별 내용 집필
컨텐츠 검토
• 장별 내용 리뷰
• 제목 & 표지 결정
64. 0
10000
20000
30000
40000
50000
60000
4/4/2015 5/4/2015 6/4/2015 7/4/2015 8/4/2015 9/4/2015 10/4/2015
dbook_ch1.md dbook_ch2-1.md dbook_ch2-2.md dbook_ch2.md dbook_ch3-1.md
dbook_ch3-2.md dbook_ch4.md dbook_ch5.md dbook_ch6.md dbook_ch7.md
컨텐츠 분량: 장별 / 전체 분량
스스로를 동기부여 하고 매일 꾸준히 쓰는 흐름을 유지