SlideShare une entreprise Scribd logo
1  sur  24
온라인 서비스 개선을
위한 데이터 수집하기
김진영
온라인 서비스 개발의 단계별 이슈
• 계획
• 비즈니스 목표를 어떻게 설정할 것인가?
• 목표 달성을 위한 최적의 방법은 무엇인가?
• 구현
• 검색 및 추천 기능은 어떻게 구현할 수 있을까?
• 구현된 기능에 눈에 띄는 결함은 없는가?
• 평가
• 새로운 기능에 사용자가 만족하는가?
• 비즈니스 목표가 얼마나 달성되었는가?
계획
구현평가
이를 해결하기 위해서는 데이터가 필요
• 현재 서비스의 (불)만족도에 대한 데이터
• 학습 모델을 만들고 평가하기 위한 데이터
• 서비스의 장애나 결함을 발견하기 위한 데이터
• 새로운 기능의 효과를 측정하기 위한 데이터
핵심: 우리 서비스에 대한 고객의 반응은?
이런 데이터를 어떻게 수집할 수 있을까?
참고: 식당 서비스 개선을 위한 데이터 수집
• 고객 행동 관찰
• 고객의 표정과 시선
• 잔반의 양과 종류
• 식사의 속도
얻을 수 있는 데이터의 종류가
제한적이며 노이즈가 많다.
고객의 행동을 기반으로
만족도를 유추해야 한다.
참고: 식당 서비스 개선을 위한 데이터 수집
• 패널 서베이
• 음식에 대한 만족도
• 청결에 대한 만족도
• 시설에 대한 만족도
이런 서베이를 통해 상세한
데이터를 얻을 수 있지만
고객에게서 직접 얻는
결과와는 다를 수 있다!
온라인 서비스 관련 데이터 수집의 방법
• 사용자 로그
• 사용자 로그에서 다양한 ‘시그널‘ 추출
• 데이터 수집의 범위 및 품질에 제약 (사용자 행동)
• 별도의 비용은 없지만 사용자층이 두터워야
• 패널 서베이
• 서베이 회사를 이용하거나, 패널을 직접 고용
• 서비스 품질의 모든 측면에 대한 자세한 피드백
• 패널 규모에 따른 비용이 발생
온라인 서비스 관련 데이터 수집의 방법 (2)
• 사용자 피드백
• 사용자에게 실시간으로 피드백을 요청
• 보통 응답률이 낮고, 자칫 사용자를 귀챃게 할수도
• 개인화가 중요한 추천 서비스 등에서는 널리 사용 (예: 영화 별점)
패널 서베이 사용자 로그
사용자 피드백
주요 온라인 서비스 기업에서는 어떻게
데이터를 수집하는가?
검색 서비스 사례: 구글/빙
• 개발 초기: 패널을 통해 수집한 레이블
• 개발 후기: 사용자 로그에 기반한 실험
• 출처: 구글
소셜 네트워크 사례: 페이스북
• 서비스 초기: 사용자 로그만 사용
• 최근: 로그 + 패널 + 피드백
• 출처: Slate / Quora
페이스북 피드 랭킹에 사용자 로그와 함께
패널 서베이와 사용자 피드백을 추가로
사용함으로써 클릭만을 유도하는 컨텐츠
대신 사용자가 만족하는 컨텐츠를 더 많이
노출시킬 수 있었다.
- Julie Zhuo, Product Design VP at Facebook
추천 서비스 사례: 넷플릭스
• 검색 서비스: 패널 + 사용자 로그
• 추천 서비스: 사용자 피드백 + 로그
• 출처: 넷플릭스
추천 서비스의 결과물을 평가할 수 있을까?
추천
알고리즘
A
추천
알고리즘
B
어떤 방법으로 데이터를 수집할 것인가?
• 사용자 행동을 통해 관찰가능한 정보는 무엇인가?
• 사용자가 피드백을 줄 인센티브가 있는가?
서비스의 특성
• 일정 규모의 액티브 유저가 이미 존재하는가?
• 패널이 사용자 경험을 대신 평가해줄 수 있는가?
수집의 가능성
• 충분한 사용자 확보를 위한 마케팅 예산이 있는가?
• 패널 서베이를 위한 충분한 예산이 있나?
수집의 비용
검색 엔진의 품질을 어떻게 평가해야 할까?
사용자 행동(로그)에
기반한 평가
• 어떤 결과에 클릭했는가?
• 클릭하지 않은 결과는 무조건 나쁜가?
• 클릭한 결과에 얼마나 머물렀는가?
• 오래 머문 결과는 무조건 좋은가?
• 사용자가 재방문하는가?
• 만족도와 재방문율의 상관관계는?
사용자 행동은 중요한 단서이지만 결과의 품질을 모두 말해주지는 않는다!
같은 결과를 패널 서베이로 평가한다면?
질의어 ‘crowdsourcing’
에 대한 오른쪽 결과를
평가한다면?
형편없다
그저그렇다
괜챃다
훌륭하다
Q: 그 이유는?
이 설문 디자인의 문제점은?
• 평가자가 질의어 자체를 이해하지 못할 수도 있다.
• 질의어가 나타내는 검색 사용자의 의도가 명확하지 않다.
• 평가자가 검색 결과의 일부만 마음에 들어할 수도 있다.
• 검색 결과의 품질을 평가하는 기준이 명확하지 않다.
웹 검색 결과 평가를 위한 인터페이스 (2)
질의어 ‘crowdsourcing’
에 대한 오른쪽 결과를
평가한다면?
형편없다
그저그렇다
괜챃다
훌륭하다
Q: 그 이유는?
웹 검색 결과 평가를 위한 인터페이스 (3)
Q: 오른쪽의 두 검색
결과를 비교한다면?
왼쪽이 훨씬 나음
왼쪽이 약간 나음
우열을 가리기 힘들다
오른쪽이 약간 나음
오른쪽이 훨씬 나음
Q: 그 이유는?
고품질의 패널 서베이 결과를 얻으려면?
• 패널의 구성은 대상 고객군의 특성과 유사한가?
• 패널 구성원이 이해하여 답할 수 있는 질문인가?
• 답변의 정직성 및 품질을 어떻게 평가할 것인가?
• 패널 구성원에게 적절한 인센티브를 제공하는가?
마치며
요약하면…
• 데이터 사용을 이전에 제대로 된 데이터 수집 방법을 고민할것
• 패널 서베이와 사용자 로그, 피드백 등 서비스 특성 및 개발
단계에 따라 데이터 수집 방법을 적절히 조합하여 사용할것
• 제대로 된 패널 서베이를 위해서는 다양한 고려사항이 존재:
서베이 디자인 / 패널 선발 및 교육 / 결과 평가 및 보상
더 상세한 이야기를 원하시면…
• 우리 식당 김사장이 데이터 과학자가 된 사연은?
• 넷플릭스가 추천 및 검색 알고리즘을 개선하는 방법
• 페이스북이 뉴스 피드 랭킹을 만들고 개선하는 방법
• SIGIR’2015 Tutorial on Offline Search Evaluation

Contenu connexe

Tendances

나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일Hyeonjong Gim
 
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best Practices[PAP] 실무자를 위한 인과추론 활용 : Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best PracticesBokyung Choi
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스Minwoo Kim
 
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론PAP (Product Analytics Playground)
 
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트Minho Lee
 
서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기승화 양
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )정혁 권
 
스타트업의 데이터 분석
스타트업의 데이터 분석스타트업의 데이터 분석
스타트업의 데이터 분석Hyunjong Wi
 
[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트
[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트
[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트Dylan Ko
 
전환율 이해하기
전환율 이해하기전환율 이해하기
전환율 이해하기Wooseok Seo
 
[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표
[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표
[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표Dylan Ko
 
[나우앤서베이] 소개서
[나우앤서베이] 소개서[나우앤서베이] 소개서
[나우앤서베이] 소개서nown survey
 
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정PAP (Product Analytics Playground)
 
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)Minho Lee
 
Unseen Korea - Unique guide for expats in Korea
Unseen Korea - Unique guide for expats in KoreaUnseen Korea - Unique guide for expats in Korea
Unseen Korea - Unique guide for expats in KoreaSoukhyeon Kim
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiIsabel Myeongju Han
 
Snusv/인사이더스 서울대 창업동아리 강의 자료
Snusv/인사이더스 서울대 창업동아리 강의 자료Snusv/인사이더스 서울대 창업동아리 강의 자료
Snusv/인사이더스 서울대 창업동아리 강의 자료Kyu Byoung Sim
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다승화 양
 

Tendances (19)

나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
 
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best Practices[PAP] 실무자를 위한 인과추론 활용 : Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
 
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
 
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
 
서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기
 
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
린분석 with 레진코믹스 ( Lean Analytics with Lezhin Comics )
 
스타트업의 데이터 분석
스타트업의 데이터 분석스타트업의 데이터 분석
스타트업의 데이터 분석
 
[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트
[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트
[우리가 데이터를 쓰는 법] 데이터로 소소한 의사결정하기 - 노리 조영임 UX 아키텍트
 
전환율 이해하기
전환율 이해하기전환율 이해하기
전환율 이해하기
 
[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표
[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표
[우리가 데이터를 쓰는 법] 우리가 고객을 이해하는 법 - 에그번 에듀케이션 문관균 대표
 
[나우앤서베이] 소개서
[나우앤서베이] 소개서[나우앤서베이] 소개서
[나우앤서베이] 소개서
 
Nunbody ppt3
Nunbody ppt3Nunbody ppt3
Nunbody ppt3
 
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
 
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
 
Unseen Korea - Unique guide for expats in Korea
Unseen Korea - Unique guide for expats in KoreaUnseen Korea - Unique guide for expats in Korea
Unseen Korea - Unique guide for expats in Korea
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonsei
 
Snusv/인사이더스 서울대 창업동아리 강의 자료
Snusv/인사이더스 서울대 창업동아리 강의 자료Snusv/인사이더스 서울대 창업동아리 강의 자료
Snusv/인사이더스 서울대 창업동아리 강의 자료
 
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
 

Similaire à 온라인 서비스 개선을 데이터 활용법 - 김진영 (How We Use Data)

[IR시스템]소개자료
[IR시스템]소개자료[IR시스템]소개자료
[IR시스템]소개자료insight-korea
 
스타트업처럼 토이프로젝트하기
스타트업처럼 토이프로젝트하기스타트업처럼 토이프로젝트하기
스타트업처럼 토이프로젝트하기Sunyoung Shin
 
The clip_minkyukim
The clip_minkyukimThe clip_minkyukim
The clip_minkyukimMin Gyu Kim
 
Smm(social media marketing) 성과측정 기준과 실제 ver2.0
Smm(social media marketing) 성과측정 기준과 실제 ver2.0Smm(social media marketing) 성과측정 기준과 실제 ver2.0
Smm(social media marketing) 성과측정 기준과 실제 ver2.0kang Anthony
 
페이스북 기업활동, 성과측정 어떻게 할 것인가
페이스북  기업활동, 성과측정 어떻게 할 것인가페이스북  기업활동, 성과측정 어떻게 할 것인가
페이스북 기업활동, 성과측정 어떻게 할 것인가kang Anthony
 
Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)병국 민
 
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기Hyunjung Kim
 
The Clip Project _ Min Kyu Kim
The Clip Project _ Min Kyu KimThe Clip Project _ Min Kyu Kim
The Clip Project _ Min Kyu KimMin Gyu Kim
 
Recommendatioin system basic
Recommendatioin system basicRecommendatioin system basic
Recommendatioin system basicSoo-Kyung Choi
 
린분석16
린분석16린분석16
린분석16HyeonSeok Choi
 
웹사이트 벤치마킹의2
웹사이트 벤치마킹의2웹사이트 벤치마킹의2
웹사이트 벤치마킹의2juhyun
 
Unite팀 6월9일 발표.pptx
Unite팀 6월9일 발표.pptxUnite팀 6월9일 발표.pptx
Unite팀 6월9일 발표.pptxkimseonjeong1
 
APPSURFING Project Portfolio
APPSURFING Project PortfolioAPPSURFING Project Portfolio
APPSURFING Project PortfolioChloe Park
 
UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]RightBrain inc.
 
[Seed break]maditta plan ver1.00
[Seed break]maditta plan ver1.00[Seed break]maditta plan ver1.00
[Seed break]maditta plan ver1.00Yongsoon Choi
 
YouTube Creator Playbook - in Korean
YouTube Creator Playbook - in KoreanYouTube Creator Playbook - in Korean
YouTube Creator Playbook - in KoreanEugene Choi
 
링크브릭스 BI 구축 전략 핸드북
링크브릭스 BI 구축 전략 핸드북링크브릭스 BI 구축 전략 핸드북
링크브릭스 BI 구축 전략 핸드북Sangkyu Kim
 
RecoPick : recommendation services and some use cases
RecoPick : recommendation services and some use casesRecoPick : recommendation services and some use cases
RecoPick : recommendation services and some use casesChaehyun Lee
 
13강 기업교육론 20110603
13강 기업교육론 2011060313강 기업교육론 20110603
13강 기업교육론 20110603조현경
 

Similaire à 온라인 서비스 개선을 데이터 활용법 - 김진영 (How We Use Data) (20)

[IR시스템]소개자료
[IR시스템]소개자료[IR시스템]소개자료
[IR시스템]소개자료
 
스타트업처럼 토이프로젝트하기
스타트업처럼 토이프로젝트하기스타트업처럼 토이프로젝트하기
스타트업처럼 토이프로젝트하기
 
The clip_minkyukim
The clip_minkyukimThe clip_minkyukim
The clip_minkyukim
 
Smm(social media marketing) 성과측정 기준과 실제 ver2.0
Smm(social media marketing) 성과측정 기준과 실제 ver2.0Smm(social media marketing) 성과측정 기준과 실제 ver2.0
Smm(social media marketing) 성과측정 기준과 실제 ver2.0
 
페이스북 기업활동, 성과측정 어떻게 할 것인가
페이스북  기업활동, 성과측정 어떻게 할 것인가페이스북  기업활동, 성과측정 어떻게 할 것인가
페이스북 기업활동, 성과측정 어떻게 할 것인가
 
Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)
 
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
 
The Clip Project _ Min Kyu Kim
The Clip Project _ Min Kyu KimThe Clip Project _ Min Kyu Kim
The Clip Project _ Min Kyu Kim
 
Recommendatioin system basic
Recommendatioin system basicRecommendatioin system basic
Recommendatioin system basic
 
ITCT 사용자 중심 디자인 특강 - spoqa 남유정 UX designer
ITCT 사용자 중심 디자인 특강 - spoqa 남유정 UX designerITCT 사용자 중심 디자인 특강 - spoqa 남유정 UX designer
ITCT 사용자 중심 디자인 특강 - spoqa 남유정 UX designer
 
린분석16
린분석16린분석16
린분석16
 
웹사이트 벤치마킹의2
웹사이트 벤치마킹의2웹사이트 벤치마킹의2
웹사이트 벤치마킹의2
 
Unite팀 6월9일 발표.pptx
Unite팀 6월9일 발표.pptxUnite팀 6월9일 발표.pptx
Unite팀 6월9일 발표.pptx
 
APPSURFING Project Portfolio
APPSURFING Project PortfolioAPPSURFING Project Portfolio
APPSURFING Project Portfolio
 
UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]
UX 아카데미 오픈프로젝트 [링크드인 - UX/UI 개선]
 
[Seed break]maditta plan ver1.00
[Seed break]maditta plan ver1.00[Seed break]maditta plan ver1.00
[Seed break]maditta plan ver1.00
 
YouTube Creator Playbook - in Korean
YouTube Creator Playbook - in KoreanYouTube Creator Playbook - in Korean
YouTube Creator Playbook - in Korean
 
링크브릭스 BI 구축 전략 핸드북
링크브릭스 BI 구축 전략 핸드북링크브릭스 BI 구축 전략 핸드북
링크브릭스 BI 구축 전략 핸드북
 
RecoPick : recommendation services and some use cases
RecoPick : recommendation services and some use casesRecoPick : recommendation services and some use cases
RecoPick : recommendation services and some use cases
 
13강 기업교육론 20110603
13강 기업교육론 2011060313강 기업교육론 20110603
13강 기업교육론 20110603
 

Plus de Jin Young Kim

DnA Playshop - Serious Fun with LEGO.pptx
DnA Playshop - Serious Fun with LEGO.pptxDnA Playshop - Serious Fun with LEGO.pptx
DnA Playshop - Serious Fun with LEGO.pptxJin Young Kim
 
Frontiers in Data Science For Modern Web Search Engine
Frontiers in Data Science For Modern Web Search EngineFrontiers in Data Science For Modern Web Search Engine
Frontiers in Data Science For Modern Web Search EngineJin Young Kim
 
Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...
Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...
Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...Jin Young Kim
 
Fairness in Search & RecSys 네이버 검색 콜로키움 김진영
Fairness in Search & RecSys 네이버 검색 콜로키움 김진영Fairness in Search & RecSys 네이버 검색 콜로키움 김진영
Fairness in Search & RecSys 네이버 검색 콜로키움 김진영Jin Young Kim
 
네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기
네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기
네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기Jin Young Kim
 
Social Entrepreneur meets Technology by 황진솔 대표
Social Entrepreneur meets Technology by 황진솔 대표Social Entrepreneur meets Technology by 황진솔 대표
Social Entrepreneur meets Technology by 황진솔 대표Jin Young Kim
 
Subtleties in Tracking Happiness -- Seattle QS#10
Subtleties in Tracking Happiness -- Seattle QS#10Subtleties in Tracking Happiness -- Seattle QS#10
Subtleties in Tracking Happiness -- Seattle QS#10Jin Young Kim
 
Measuring the Quality of Online Service - Jinyoung kim
Measuring the Quality of Online Service - Jinyoung kimMeasuring the Quality of Online Service - Jinyoung kim
Measuring the Quality of Online Service - Jinyoung kimJin Young Kim
 
SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...
SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...
SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...Jin Young Kim
 
랭킹 최적화를 넘어 인간적인 검색으로 - 서울대 융합기술원 발표
랭킹 최적화를 넘어 인간적인 검색으로  - 서울대 융합기술원 발표랭킹 최적화를 넘어 인간적인 검색으로  - 서울대 융합기술원 발표
랭킹 최적화를 넘어 인간적인 검색으로 - 서울대 융합기술원 발표Jin Young Kim
 
반상식적이고 주관적인 (CS) 유학 이야기
반상식적이고 주관적인 (CS) 유학 이야기반상식적이고 주관적인 (CS) 유학 이야기
반상식적이고 주관적인 (CS) 유학 이야기Jin Young Kim
 

Plus de Jin Young Kim (11)

DnA Playshop - Serious Fun with LEGO.pptx
DnA Playshop - Serious Fun with LEGO.pptxDnA Playshop - Serious Fun with LEGO.pptx
DnA Playshop - Serious Fun with LEGO.pptx
 
Frontiers in Data Science For Modern Web Search Engine
Frontiers in Data Science For Modern Web Search EngineFrontiers in Data Science For Modern Web Search Engine
Frontiers in Data Science For Modern Web Search Engine
 
Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...
Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...
Data Science for Online Services: Problems & Frontiers (Changbal Conference 2...
 
Fairness in Search & RecSys 네이버 검색 콜로키움 김진영
Fairness in Search & RecSys 네이버 검색 콜로키움 김진영Fairness in Search & RecSys 네이버 검색 콜로키움 김진영
Fairness in Search & RecSys 네이버 검색 콜로키움 김진영
 
네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기
네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기
네이버서치ABT: 신뢰할 수 있는 A/B 테스트 플랫폼 개발 및 정착기
 
Social Entrepreneur meets Technology by 황진솔 대표
Social Entrepreneur meets Technology by 황진솔 대표Social Entrepreneur meets Technology by 황진솔 대표
Social Entrepreneur meets Technology by 황진솔 대표
 
Subtleties in Tracking Happiness -- Seattle QS#10
Subtleties in Tracking Happiness -- Seattle QS#10Subtleties in Tracking Happiness -- Seattle QS#10
Subtleties in Tracking Happiness -- Seattle QS#10
 
Measuring the Quality of Online Service - Jinyoung kim
Measuring the Quality of Online Service - Jinyoung kimMeasuring the Quality of Online Service - Jinyoung kim
Measuring the Quality of Online Service - Jinyoung kim
 
SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...
SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...
SIGIR Tutorial on IR Evaluation: Designing an End-to-End Offline Evaluation P...
 
랭킹 최적화를 넘어 인간적인 검색으로 - 서울대 융합기술원 발표
랭킹 최적화를 넘어 인간적인 검색으로  - 서울대 융합기술원 발표랭킹 최적화를 넘어 인간적인 검색으로  - 서울대 융합기술원 발표
랭킹 최적화를 넘어 인간적인 검색으로 - 서울대 융합기술원 발표
 
반상식적이고 주관적인 (CS) 유학 이야기
반상식적이고 주관적인 (CS) 유학 이야기반상식적이고 주관적인 (CS) 유학 이야기
반상식적이고 주관적인 (CS) 유학 이야기
 

온라인 서비스 개선을 데이터 활용법 - 김진영 (How We Use Data)

  • 1. 온라인 서비스 개선을 위한 데이터 수집하기 김진영
  • 2. 온라인 서비스 개발의 단계별 이슈 • 계획 • 비즈니스 목표를 어떻게 설정할 것인가? • 목표 달성을 위한 최적의 방법은 무엇인가? • 구현 • 검색 및 추천 기능은 어떻게 구현할 수 있을까? • 구현된 기능에 눈에 띄는 결함은 없는가? • 평가 • 새로운 기능에 사용자가 만족하는가? • 비즈니스 목표가 얼마나 달성되었는가? 계획 구현평가
  • 3. 이를 해결하기 위해서는 데이터가 필요 • 현재 서비스의 (불)만족도에 대한 데이터 • 학습 모델을 만들고 평가하기 위한 데이터 • 서비스의 장애나 결함을 발견하기 위한 데이터 • 새로운 기능의 효과를 측정하기 위한 데이터 핵심: 우리 서비스에 대한 고객의 반응은?
  • 4. 이런 데이터를 어떻게 수집할 수 있을까?
  • 5. 참고: 식당 서비스 개선을 위한 데이터 수집 • 고객 행동 관찰 • 고객의 표정과 시선 • 잔반의 양과 종류 • 식사의 속도 얻을 수 있는 데이터의 종류가 제한적이며 노이즈가 많다. 고객의 행동을 기반으로 만족도를 유추해야 한다.
  • 6. 참고: 식당 서비스 개선을 위한 데이터 수집 • 패널 서베이 • 음식에 대한 만족도 • 청결에 대한 만족도 • 시설에 대한 만족도 이런 서베이를 통해 상세한 데이터를 얻을 수 있지만 고객에게서 직접 얻는 결과와는 다를 수 있다!
  • 7. 온라인 서비스 관련 데이터 수집의 방법 • 사용자 로그 • 사용자 로그에서 다양한 ‘시그널‘ 추출 • 데이터 수집의 범위 및 품질에 제약 (사용자 행동) • 별도의 비용은 없지만 사용자층이 두터워야 • 패널 서베이 • 서베이 회사를 이용하거나, 패널을 직접 고용 • 서비스 품질의 모든 측면에 대한 자세한 피드백 • 패널 규모에 따른 비용이 발생
  • 8. 온라인 서비스 관련 데이터 수집의 방법 (2) • 사용자 피드백 • 사용자에게 실시간으로 피드백을 요청 • 보통 응답률이 낮고, 자칫 사용자를 귀챃게 할수도 • 개인화가 중요한 추천 서비스 등에서는 널리 사용 (예: 영화 별점) 패널 서베이 사용자 로그 사용자 피드백
  • 9. 주요 온라인 서비스 기업에서는 어떻게 데이터를 수집하는가?
  • 10. 검색 서비스 사례: 구글/빙 • 개발 초기: 패널을 통해 수집한 레이블 • 개발 후기: 사용자 로그에 기반한 실험 • 출처: 구글
  • 11. 소셜 네트워크 사례: 페이스북 • 서비스 초기: 사용자 로그만 사용 • 최근: 로그 + 패널 + 피드백 • 출처: Slate / Quora 페이스북 피드 랭킹에 사용자 로그와 함께 패널 서베이와 사용자 피드백을 추가로 사용함으로써 클릭만을 유도하는 컨텐츠 대신 사용자가 만족하는 컨텐츠를 더 많이 노출시킬 수 있었다. - Julie Zhuo, Product Design VP at Facebook
  • 12. 추천 서비스 사례: 넷플릭스 • 검색 서비스: 패널 + 사용자 로그 • 추천 서비스: 사용자 피드백 + 로그 • 출처: 넷플릭스
  • 13. 추천 서비스의 결과물을 평가할 수 있을까? 추천 알고리즘 A 추천 알고리즘 B
  • 14. 어떤 방법으로 데이터를 수집할 것인가? • 사용자 행동을 통해 관찰가능한 정보는 무엇인가? • 사용자가 피드백을 줄 인센티브가 있는가? 서비스의 특성 • 일정 규모의 액티브 유저가 이미 존재하는가? • 패널이 사용자 경험을 대신 평가해줄 수 있는가? 수집의 가능성 • 충분한 사용자 확보를 위한 마케팅 예산이 있는가? • 패널 서베이를 위한 충분한 예산이 있나? 수집의 비용
  • 15. 검색 엔진의 품질을 어떻게 평가해야 할까?
  • 16. 사용자 행동(로그)에 기반한 평가 • 어떤 결과에 클릭했는가? • 클릭하지 않은 결과는 무조건 나쁜가? • 클릭한 결과에 얼마나 머물렀는가? • 오래 머문 결과는 무조건 좋은가? • 사용자가 재방문하는가? • 만족도와 재방문율의 상관관계는? 사용자 행동은 중요한 단서이지만 결과의 품질을 모두 말해주지는 않는다!
  • 17. 같은 결과를 패널 서베이로 평가한다면? 질의어 ‘crowdsourcing’ 에 대한 오른쪽 결과를 평가한다면? 형편없다 그저그렇다 괜챃다 훌륭하다 Q: 그 이유는?
  • 18. 이 설문 디자인의 문제점은? • 평가자가 질의어 자체를 이해하지 못할 수도 있다. • 질의어가 나타내는 검색 사용자의 의도가 명확하지 않다. • 평가자가 검색 결과의 일부만 마음에 들어할 수도 있다. • 검색 결과의 품질을 평가하는 기준이 명확하지 않다.
  • 19. 웹 검색 결과 평가를 위한 인터페이스 (2) 질의어 ‘crowdsourcing’ 에 대한 오른쪽 결과를 평가한다면? 형편없다 그저그렇다 괜챃다 훌륭하다 Q: 그 이유는?
  • 20. 웹 검색 결과 평가를 위한 인터페이스 (3) Q: 오른쪽의 두 검색 결과를 비교한다면? 왼쪽이 훨씬 나음 왼쪽이 약간 나음 우열을 가리기 힘들다 오른쪽이 약간 나음 오른쪽이 훨씬 나음 Q: 그 이유는?
  • 21. 고품질의 패널 서베이 결과를 얻으려면? • 패널의 구성은 대상 고객군의 특성과 유사한가? • 패널 구성원이 이해하여 답할 수 있는 질문인가? • 답변의 정직성 및 품질을 어떻게 평가할 것인가? • 패널 구성원에게 적절한 인센티브를 제공하는가?
  • 23. 요약하면… • 데이터 사용을 이전에 제대로 된 데이터 수집 방법을 고민할것 • 패널 서베이와 사용자 로그, 피드백 등 서비스 특성 및 개발 단계에 따라 데이터 수집 방법을 적절히 조합하여 사용할것 • 제대로 된 패널 서베이를 위해서는 다양한 고려사항이 존재: 서베이 디자인 / 패널 선발 및 교육 / 결과 평가 및 보상
  • 24. 더 상세한 이야기를 원하시면… • 우리 식당 김사장이 데이터 과학자가 된 사연은? • 넷플릭스가 추천 및 검색 알고리즘을 개선하는 방법 • 페이스북이 뉴스 피드 랭킹을 만들고 개선하는 방법 • SIGIR’2015 Tutorial on Offline Search Evaluation

Notes de l'éditeur

  1. 행사 제목이 ‘우리가 데이터를 쓰는 법'인데요, 저는 오늘 데이터 수집에 초점을 맞추어 볼까 한다. 데이터로 일을 해보신 분들은 공감하겠지만 제대로 된 데이터가 있으면 이를 가공하는 것도, 사용하는 것도 상대적으로 쉽다.
  2. 온라인 서비스의 개발 과정은 크게 ~ 로 나눌 수 있다. 각 단계별로 다양한 이슈가 존재한다.
  3. 이들 대부분은 데이터 문제다. 이처럼 다양한 유형의 데이터가 있지만 핵심은 서비스에 대한 고객의 반응을 측정하는 것이다.
  4. 이해를 돕기 위해 식당을 예로 들어보자. 고객의 행동에서 얻을 수 있는 데이터는 무엇일까?
  5. 부족한 데이터는 패널 서베이를 통해 얻을 수 있다. 패널 서베이는 고객의 의견을 대표하는 패널을 고용하여 그들의 의견을 청취하는 것이다.
  6. 이런 데이터 수집 방법은 온라인 서비스의 개선에도 그대로 적용할 수 있다.
  7. 지금까지 두가지 방법을 알아보았는데, 이를 결합하면 어떨까? 사용자에게 실시간으로 피드백을 받는 것이다. 하지만, 이를 제대로 하지 않으면 낮은 응답률에 오히려 사용자를 성가시게 할 수도 있다.
  8. 이제 이런 데이터 수집 방법을 주요 온라인 서비스 기업에서 어떻게 활용하는지 알아보자.
  9. 우선 필자의 업무 영역인 검색 서비스 사례를 생각해보자. 검색서비스 개선을 위해서는 다양한 실험 기법이 사용되는데 ~ (뒤에 자세히 다룬다)
  10. 페이스북은 서비스 초기에 사용자 로그만 사용했다고 한다. 하지만 최근에는 ~
  11. 넷플릭스에서는 검색 서비스와 추천 서비스의 평가에 각각 다른 데이터를 사용한다고 한다.
  12. 그 이유중 하나는 개인화된 추천 서비스의 결과를 서베이로 평가하기 어렵다는 것이다. 예를 들어 두가지 추천 알고리즘에서 나온 결과를 비교해보자. 이용자 자신도 우열을 판단하기가 쉽지 않다!
  13. No ground for comparison / What if the judge doesn’t understand the intent?
  14. No ground for comparison / What if the judge doesn’t understand the intent?
  15. Should we use ‘about the same’ vs. ‘the same??