SlideShare une entreprise Scribd logo
1  sur  21
Télécharger pour lire hors ligne
애자일 머신러닝
Seungil Sean You
2018/11/23
Today’s contents
● ML in the wild
● 애자일 머신러닝이란?
● 예제 따라가보기
● Discussion
Introduction
● SNU EE B.S
● Caltech PhD
● Google Research SWE
○ 2015.08 ~ 2018.01
● Head of Datalab, KakaoMobility
○ 2018.03 ~ Present
● 30+ Publications
● TensorFlow Lattice’s main author
ML Service in Production
Streaming
MicroBatch
Batch
Real-time inference
● On-demand matching
● Speech recognition
● OCR
Batch inference
● Supply/Demand prediction
● Traffic prediction
● Recommendation
카카오모빌리티 ML Service
● Real-time inference service: 6+ in production
● Batch inference service: 2+ in production
● Number of models > 1000+
● More to come..
ML in the wild
Expectation
source: https://medium.com/waymo/simulation-how-one-flashing-yellow-light-turns-into-thousands-of-hours-of-experience-a7a1cb475565
Reality
ML in the wild
ML in the wild
출처: Hidden Technical Debt in Machine Learning Systems, D. Sculley et. al., NIPS 2015
애자일 머신러닝
source: https://blog.crisp.se/2016/01/25/henrikkniberg/making-sense-of-mvp
Agile 개발 방법론
● Minimum Viable Product 중심
Agile Machine Learning?
● ML 이 만능툴은 아니다
● 예외사항이 많으므로..
○ Business impact를 추적하면서 빠르게..
● It’s OKAY to use a rule-based logic!
Typical life cycle of ML
Identify the
problem
Collect the data
Design metric &
model
Offline test
Online test
Analyze the
result
Go / No-go
Profit!!
애자일 머신러닝
● ML is a good tool -- but it’s not the only tool.
● ML forces you to look at the data and define clear performance metrics.
sources: https://www.amazon.com/Thor-World-Digital-Exclusive-Bonus-Features/dp/B00HN1SVFU
https://econsultancy.com/google-analytics-custom-dashboards/
가상의 예제: Product 고도화 해보기
K모사에서는 최근 환불 요청이 증가하고 있는 상품을 발견하였다.
가상의 예제: Product 고도화 해보기
K모사에서는 최근 환불 요청이 증가하고 있는 상품을 발견하였다.
WHY???
가상의 예제: 문제 조사
● 조사해보니 영문판인지 모르고 샀다는 경우가 많았다.
● 장바구니에 넣고 Checkout 할때 해외 상품인지 아닌지 유저에게 알려줘서
고객의 실수를 줄여줄 수는 없을까?
xxx 는 해외 상품입니다.
구매하시겠습니까?
문제 설정
● Metric 을 먼저 정해야한다.
○ Precision == 알려줬는데 실제로 실수였던 경우
○ Recall == 알려줬어야 하는 경우 중 실제로 알려준 경우
○ 어느 것에 focus?
● 알려줬어야하는 경우는 어떻게 설정할까?
○ 환불요청이 왔는지 안왔는지로 판단한다.
○ No need to manually label the dataset.
● 일단 Rule based 로 접근한다.
○ 해외상품인 경우 무조건 Trigger?? ⇒ 데이터를 살펴보아야한다.
모델 Develop
● 사용할만한 피쳐들에는 어떠한 것들이 있을까?
○ 유저의 현재 위치, 유저의 사용 언어, 상품별 언어, 카테고리 등등
● 학습은? Binary classifier?
● 평가는?
● 시스템은? Real-time or batch?
Coordination
● 일단 시작하고 product team 과의 조율을 해본다.
● 본인이 own 하고 있으면 제일 좋다.
● 논의를 일찍 시작할수록 좋은 결과를 내기 좋아진다 -- Side effect 가 항상
존재한다.
Meeting w/
product
Ideation 개발
중간 결과
공유
A/B Test 분석
Ideation
Ideation
Ideation
Launch 까지는?
● A/B 테스트 설계
○ 실험군과 대조군 비교
○ 불만 사항 접수, Check-out lead time 등등 다양한 비즈니스 지표도 봐야한다.
● 검증
○ 잘못된 것은 없나?
○ 분석은 보통 2D matrix 로 해야한다. User 군 x {머신러닝 지표, 비즈니스 지표}
● 피드백 반영
○ 중간 결과 공유 및 프로덕트 팀의 요구 조건 재 정리
● 문제가 Slice 가 있으면 해당 Slice 정보를 말아내는 피처를 넣는다!
○ 인터넷 속도가 느린 군에서 지표가 떨어졌나???
■ 피쳐에 평균 접속 스피드를 넣는다 ㅎㅎ
Machine learning 모델 선정
1. Generalized Linear Model
a. 디버깅이 쉽고 어디서 실패하는지 알기 쉽다.
2. Gradient Boosted Decision Tree (XGBoost)
a. 묻지마 모델인데 Powerful 하다.
3. Deep learning model
a. Context 정보를 자유롭게 넣을 수 있다.
선순환 Cycle을 잘 만들 수록 좋다!
Discussion
Question?
더 읽어볼만한 것들
● https://developers.google.com/machine-learning/guides/rules-of-ml/

Contenu connexe

Tendances

모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용Kevin Kim
 
Si 프로젝트에서 바라보는...traditional vs agile
Si 프로젝트에서 바라보는...traditional vs agileSi 프로젝트에서 바라보는...traditional vs agile
Si 프로젝트에서 바라보는...traditional vs agileKiwon Kyung
 
Non-IT 기업에서 애자일을 시작하는 방법
Non-IT 기업에서 애자일을 시작하는 방법Non-IT 기업에서 애자일을 시작하는 방법
Non-IT 기업에서 애자일을 시작하는 방법Seungbin Cho
 
Dev ops Introduction
Dev ops IntroductionDev ops Introduction
Dev ops Introduction영기 김
 
애자일을 실천하는 사람들이 겪는 어려움
애자일을 실천하는 사람들이 겪는 어려움애자일을 실천하는 사람들이 겪는 어려움
애자일을 실천하는 사람들이 겪는 어려움Bonna Choi
 
Agile Facilitation
Agile FacilitationAgile Facilitation
Agile Facilitationagilekorea
 
(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반
(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반
(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반대박성진 DaeBak.Sungjin
 
Agile Adoption Success Factors
Agile Adoption Success FactorsAgile Adoption Success Factors
Agile Adoption Success FactorsJune Kim
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화Minho Lee
 
[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실FAST CAMPUS
 
애자일 하라
애자일 하라애자일 하라
애자일 하라진수 허
 
0. review. 린과 애자일 개발
0. review. 린과 애자일 개발0. review. 린과 애자일 개발
0. review. 린과 애자일 개발Unyong (Sheldon) Choi
 
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발Jaehoon Oh
 
협업도구 및 주요 Agile practices 적용사례 v1.0
협업도구 및 주요 Agile practices 적용사례 v1.0협업도구 및 주요 Agile practices 적용사례 v1.0
협업도구 및 주요 Agile practices 적용사례 v1.0Sangcheol Hwang
 
애자일 마인드셋
애자일 마인드셋애자일 마인드셋
애자일 마인드셋Jaehoon Oh
 
BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법
BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법
BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법철민 신
 
애자일 도입과 사례 공유
애자일 도입과 사례 공유애자일 도입과 사례 공유
애자일 도입과 사례 공유agilekorea
 
애자일 안한 이야기
애자일 안한 이야기애자일 안한 이야기
애자일 안한 이야기Sungchul Park
 
개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬수보 김
 
Agile 방법론
Agile 방법론Agile 방법론
Agile 방법론Astin Choi
 

Tendances (20)

모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용모바일 앱 개발을 위한 Agile 적용
모바일 앱 개발을 위한 Agile 적용
 
Si 프로젝트에서 바라보는...traditional vs agile
Si 프로젝트에서 바라보는...traditional vs agileSi 프로젝트에서 바라보는...traditional vs agile
Si 프로젝트에서 바라보는...traditional vs agile
 
Non-IT 기업에서 애자일을 시작하는 방법
Non-IT 기업에서 애자일을 시작하는 방법Non-IT 기업에서 애자일을 시작하는 방법
Non-IT 기업에서 애자일을 시작하는 방법
 
Dev ops Introduction
Dev ops IntroductionDev ops Introduction
Dev ops Introduction
 
애자일을 실천하는 사람들이 겪는 어려움
애자일을 실천하는 사람들이 겪는 어려움애자일을 실천하는 사람들이 겪는 어려움
애자일을 실천하는 사람들이 겪는 어려움
 
Agile Facilitation
Agile FacilitationAgile Facilitation
Agile Facilitation
 
(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반
(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반
(진성리더십 특강) 일과 삶의 문제를 드라이브하라! 퍼스널 애자일, 퍼스널 칸반
 
Agile Adoption Success Factors
Agile Adoption Success FactorsAgile Adoption Success Factors
Agile Adoption Success Factors
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
 
[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실[패스트캠퍼스] 애자일에 대한 오해와 진실
[패스트캠퍼스] 애자일에 대한 오해와 진실
 
애자일 하라
애자일 하라애자일 하라
애자일 하라
 
0. review. 린과 애자일 개발
0. review. 린과 애자일 개발0. review. 린과 애자일 개발
0. review. 린과 애자일 개발
 
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
애자일 개발 프로세스를 이용한 고품질 소프트웨어 개발
 
협업도구 및 주요 Agile practices 적용사례 v1.0
협업도구 및 주요 Agile practices 적용사례 v1.0협업도구 및 주요 Agile practices 적용사례 v1.0
협업도구 및 주요 Agile practices 적용사례 v1.0
 
애자일 마인드셋
애자일 마인드셋애자일 마인드셋
애자일 마인드셋
 
BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법
BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법
BPMN과 JIRA를 활용한 프로세스 중심 업무 혁신 실천법
 
애자일 도입과 사례 공유
애자일 도입과 사례 공유애자일 도입과 사례 공유
애자일 도입과 사례 공유
 
애자일 안한 이야기
애자일 안한 이야기애자일 안한 이야기
애자일 안한 이야기
 
개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬
 
Agile 방법론
Agile 방법론Agile 방법론
Agile 방법론
 

Similaire à 애자일 머신러닝

장바구니를 든 데이터 사이언티스트
장바구니를 든 데이터 사이언티스트장바구니를 든 데이터 사이언티스트
장바구니를 든 데이터 사이언티스트Dennis Lee
 
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnABokyung Choi
 
E-commerce BigData Scale AI Journey
E-commerce BigData Scale AI JourneyE-commerce BigData Scale AI Journey
E-commerce BigData Scale AI Journeyhoondong kim
 
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오NAVER D2 STARTUP FACTORY
 
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기Hyunjung Kim
 
Things Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindDataya Nolja
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyDataya Nolja
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)Dylan Ko
 
현장에서 사용하는 Software production
현장에서 사용하는 Software production현장에서 사용하는 Software production
현장에서 사용하는 Software productionJinho Yoo
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력Youngjae Kim
 
두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략
두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략
두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략Startlink
 
12 해결한 도출
12 해결한 도출12 해결한 도출
12 해결한 도출humana12
 
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)Lab80
 
인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20KYOYOON JUNG
 
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담Juseok Kim
 
여기컨_스타트업 기획자의 월화수목금_이수지
여기컨_스타트업 기획자의 월화수목금_이수지여기컨_스타트업 기획자의 월화수목금_이수지
여기컨_스타트업 기획자의 월화수목금_이수지TechFeministgroup
 
월간 리드잇(beta) 2018년 10월호
월간 리드잇(beta) 2018년 10월호월간 리드잇(beta) 2018년 10월호
월간 리드잇(beta) 2018년 10월호Hantae John Yu
 
프라이머(등록용)
프라이머(등록용)프라이머(등록용)
프라이머(등록용)Tony park
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiIsabel Myeongju Han
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스Minwoo Kim
 

Similaire à 애자일 머신러닝 (20)

장바구니를 든 데이터 사이언티스트
장바구니를 든 데이터 사이언티스트장바구니를 든 데이터 사이언티스트
장바구니를 든 데이터 사이언티스트
 
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
 
E-commerce BigData Scale AI Journey
E-commerce BigData Scale AI JourneyE-commerce BigData Scale AI Journey
E-commerce BigData Scale AI Journey
 
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
[TMS 2018] 자금확보 / Lablup 신정규 CEO, 님아 제발 그 강을 마오
 
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
더 나은 사용자 경험과 비즈니스를 만들기 위한 프로덕트 매니저로 일하기
 
Things Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in Mind
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
 
현장에서 사용하는 Software production
현장에서 사용하는 Software production현장에서 사용하는 Software production
현장에서 사용하는 Software production
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력
 
두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략
두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략
두 번째 startlink.live: 김재홍 (xhark) - 알고리즘 문제 출제 전략
 
12 해결한 도출
12 해결한 도출12 해결한 도출
12 해결한 도출
 
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
학교에서는 배울 수 없는 스타트업 엔지니어링 (연세대 특강)
 
인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20인공지능, 머신러닝의 이해 강의자료 2019.12.20
인공지능, 머신러닝의 이해 강의자료 2019.12.20
 
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
Display Ads Platform에 대한 약간 그럴싸한 안내와 잡담
 
여기컨_스타트업 기획자의 월화수목금_이수지
여기컨_스타트업 기획자의 월화수목금_이수지여기컨_스타트업 기획자의 월화수목금_이수지
여기컨_스타트업 기획자의 월화수목금_이수지
 
월간 리드잇(beta) 2018년 10월호
월간 리드잇(beta) 2018년 10월호월간 리드잇(beta) 2018년 10월호
월간 리드잇(beta) 2018년 10월호
 
프라이머(등록용)
프라이머(등록용)프라이머(등록용)
프라이머(등록용)
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonsei
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
 

애자일 머신러닝

  • 2. Today’s contents ● ML in the wild ● 애자일 머신러닝이란? ● 예제 따라가보기 ● Discussion
  • 3. Introduction ● SNU EE B.S ● Caltech PhD ● Google Research SWE ○ 2015.08 ~ 2018.01 ● Head of Datalab, KakaoMobility ○ 2018.03 ~ Present ● 30+ Publications ● TensorFlow Lattice’s main author
  • 4. ML Service in Production Streaming MicroBatch Batch Real-time inference ● On-demand matching ● Speech recognition ● OCR Batch inference ● Supply/Demand prediction ● Traffic prediction ● Recommendation
  • 5. 카카오모빌리티 ML Service ● Real-time inference service: 6+ in production ● Batch inference service: 2+ in production ● Number of models > 1000+ ● More to come..
  • 6. ML in the wild Expectation source: https://medium.com/waymo/simulation-how-one-flashing-yellow-light-turns-into-thousands-of-hours-of-experience-a7a1cb475565 Reality
  • 7. ML in the wild
  • 8. ML in the wild 출처: Hidden Technical Debt in Machine Learning Systems, D. Sculley et. al., NIPS 2015
  • 9. 애자일 머신러닝 source: https://blog.crisp.se/2016/01/25/henrikkniberg/making-sense-of-mvp Agile 개발 방법론 ● Minimum Viable Product 중심 Agile Machine Learning? ● ML 이 만능툴은 아니다 ● 예외사항이 많으므로.. ○ Business impact를 추적하면서 빠르게.. ● It’s OKAY to use a rule-based logic!
  • 10. Typical life cycle of ML Identify the problem Collect the data Design metric & model Offline test Online test Analyze the result Go / No-go Profit!!
  • 11. 애자일 머신러닝 ● ML is a good tool -- but it’s not the only tool. ● ML forces you to look at the data and define clear performance metrics. sources: https://www.amazon.com/Thor-World-Digital-Exclusive-Bonus-Features/dp/B00HN1SVFU https://econsultancy.com/google-analytics-custom-dashboards/
  • 12. 가상의 예제: Product 고도화 해보기 K모사에서는 최근 환불 요청이 증가하고 있는 상품을 발견하였다.
  • 13. 가상의 예제: Product 고도화 해보기 K모사에서는 최근 환불 요청이 증가하고 있는 상품을 발견하였다. WHY???
  • 14. 가상의 예제: 문제 조사 ● 조사해보니 영문판인지 모르고 샀다는 경우가 많았다. ● 장바구니에 넣고 Checkout 할때 해외 상품인지 아닌지 유저에게 알려줘서 고객의 실수를 줄여줄 수는 없을까? xxx 는 해외 상품입니다. 구매하시겠습니까?
  • 15. 문제 설정 ● Metric 을 먼저 정해야한다. ○ Precision == 알려줬는데 실제로 실수였던 경우 ○ Recall == 알려줬어야 하는 경우 중 실제로 알려준 경우 ○ 어느 것에 focus? ● 알려줬어야하는 경우는 어떻게 설정할까? ○ 환불요청이 왔는지 안왔는지로 판단한다. ○ No need to manually label the dataset. ● 일단 Rule based 로 접근한다. ○ 해외상품인 경우 무조건 Trigger?? ⇒ 데이터를 살펴보아야한다.
  • 16. 모델 Develop ● 사용할만한 피쳐들에는 어떠한 것들이 있을까? ○ 유저의 현재 위치, 유저의 사용 언어, 상품별 언어, 카테고리 등등 ● 학습은? Binary classifier? ● 평가는? ● 시스템은? Real-time or batch?
  • 17. Coordination ● 일단 시작하고 product team 과의 조율을 해본다. ● 본인이 own 하고 있으면 제일 좋다. ● 논의를 일찍 시작할수록 좋은 결과를 내기 좋아진다 -- Side effect 가 항상 존재한다. Meeting w/ product Ideation 개발 중간 결과 공유 A/B Test 분석 Ideation Ideation Ideation
  • 18. Launch 까지는? ● A/B 테스트 설계 ○ 실험군과 대조군 비교 ○ 불만 사항 접수, Check-out lead time 등등 다양한 비즈니스 지표도 봐야한다. ● 검증 ○ 잘못된 것은 없나? ○ 분석은 보통 2D matrix 로 해야한다. User 군 x {머신러닝 지표, 비즈니스 지표} ● 피드백 반영 ○ 중간 결과 공유 및 프로덕트 팀의 요구 조건 재 정리 ● 문제가 Slice 가 있으면 해당 Slice 정보를 말아내는 피처를 넣는다! ○ 인터넷 속도가 느린 군에서 지표가 떨어졌나??? ■ 피쳐에 평균 접속 스피드를 넣는다 ㅎㅎ
  • 19. Machine learning 모델 선정 1. Generalized Linear Model a. 디버깅이 쉽고 어디서 실패하는지 알기 쉽다. 2. Gradient Boosted Decision Tree (XGBoost) a. 묻지마 모델인데 Powerful 하다. 3. Deep learning model a. Context 정보를 자유롭게 넣을 수 있다. 선순환 Cycle을 잘 만들 수록 좋다!
  • 21. 더 읽어볼만한 것들 ● https://developers.google.com/machine-learning/guides/rules-of-ml/