SlideShare a Scribd company logo
1 of 19
MRNet-Product2Vec:
AMulti-taskRecurrentNeural
NetworkforProductEmbeddings
(2017) Arijit Biswas et al.
발표: 곽근봉
© NBT All Rights Reserved.
이논문을선정한이유
온라인 쇼핑몰에서는 딥러닝을
어떻게 활용하고 있을까?
© NBT All Rights Reserved.
이논문을선정한이유
• 상품 추천
• 상품 분류
• 중복 상품 필터링
• 적정 가격 설정
© NBT All Rights Reserved.
이논문을선정한이유
컨텐츠에서의 활용 방안과 거의 비슷!
그렇다면 딥러닝을 활용하기 위해서
상품을 어떤식으로 표현해야할까?
© NBT All Rights Reserved.
이논문을선정한이유
Product Embedding?!
© NBT All Rights Reserved.
참고 자료
저자 발표 자료
https://mukulbhutani.files.wordpress.com/2018/01/ecml-final-slides.pdf
Product Embeddings
• Prod2Vec [Grbovic, KDD 2015]
• Meta-Prod2Vec [Vasile, Recsys 2016]
© NBT All Rights Reserved.
개요
Multi-taskRNN을활용한ProductEmbedding
• 범용적으로 사용 가능한 Product Embedding
• Multi-task RNN
• Dense, Low Dimension Embedding
© NBT All Rights Reserved.
기존방법
TF-IDF
• Bag-of-words
• Title, Description 등을 단어 단위로 끊어서 사용
• 상품의 Title을 단어 단위로 끊어서 구축
• 30만개의 상품으로 구축시 dimension이 약 2만 정도 됨
• 이 중 0.05% 만이 non-zero
© NBT All Rights Reserved.
기존방법의문제점
TF-IDF
• Overfitting
• 해당 데이터셋에 특화됨. 새로운 데이터셋에 적용이 어려
움
• 계산 혹은 저장에 비효율적
• 의미를 포함시키지 못함
• 일반적인 DNN에 활용하기 어려움
© NBT All Rights Reserved.
제안하는방법
그래서Dense,Low-dimensionalEmbedding이필요함
• Bidirectional RNN
• Multi-task
© NBT All Rights Reserved.
MRNet-Product2Vec
© NBT All Rights Reserved.
MRNet-Product2Vec(BidirectionalRNN)
© NBT All Rights Reserved.
MRNet-Product2Vec(MultiTask)
© NBT All Rights Reserved.
두가지Optimization방법
• Joint Optimization
• 매 Iteration 마다 모든 task들의 loss를 구하고 한번에
weight를 업데이트 시키는 방법
• 모든 task들의 output이 있어야 가능
• Alternating Optimization
• 매 Iteration 마다 랜덤하게 하나의 task를 선정하고 그 부
분만 업데이트 시키는 방법
• Bias가 생길 수 있음
© NBT All Rights Reserved.
실험
다양한데이터셋
• Plugs : 해당 상품에 plug가 있는지 없는지
• SIOC : 자체 포장되어 있는지 아닌지
• Browse Categories : 장난감의 75가지 세부 분류
• Ingestible Classification : 먹을 수 있는지 없는지
© NBT All Rights Reserved.
실험
다양한데이터셋
© NBT All Rights Reserved.
Nearestneighbor
상품유사도분석
© NBT All Rights Reserved.
결론
• Product Embedding을 위한 새로운 방법 제안
• 다양한 feature들은 embedding에 넣을 수 있더라
• 기존 방법보다 우수한 성능을 보이면서 효율적이더라
• 상품 이미지까지 활용해서 조금 더 범용적으로 만들어봐야겠다
© NBT All Rights Reserved.
감사합니
다.

More Related Content

More from keunbong kwak

NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료keunbong kwak
 
GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representationkeunbong kwak
 
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...keunbong kwak
 
에디터스랩 발표
에디터스랩 발표에디터스랩 발표
에디터스랩 발표keunbong kwak
 
Convolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationConvolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationkeunbong kwak
 
Window manager활용하기 곽근봉
Window manager활용하기 곽근봉Window manager활용하기 곽근봉
Window manager활용하기 곽근봉keunbong kwak
 

More from keunbong kwak (7)

NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료NBT 그로스해킹 교육 자료
NBT 그로스해킹 교육 자료
 
Ad Tech 개요
Ad Tech 개요Ad Tech 개요
Ad Tech 개요
 
GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representation
 
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
딥러닝 논문 리뷰 Learning phrase representations using rnn encoder decoder for stati...
 
에디터스랩 발표
에디터스랩 발표에디터스랩 발표
에디터스랩 발표
 
Convolutional neural networks for sentence classification
Convolutional neural networks for sentence classificationConvolutional neural networks for sentence classification
Convolutional neural networks for sentence classification
 
Window manager활용하기 곽근봉
Window manager활용하기 곽근봉Window manager활용하기 곽근봉
Window manager활용하기 곽근봉
 

PR-099: MRNet-Product2Vec

  • 2. © NBT All Rights Reserved. 이논문을선정한이유 온라인 쇼핑몰에서는 딥러닝을 어떻게 활용하고 있을까?
  • 3. © NBT All Rights Reserved. 이논문을선정한이유 • 상품 추천 • 상품 분류 • 중복 상품 필터링 • 적정 가격 설정
  • 4. © NBT All Rights Reserved. 이논문을선정한이유 컨텐츠에서의 활용 방안과 거의 비슷! 그렇다면 딥러닝을 활용하기 위해서 상품을 어떤식으로 표현해야할까?
  • 5. © NBT All Rights Reserved. 이논문을선정한이유 Product Embedding?!
  • 6. © NBT All Rights Reserved. 참고 자료 저자 발표 자료 https://mukulbhutani.files.wordpress.com/2018/01/ecml-final-slides.pdf Product Embeddings • Prod2Vec [Grbovic, KDD 2015] • Meta-Prod2Vec [Vasile, Recsys 2016]
  • 7. © NBT All Rights Reserved. 개요 Multi-taskRNN을활용한ProductEmbedding • 범용적으로 사용 가능한 Product Embedding • Multi-task RNN • Dense, Low Dimension Embedding
  • 8. © NBT All Rights Reserved. 기존방법 TF-IDF • Bag-of-words • Title, Description 등을 단어 단위로 끊어서 사용 • 상품의 Title을 단어 단위로 끊어서 구축 • 30만개의 상품으로 구축시 dimension이 약 2만 정도 됨 • 이 중 0.05% 만이 non-zero
  • 9. © NBT All Rights Reserved. 기존방법의문제점 TF-IDF • Overfitting • 해당 데이터셋에 특화됨. 새로운 데이터셋에 적용이 어려 움 • 계산 혹은 저장에 비효율적 • 의미를 포함시키지 못함 • 일반적인 DNN에 활용하기 어려움
  • 10. © NBT All Rights Reserved. 제안하는방법 그래서Dense,Low-dimensionalEmbedding이필요함 • Bidirectional RNN • Multi-task
  • 11. © NBT All Rights Reserved. MRNet-Product2Vec
  • 12. © NBT All Rights Reserved. MRNet-Product2Vec(BidirectionalRNN)
  • 13. © NBT All Rights Reserved. MRNet-Product2Vec(MultiTask)
  • 14. © NBT All Rights Reserved. 두가지Optimization방법 • Joint Optimization • 매 Iteration 마다 모든 task들의 loss를 구하고 한번에 weight를 업데이트 시키는 방법 • 모든 task들의 output이 있어야 가능 • Alternating Optimization • 매 Iteration 마다 랜덤하게 하나의 task를 선정하고 그 부 분만 업데이트 시키는 방법 • Bias가 생길 수 있음
  • 15. © NBT All Rights Reserved. 실험 다양한데이터셋 • Plugs : 해당 상품에 plug가 있는지 없는지 • SIOC : 자체 포장되어 있는지 아닌지 • Browse Categories : 장난감의 75가지 세부 분류 • Ingestible Classification : 먹을 수 있는지 없는지
  • 16. © NBT All Rights Reserved. 실험 다양한데이터셋
  • 17. © NBT All Rights Reserved. Nearestneighbor 상품유사도분석
  • 18. © NBT All Rights Reserved. 결론 • Product Embedding을 위한 새로운 방법 제안 • 다양한 feature들은 embedding에 넣을 수 있더라 • 기존 방법보다 우수한 성능을 보이면서 효율적이더라 • 상품 이미지까지 활용해서 조금 더 범용적으로 만들어봐야겠다
  • 19. © NBT All Rights Reserved. 감사합니 다.