SlideShare une entreprise Scribd logo
1  sur  49
Télécharger pour lire hors ligne
A I R B N B
Aspect In Review 비교 & 분석
http://www.airbnb.co.kr
NAME
김강민 백찬규 임소현
Department
BOAZ 분석 10기
A I R B N B : Aspect In Review 비교 & 분석
주제 선정
D A T A
M O D E L
결 론
I N D E X
1. 주제선정배경
뭐 먹지?
뭐 사지?
뭐 하지?
1. 주제선정배경
리뷰 = 별점 + 텍스트
• 별점
• 가치: 파악이 쉽고 상품끼리 비교하기 용이함
• 한계: 이용자 개개인의 평점 도출 배경 알 수 없음. 구체적이지 못함
• 텍스트
• 가치: 별점만으로 파악하기 힘든 여러 측면의 정보 도출
• 한계: 한눈에 파악하기 힘듦
1. 주제선정배경
리뷰 텍스트를 분석하여
여러 측면에서 별점을 매기자
1. 주제선정배경
숙박 공유 서비스
방을 빌려준 사람을 호스트
들어가는 사람을 게스트
배낭여행자들 사이에서 인기
공유 민박업은 기존에 없던 새로운 서비스
호스트의 부재, 셀프 체크인 등 예기치 못한 문제 발생
구체적인 정보 필요(위치, 시설, 호스트 등)
1. 주제선정배경
답하고자 하는 질문들
리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ?
(비슷한 것들 많은데) 굳이 리뷰를 모두 읽어야 하나?
좀 더 효과적으로 방을 비교할 수 있는 방법은 없을까?
또다른 정보를 알아낼 수는 없을까?
D A T A
데이터 수집 및 전처리
A I R B N B : Aspect In Review 비교 & 분석
2. 데이터 설명
- 대한민국의 도시 9곳 선정 : 서울,부산,제주,서귀포,강릉,전주,대전,대구,광주,여수
- 방의 고유번호인 Listing ID 수집 -> 방에 해당하는 리뷰 크롤링
2.1 데이터 수집 : 에어비앤비 리뷰
총 32,958개
지역별 방 갯수
총 628,095개
지역별 리뷰 수
2. 데이터 설명
2.2 데이터 전처리 : 번역
언어별 리뷰 수
약 40여개 언어가 혼재, 파파고 번역기를 이용하여
전처리가 상대적으로 쉬운 영어로 번역
2. 데이터 설명
2.2 데이터 전처리
리뷰 안에는 문장
문장 안에는 단어
품사로 구분되는 단어
전 처 리 목 표
리뷰를 요약하는 단어 추출
2. 데이터 설명
1. 정규표현식 이용하여 알파벳과 숫자를 제외한 불필요한 기호들 제거
. ! ? 같이 문장이 끝나는 정보를 포함하는 기호는 남김
2. 정확한 문장 tokenizing 을 위해 정규표현식으로 띄어쓰기 보정
3. 문장 tokenizing (NLTK)
"It's very convenient.” “Many coffee shops nearby are nice."
2.2 데이터 전처리
2. 데이터 설명
4. 너무 짧은 문장은 제거
예 > ‘ha.’, ‘ Oh!’
5. 리뷰가 없는 방 제거
6. 단어 tokenizing (NLTK) 후 품사 tagging
'Many’, 'coffee’, 'shops’, 'nearby’, 'are’, 'nice’, '.'
('Many', 'JJ'), ('coffee', 'NN'), ('shops', 'NNS’),
('nearby', 'RB'), ('are', 'VBP'), ('nice', 'JJ'), ('.', '.')
2.2 데이터 전처리
2. 데이터 설명
7. ‘ 명사 형용사 동사 부사 ‘ 만 뽑고 고유명사(‘NNP’)는 선택적으로 제거
예 > 제거: ‘Henry’, ‘Kyungsoon’
제거 X: ‘Nice’, ‘Wifi’(단어의 시작이 대문자)
8. 품사별 Lemmatization(표제어 추출) 진행
예 > 동사 ‘ is ’ , ’ are ’ -> ‘ be ’
명사 ‘rooms’ -> ‘ room ’
9. 모든 단어를 소문자으로 변환
2.2 데이터 전처리
2. 데이터 설명
10. 불용어(Stop words) 제거 : 분석에 큰 의미를 가지지 못하지만 빈출하는 단어
Python NLTK에서 제공하는 stopwords 사용해 제거
Ex) I, am, a, the…
분석을 진행하며 불필요한 단어는 불용어 리스트에 지속적으로 업데이트
2.2 데이터 전처리
2. 데이터 설명
"It's very convenient.Many coffee shops nearby are nice.
Also coffee is good ☺”
[ [very, convenient]
, [coffee, shop, nearby, nice]
,[coffee, good ] ]
2.2 데이터 전처리
M O D E L
LDA / Elastic Net / LARA
A I R B N B : Aspect In Review 비교 & 분석
3. 모델
3.1 LDA : Topic modeling
리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ?
리뷰가 ‘어떤 주제(topic)’에 관한 정보인지
‘어떠한 측면(aspect)’ 을 언급하는지 알아보자
Ex) 위치, 가격, 청결도
3. 모델
3.1 LDA : Topic modeling
LDA 가정
1. 한 리뷰에는 여러 가지 주제가
포함될 수 있다.
2. 주제에는 여러 개의 단어가
포함될 수 있다.
3. 리뷰에 사용된 단어 하나하나는
어떤 주제에 포함된다.
3. 모델
3.1 LDA : Topic modeling
𝜽 = 문서의 주제 분포
Z = 단어의 주제 분포
𝝋 = 주제의 단어 분포
K = 주제의 수
D = 리뷰 문장 수
N = 문장에 속한 단어의 수
3. 모델
3.1 LDA : 지역별
내륙해안
서귀포
제주
부산
여수
대구
서울
대전
광주
전주
해안 내륙
3.1 LDA : 지역별
3. 모델
host
kind
neat
help
friendly
location
close
convenient
walk
beach
clean
comfortable
bed
everything
bathroom
stay
place
time
want
next
view
see
beautiful
floor
morning
Host
Kind
Helpful
home
Location
Station
close
Subway
bus
airport
Clean
Comfortable
Accommodation
Cozy
Spacious
Restaurant
Store
Convenience
nearby
Use
Bed
Small
Bathroom
kitchen
LDA로 도출한 지역별 주제 분포의 차이
호스트
위치
쾌적도
접근성
시설
호스트
위치
쾌적도
재방문
의사
경치
LDA로 도출한 지역별 주제 분포의 차이
해안 내륙
3.1 LDA : 지역별
3. 모델
3. 모델
3.1 LDA : Topic modeling
topic1 topic2 topic3 topic4 topic5
단어 위치 청결도 경치 재방문의사 호스트
location 0.0305 0 0 4.4-e08 0
clean 0 0.0948 0 4.6-e08 0
room 0 0 0.0674 4.5e-08 0
stay 0 0 0 0.0863 0
host 0 0 0 4.5-e08 0.0764
… …
LDA 모델의 output 예시
-> 각 단어가 토픽에서 차지하는 비중
3. 모델
3.2
각 주제에 대한 사람들의 생각, 감정을 알 수 있을까?
3. 모델
3.2 LARA: Latent Aspect Rating Analysis
▪ 별점( 𝑟𝑑 ) : 리뷰에 대한 별점
▪ Aspect : 말하고자 하는 바 (topic)
▪ Aspect 별점 ( 𝜶 𝒅 ) : 리뷰에 대한 aspect별 별점
▪ Aspect 가중치 ( 𝒔 𝒅 ) : 리뷰에 대한 aspect별 가중치
▪ LARA
‘ 별점과 리뷰 텍스트만 가지고도
aspect별 별점과 가중치를 알 수 있는’ 모델
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
별점 ( 𝑟𝑑 ) 4점
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
별점( 𝑟𝑑 ) 4점
= 청결도 × 4점 + 위치 × 5점 + 가격 × 2점
Aspect 별점 ( 𝒔 𝒅 )
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면
바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도
있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다.
별점( 𝑟𝑑 ) 4점
= 청결도 × 4점 + 위치 × 5점 + 가격 × 2점
= 0.5 × 4점 + 0.35 × 5점 + 0.125 × 2점
Aspect 가중치 ( 𝜶 𝒅 )
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
단어별 감성 극성
DTM(N*K*D)
aspect 가중치
Variance
aspect 별점
aspect 가중치의 평균
aspect 가중치 의
Variance
Aspect Segmentation
(LDA + Bootstrapping)
3.2 LARA: Latent Aspect Rating Analysis
3. 모델
3.2 Elastic Net - 감정사전 구축
다른 방법으로는
각 주제에 대한 사람들의 생각, 감정을 알 수 없을까?
3. 모델
3.2 Elastic Net - 감정사전 구축
리뷰는 텍스트,
텍스트에는 사람들의 감정이 담겨있다.
그럼 텍스트에 담긴 감정을 어떻게 정량화할 수 있을까?
텍스트에 이용된 단어들의 감정을 수치화 시킨 것이 감정사전이다.
3. 모델
3.2 Elastic Net - 감성사전 구축
감정사전은 이미 존재
But,
Domain(숙소)에 따른 감성사전 구축의 필요성
-> Elastic Net을 이용하여 에어비앤비의 감성사전을 직접 구축
3. 모델
3.2 Elastic Net - 감성사전 구축
+ = = 1 이라는 제약조건 하에서 각 값을 0과 1사이로 조절
중요한 변수를 선택할 수 있고 다중공선성 문제를 해결 가능
데이터의 관측치 수에 비해 변수의 수가 많아지면
변수들 사이의 강한 상관관계로 과적합이 발생 -> 모델 해석이 어렵고 예측력이 떨어짐
3. 모델
3.2 Elastic Net - 감성사전 구축
별점 (rating) 단어 빈도수
DTM very convenient coffee … shop nearby … nice good
review1 1 1 2 0 1 1 0 1 1
Rating
4
3. 모델
3.2 Elastic Net - 감성사전 구축
Elastic Net을 적용하여 산출한 각 회귀계수를 개별 단어의 감정 점수로 사용
별점 (rating) 단어 빈도수
3.3 감성사전 구축 - 결과
Negative Words
vocab Coefficent
challenge -2.095048
burner -0.689223
freshener -0.635682
inaccurate -0.543925
commercial -0.543383
confuse -0.521895
pyeong -0.506351
line -0.503193
furniture -0.466405
advance -0.402517
Positive Words
vocab Coefficent
hostess 0.203116
decorate 0.174437
reply 0.138483
focus 0.136315
tend 0.126949
news 0.115064
human 0.103802
perfectly 0.098851
provide 0.097512
flood 0.095992
- Elastic Net 결과 빈도수 기반으로 추려낸 2920개의 단어 중 412개 단어가 유의
3. 모델
M O D E L I N G
Scoring
A I R B N B : Aspect In Review 비교 & 분석
4. 모델링
4.1 모델 Framework
데이터
LDA
주제의
단어분포
▪ LDA output
Distribution topic1 topic2
word1 0.7 0.2
word2 0.3 0.8
4. 모델링
데이터
DTM 생성
감정사전
구축
▪ Elastic Net▪ 문서 단어 행렬
Sentiment
dictionary
Sentiment
score
word1 0.5
word2 0.3
4.1 모델 Framework
4. 모델링
데이터
LDA
DTM 생성
문서의
주제별 평점
주제의
단어분포
▪ LDA output
감정사전
구축
▪ Elastic Net▪ 문서 단어 행렬
4.1 모델 Framework
4. 모델링
각각의 topic로 Sentiment Score 도출
Sentiment
score
topic1 topic2
room1 3*0.5*0.7 + 1*0.3*0.3 = 11.4 3*0.5*0.2 + 1*0.3*0.8 = 5.4
room2 1*0.5*0.7 + 5*0.3*0.3 = 8 1*0.5*0.2 + 5*0.3*0.8 = 13
=
DTM word1 word2
room1 3 1
room2 1 5
Sentiment
dictionary
Sentiment
score
word1 0.5
word2 0.3
Distribution topic1 topic2
word1 0.7 0.2
word2 0.3 0.8
∙ ×
Elastic Net 결과
4.2 Aspect별 Scoring
LDA 결과DTM
평균 점수
해당 방의 점수
4.3 Aspect별 Scoring
4. 모델링
평균 점수
해당 방의 점수
4.3 Aspect별 Scoring - Good Case
4. 모델링
room id :1367880
평균 점수
해당 방의 점수
4.3 Aspect별 Scoring - Bad Case
4. 모델링
room id :14068358
4.4 Aspect별 Scoring - 의의
4. 모델링
- 별점과 텍스트만으로 세부 별점 도출 가능
- 본인의 선호하는 aspect를 기준으로 중요도 부여 가능
- 방 별로 상대적인 aspect별 별점 부여
4.4 Aspect별 Scoring - 한계
4. 모델링
- 긍정적인 리뷰가 대다수인 데이터 불균형
- 감정사전 직접 구축의 어려움
- 평가기준 없어 성능 평가 어려움
감 사 합 니 다

Contenu connexe

Tendances

제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘BOAZ Bigdata
 
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강Minji Kang
 
인공지능추천시스템 airs개발기_모델링과시스템
인공지능추천시스템 airs개발기_모델링과시스템인공지능추천시스템 airs개발기_모델링과시스템
인공지능추천시스템 airs개발기_모델링과시스템NAVER D2
 
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘BOAZ Bigdata
 
김령대 - 퍼포먼스 마케팅 포트폴리오
김령대 - 퍼포먼스 마케팅 포트폴리오김령대 - 퍼포먼스 마케팅 포트폴리오
김령대 - 퍼포먼스 마케팅 포트폴리오령대 김
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News DetectionBOAZ Bigdata
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천BOAZ Bigdata
 
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발BOAZ Bigdata
 
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발BOAZ Bigdata
 
2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서
2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서
2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서한국디자인진흥원 공공서비스디자인PD
 
최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안Yurim Kim
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기BOAZ Bigdata
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표Dylan Ko
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석BOAZ Bigdata
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇BOAZ Bigdata
 
PT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdf
PT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdfPT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdf
PT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdfNamhee Choi
 
누구도 알려주지 않는 크롤링의 함정
누구도 알려주지 않는 크롤링의 함정누구도 알려주지 않는 크롤링의 함정
누구도 알려주지 않는 크롤링의 함정Herren
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)Yongho Ha
 
구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례
구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례
구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례Seongyun Byeon
 

Tendances (20)

제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [시켜줘, 보아즈 명예경찰관] : 보이스피싱 탐지 알고리즘
 
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
 
인공지능추천시스템 airs개발기_모델링과시스템
인공지능추천시스템 airs개발기_모델링과시스템인공지능추천시스템 airs개발기_모델링과시스템
인공지능추천시스템 airs개발기_모델링과시스템
 
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘
제9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - 강화학습을 이용한 주식 트레이딩 알고리즘
 
김령대 - 퍼포먼스 마케팅 포트폴리오
김령대 - 퍼포먼스 마케팅 포트폴리오김령대 - 퍼포먼스 마케팅 포트폴리오
김령대 - 퍼포먼스 마케팅 포트폴리오
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [뉴진스] : Multi-modal Fake News Detection
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [쇼미더뮤직 팀] : 텍스트 감정추출을 통한 노래 추천
 
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [TweetViz팀] : 카프카와 스파크를 통한 tweetdeck 개발
 
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [주식팀] : 특정 시간대의 주가 변동 패턴을 이용한 실시간 주가 예측
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스  - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [추적 24시] : 완전 자동결제를 위한 무인점포 이용자 Tracking System 개발
 
2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서
2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서
2012 서비스디자인적용 경로당 표준모델 개발 - 디자인와우 한국디자인진흥원 최종보고서
 
최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안
 
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
제 15회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [로깅줍깅] : 로그 스트림 파이프라인 여행기
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Stalker 팀] : 감정분석을 통한 MBTI 기반 개인별 투자 성향 분석
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
 
PT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdf
PT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdfPT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdf
PT_현대카드&캐피탈_디지털캠페인_1811_sharing.pdf
 
누구도 알려주지 않는 크롤링의 함정
누구도 알려주지 않는 크롤링의 함정누구도 알려주지 않는 크롤링의 함정
누구도 알려주지 않는 크롤링의 함정
 
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
 
구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례
구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례
구름 이야기(Feat. gcp) - 구글클라우드(GCP) 활용 사례
 

Plus de BOAZ Bigdata

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack BotBOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...BOAZ Bigdata
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크BOAZ Bigdata
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작BOAZ Bigdata
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...BOAZ Bigdata
 

Plus de BOAZ Bigdata (20)

제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [백발백준] : 백준봇 : 컨테이너 오케스트레이션 기반 백준 문제 추천 봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [무드등] : 무신사를 활용한 고객 상황에 따른 의류 추천 스타일링 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [섬유유연제] : 어글리us! 스마일 Earth! : NLP 기반 프로젝트와 비즈니스 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [SPOAZ] : Spotify 기반 개인화 음악 추천 서비스 프로젝트
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [다함께 레벨업!] : 학식 예약 서비스 yammi CRM 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [HAUL의 움직이는 리포트] : 투자성향 기반 주식 추천 및 기업 정보 제공 대시보드
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [BEARS] : 이미지 캡셔닝을 통한 이모지 추천 및 해시태그 생성
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [디버깅 드래곤즈] : 실시간 채용공고 요약 Slack Bot
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [낭만젊음사람] : UDA를 통한 중환자실 급성 호흡곤란 증후군 조기 예측
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [레시피를 보아즈] : 영수증 인식 및 대화를 통한 재료 기반 레시피 추천 챗봇
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [전진 4드론] : RAD(Reinforcement learning method for ...
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [REC] : 캠핏 데이터를 활용한 캠핑장 추천 시스템 구현
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [4부터7] : 공방 301 데이터를 활용한 마케팅 방안 제시
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [유쾌한 반란] : Howmuch : 꽃집 관리 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [보아酒] : 리뷰 감정분석을 통한 전통주 추천 서비스
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [이탈리안 BMT] : 지하철 지연 시간 데이터 분석 및 시각화를 위한 데이터 파이프라인 구축
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [분모자] : 분류 모자이크
 
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
제 18회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [link-us(링커즈)] : 링키드를 위한 비즈니스 대시보드 제작
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [6시내고양포CAT몬] : Cat Anti-aging Project based Style...
 

제 9회 보아즈(BOAZ) 빅데이터 컨퍼런스 - AiRBnB : Aspect in Review 비교 & 분석

  • 1. A I R B N B Aspect In Review 비교 & 분석 http://www.airbnb.co.kr NAME 김강민 백찬규 임소현 Department BOAZ 분석 10기
  • 2. A I R B N B : Aspect In Review 비교 & 분석 주제 선정 D A T A M O D E L 결 론 I N D E X
  • 4. 1. 주제선정배경 리뷰 = 별점 + 텍스트 • 별점 • 가치: 파악이 쉽고 상품끼리 비교하기 용이함 • 한계: 이용자 개개인의 평점 도출 배경 알 수 없음. 구체적이지 못함 • 텍스트 • 가치: 별점만으로 파악하기 힘든 여러 측면의 정보 도출 • 한계: 한눈에 파악하기 힘듦
  • 5. 1. 주제선정배경 리뷰 텍스트를 분석하여 여러 측면에서 별점을 매기자
  • 6. 1. 주제선정배경 숙박 공유 서비스 방을 빌려준 사람을 호스트 들어가는 사람을 게스트 배낭여행자들 사이에서 인기 공유 민박업은 기존에 없던 새로운 서비스 호스트의 부재, 셀프 체크인 등 예기치 못한 문제 발생 구체적인 정보 필요(위치, 시설, 호스트 등)
  • 7. 1. 주제선정배경 답하고자 하는 질문들 리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ? (비슷한 것들 많은데) 굳이 리뷰를 모두 읽어야 하나? 좀 더 효과적으로 방을 비교할 수 있는 방법은 없을까? 또다른 정보를 알아낼 수는 없을까?
  • 8. D A T A 데이터 수집 및 전처리 A I R B N B : Aspect In Review 비교 & 분석
  • 9. 2. 데이터 설명 - 대한민국의 도시 9곳 선정 : 서울,부산,제주,서귀포,강릉,전주,대전,대구,광주,여수 - 방의 고유번호인 Listing ID 수집 -> 방에 해당하는 리뷰 크롤링 2.1 데이터 수집 : 에어비앤비 리뷰 총 32,958개 지역별 방 갯수 총 628,095개 지역별 리뷰 수
  • 10. 2. 데이터 설명 2.2 데이터 전처리 : 번역 언어별 리뷰 수 약 40여개 언어가 혼재, 파파고 번역기를 이용하여 전처리가 상대적으로 쉬운 영어로 번역
  • 11. 2. 데이터 설명 2.2 데이터 전처리 리뷰 안에는 문장 문장 안에는 단어 품사로 구분되는 단어 전 처 리 목 표 리뷰를 요약하는 단어 추출
  • 12. 2. 데이터 설명 1. 정규표현식 이용하여 알파벳과 숫자를 제외한 불필요한 기호들 제거 . ! ? 같이 문장이 끝나는 정보를 포함하는 기호는 남김 2. 정확한 문장 tokenizing 을 위해 정규표현식으로 띄어쓰기 보정 3. 문장 tokenizing (NLTK) "It's very convenient.” “Many coffee shops nearby are nice." 2.2 데이터 전처리
  • 13. 2. 데이터 설명 4. 너무 짧은 문장은 제거 예 > ‘ha.’, ‘ Oh!’ 5. 리뷰가 없는 방 제거 6. 단어 tokenizing (NLTK) 후 품사 tagging 'Many’, 'coffee’, 'shops’, 'nearby’, 'are’, 'nice’, '.' ('Many', 'JJ'), ('coffee', 'NN'), ('shops', 'NNS’), ('nearby', 'RB'), ('are', 'VBP'), ('nice', 'JJ'), ('.', '.') 2.2 데이터 전처리
  • 14. 2. 데이터 설명 7. ‘ 명사 형용사 동사 부사 ‘ 만 뽑고 고유명사(‘NNP’)는 선택적으로 제거 예 > 제거: ‘Henry’, ‘Kyungsoon’ 제거 X: ‘Nice’, ‘Wifi’(단어의 시작이 대문자) 8. 품사별 Lemmatization(표제어 추출) 진행 예 > 동사 ‘ is ’ , ’ are ’ -> ‘ be ’ 명사 ‘rooms’ -> ‘ room ’ 9. 모든 단어를 소문자으로 변환 2.2 데이터 전처리
  • 15. 2. 데이터 설명 10. 불용어(Stop words) 제거 : 분석에 큰 의미를 가지지 못하지만 빈출하는 단어 Python NLTK에서 제공하는 stopwords 사용해 제거 Ex) I, am, a, the… 분석을 진행하며 불필요한 단어는 불용어 리스트에 지속적으로 업데이트 2.2 데이터 전처리
  • 16. 2. 데이터 설명 "It's very convenient.Many coffee shops nearby are nice. Also coffee is good ☺” [ [very, convenient] , [coffee, shop, nearby, nice] ,[coffee, good ] ] 2.2 데이터 전처리
  • 17. M O D E L LDA / Elastic Net / LARA A I R B N B : Aspect In Review 비교 & 분석
  • 18. 3. 모델 3.1 LDA : Topic modeling 리뷰를 쓸 때, 중요하게 생각하는 주제는 무엇일까 ? 리뷰가 ‘어떤 주제(topic)’에 관한 정보인지 ‘어떠한 측면(aspect)’ 을 언급하는지 알아보자 Ex) 위치, 가격, 청결도
  • 19. 3. 모델 3.1 LDA : Topic modeling LDA 가정 1. 한 리뷰에는 여러 가지 주제가 포함될 수 있다. 2. 주제에는 여러 개의 단어가 포함될 수 있다. 3. 리뷰에 사용된 단어 하나하나는 어떤 주제에 포함된다.
  • 20. 3. 모델 3.1 LDA : Topic modeling 𝜽 = 문서의 주제 분포 Z = 단어의 주제 분포 𝝋 = 주제의 단어 분포 K = 주제의 수 D = 리뷰 문장 수 N = 문장에 속한 단어의 수
  • 21. 3. 모델 3.1 LDA : 지역별 내륙해안 서귀포 제주 부산 여수 대구 서울 대전 광주 전주
  • 22. 해안 내륙 3.1 LDA : 지역별 3. 모델 host kind neat help friendly location close convenient walk beach clean comfortable bed everything bathroom stay place time want next view see beautiful floor morning Host Kind Helpful home Location Station close Subway bus airport Clean Comfortable Accommodation Cozy Spacious Restaurant Store Convenience nearby Use Bed Small Bathroom kitchen LDA로 도출한 지역별 주제 분포의 차이
  • 24. 3. 모델 3.1 LDA : Topic modeling topic1 topic2 topic3 topic4 topic5 단어 위치 청결도 경치 재방문의사 호스트 location 0.0305 0 0 4.4-e08 0 clean 0 0.0948 0 4.6-e08 0 room 0 0 0.0674 4.5e-08 0 stay 0 0 0 0.0863 0 host 0 0 0 4.5-e08 0.0764 … … LDA 모델의 output 예시 -> 각 단어가 토픽에서 차지하는 비중
  • 25. 3. 모델 3.2 각 주제에 대한 사람들의 생각, 감정을 알 수 있을까?
  • 26. 3. 모델 3.2 LARA: Latent Aspect Rating Analysis ▪ 별점( 𝑟𝑑 ) : 리뷰에 대한 별점 ▪ Aspect : 말하고자 하는 바 (topic) ▪ Aspect 별점 ( 𝜶 𝒅 ) : 리뷰에 대한 aspect별 별점 ▪ Aspect 가중치 ( 𝒔 𝒅 ) : 리뷰에 대한 aspect별 가중치 ▪ LARA ‘ 별점과 리뷰 텍스트만 가지고도 aspect별 별점과 가중치를 알 수 있는’ 모델
  • 27. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 3.2 LARA: Latent Aspect Rating Analysis
  • 28. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 별점 ( 𝑟𝑑 ) 4점 3.2 LARA: Latent Aspect Rating Analysis
  • 29. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 별점( 𝑟𝑑 ) 4점 = 청결도 × 4점 + 위치 × 5점 + 가격 × 2점 Aspect 별점 ( 𝒔 𝒅 ) 3.2 LARA: Latent Aspect Rating Analysis
  • 30. 3. 모델 숙소가 사진이랑 완전 똑같았고 사진처럼 정말 깨끗했습니다. 나와서 건물 하나만 지나면 바로 해운대 백사장이 있어서 저녁에 산책하기에도 너무 좋았고 주변에 편의시설도 있었습니다. 하지만 가격이 비싸서 조금 아쉬웠습니다. 별점( 𝑟𝑑 ) 4점 = 청결도 × 4점 + 위치 × 5점 + 가격 × 2점 = 0.5 × 4점 + 0.35 × 5점 + 0.125 × 2점 Aspect 가중치 ( 𝜶 𝒅 ) 3.2 LARA: Latent Aspect Rating Analysis
  • 31. 3. 모델 단어별 감성 극성 DTM(N*K*D) aspect 가중치 Variance aspect 별점 aspect 가중치의 평균 aspect 가중치 의 Variance Aspect Segmentation (LDA + Bootstrapping) 3.2 LARA: Latent Aspect Rating Analysis
  • 32. 3. 모델 3.2 Elastic Net - 감정사전 구축 다른 방법으로는 각 주제에 대한 사람들의 생각, 감정을 알 수 없을까?
  • 33. 3. 모델 3.2 Elastic Net - 감정사전 구축 리뷰는 텍스트, 텍스트에는 사람들의 감정이 담겨있다. 그럼 텍스트에 담긴 감정을 어떻게 정량화할 수 있을까? 텍스트에 이용된 단어들의 감정을 수치화 시킨 것이 감정사전이다.
  • 34. 3. 모델 3.2 Elastic Net - 감성사전 구축 감정사전은 이미 존재 But, Domain(숙소)에 따른 감성사전 구축의 필요성 -> Elastic Net을 이용하여 에어비앤비의 감성사전을 직접 구축
  • 35. 3. 모델 3.2 Elastic Net - 감성사전 구축 + = = 1 이라는 제약조건 하에서 각 값을 0과 1사이로 조절 중요한 변수를 선택할 수 있고 다중공선성 문제를 해결 가능 데이터의 관측치 수에 비해 변수의 수가 많아지면 변수들 사이의 강한 상관관계로 과적합이 발생 -> 모델 해석이 어렵고 예측력이 떨어짐
  • 36. 3. 모델 3.2 Elastic Net - 감성사전 구축 별점 (rating) 단어 빈도수 DTM very convenient coffee … shop nearby … nice good review1 1 1 2 0 1 1 0 1 1 Rating 4
  • 37. 3. 모델 3.2 Elastic Net - 감성사전 구축 Elastic Net을 적용하여 산출한 각 회귀계수를 개별 단어의 감정 점수로 사용 별점 (rating) 단어 빈도수
  • 38. 3.3 감성사전 구축 - 결과 Negative Words vocab Coefficent challenge -2.095048 burner -0.689223 freshener -0.635682 inaccurate -0.543925 commercial -0.543383 confuse -0.521895 pyeong -0.506351 line -0.503193 furniture -0.466405 advance -0.402517 Positive Words vocab Coefficent hostess 0.203116 decorate 0.174437 reply 0.138483 focus 0.136315 tend 0.126949 news 0.115064 human 0.103802 perfectly 0.098851 provide 0.097512 flood 0.095992 - Elastic Net 결과 빈도수 기반으로 추려낸 2920개의 단어 중 412개 단어가 유의 3. 모델
  • 39. M O D E L I N G Scoring A I R B N B : Aspect In Review 비교 & 분석
  • 40. 4. 모델링 4.1 모델 Framework 데이터 LDA 주제의 단어분포 ▪ LDA output Distribution topic1 topic2 word1 0.7 0.2 word2 0.3 0.8
  • 41. 4. 모델링 데이터 DTM 생성 감정사전 구축 ▪ Elastic Net▪ 문서 단어 행렬 Sentiment dictionary Sentiment score word1 0.5 word2 0.3 4.1 모델 Framework
  • 42. 4. 모델링 데이터 LDA DTM 생성 문서의 주제별 평점 주제의 단어분포 ▪ LDA output 감정사전 구축 ▪ Elastic Net▪ 문서 단어 행렬 4.1 모델 Framework
  • 43. 4. 모델링 각각의 topic로 Sentiment Score 도출 Sentiment score topic1 topic2 room1 3*0.5*0.7 + 1*0.3*0.3 = 11.4 3*0.5*0.2 + 1*0.3*0.8 = 5.4 room2 1*0.5*0.7 + 5*0.3*0.3 = 8 1*0.5*0.2 + 5*0.3*0.8 = 13 = DTM word1 word2 room1 3 1 room2 1 5 Sentiment dictionary Sentiment score word1 0.5 word2 0.3 Distribution topic1 topic2 word1 0.7 0.2 word2 0.3 0.8 ∙ × Elastic Net 결과 4.2 Aspect별 Scoring LDA 결과DTM
  • 44. 평균 점수 해당 방의 점수 4.3 Aspect별 Scoring 4. 모델링
  • 45. 평균 점수 해당 방의 점수 4.3 Aspect별 Scoring - Good Case 4. 모델링 room id :1367880
  • 46. 평균 점수 해당 방의 점수 4.3 Aspect별 Scoring - Bad Case 4. 모델링 room id :14068358
  • 47. 4.4 Aspect별 Scoring - 의의 4. 모델링 - 별점과 텍스트만으로 세부 별점 도출 가능 - 본인의 선호하는 aspect를 기준으로 중요도 부여 가능 - 방 별로 상대적인 aspect별 별점 부여
  • 48. 4.4 Aspect별 Scoring - 한계 4. 모델링 - 긍정적인 리뷰가 대다수인 데이터 불균형 - 감정사전 직접 구축의 어려움 - 평가기준 없어 성능 평가 어려움
  • 49. 감 사 합 니 다