1. [Saltlux Annual Conference 2012 : 빅데이터 활용전략 세미나]
VOC 비정형 데이터 분석 사례 및 활용
문종영 수석 컨설턴트
솔트룩스 SD사업본부 컨설팅실
2012.04
2. 1일 처리 : 약 15~20만건, 월 약 340만건
SIZE : 월평균 40GB, 1년 약 500GB
(2011년 기준)
2006년 개소, 6년간 1억 1,500만건 상담, 1년 약 2천만건
(국민건강보험공단 2012.4.12)
* 2011년 민원 7천 만건
2007년 1월 시범운영, 4년 4개월간 3000만건
1일 처리량 약 4만 1천여건
(다산콜센터 2011년 6월 기준)
3. 빅데이터 정의
기업에서의 빅데이터
매일매일 다양하고 분석 가능한테라 바이트에데이터가 4V
일반적인 데이터베이스 SW가 수십-수천 규모의 달하는 기업내부에 저장 및
저장, 관리, 분석할 수 있는 거대한 데이터 집합 자체만을 지칭 규모 (Volume) : single jet 엔진
관리가 되고 그 데이터 분석을 통해 기업에 도움이 되는 의미있는 정보
범위를 초과하는 규모의 데이터 하던 말이었으나, 점차 도구, 플랫
10TB/30min
속도 (Velocity) : 하루 생산되는 트윗
폼, 분석기법까지 포괄하는 용어로 (140 byte) 8TB
추출이 가능한 데이터 변화함 다양성(Variety) : 다양하고 빠른 변화
. 가치 (Value) : 의미있는 정보의 추출
5. VOC 정의
VOC(Voice of Customer: 고객의 소리)
- 기업의 경영활동에 있어서 고객들이 기업에게
반응하는 각종 문의, 불만, 제안 등의 정보
- 고객이 기업 또는 기업에서 제공하는 상품이나
서비스에 대한 특정한 행위를 요구
(KMAC : 한국능률협회컨설팅)
6. VOC Process
등록 처리 피드백 활용
고객/직원 등록 배분 처리 만족도 조회
통계
접수 처리
지식화
7. 분석기술
Visual-
Semantics ization Statistics
(R)
Machine Text Cloud,
Learning Mining NoSQL
Crawling
NLP IR
(Search)
8. 분석 Process
분석대상 및 용어정의 및 랭킹 및 추이
특성 분석 분석 시각화
주제 선정 필터링 처리 분석
데이터 정제
자동 군집 및 사전관리 등
(개인정보 언어분석 연관도 분석
토픽 추출 도구
처리 등)
특성벡터 추출 보고서
9. 리포트
요금
접수, 처리 위주의 리포트에서
상담메모의 내용 중 ‘요금’ 또는 관련
동의어를 찾아 리포트를 제공
※ 기존 사용중인 리포트와 동기화는 되지 않으며 기존리포트에 추가적인 정보 확인
10. 추이분석
2011/12 2011/7
12월 14일 영동고속도로
A 신갈-호법간 확장 개통
B
A(확장 전) : 최고 12건 발생
B(확장 후) : 최고 2건 이하
C
C(변동량) : 최고 11건 이하 감소
※ 고속도로 확장의 효과를 교통량 분석을 하지 않고 고객이 등록 또는 요청한 내용만으로도 분석 가능
11. 연관분석
2011/12
* 2011년 12월 “영동고속도로”와
관련해서는 인천방향 만종분기점이
연관정보 중 가장 높은 이슈가 있음
※ 연관 분석을 통해 해당 기간의 주요 키워드에 대한 연관정보를 보여주고 이슈분석 가능
12. 지역별 이슈 분석
서울지역은 결과 강남, 강동을
제외한 나머지 지역에서는
‘학자금’이 주요 토픽으로 분석
ex> 업무카테고리는 “적금해약”이지
만 실제 목적은 “학자금”에 있는 것이
분석 가능
※ 각 지역 영업점 및 각종 VOC채널에서 등록한 내용을 분석하여 지역별 이슈 분석이 가능
13. 상세연관분석
• CRM과 인터넷 상담 채널을 통한 정보를 • 서울 강서지역본부의 신용카드와 연관 정 • 서울 강서지역본부의 신용카드와 체크
분석하여 서울 강서지역본부 주요토픽제공 보를 분석하여 관련 토픽을 제공 카드를 분석하여 세분화된 분석 제공
14. 고객성별 분석
VOC 내용 중에 ‘여성’이 제안 한
내용만을 분석하여 주요 토픽
제공
※ 여성을 타켓 으로 하는 상품 기획 등에 활용 가능
15. 고객 연령대별 분석
고객 등급별 불만
※ 고객의 연령대별 주요 토픽 분석과 고객 등급별 불만의 분석이 가능