SlideShare une entreprise Scribd logo
1  sur  37
Télécharger pour lire hors ligne
빅데이터의 활용 
2014.09 
김수보(@subokim), eBrain Academy 소장 
http://subokim.wordpress.com 
kimsubo@gmail.com
주요 내용 
2 
1st 
빅데이터의 
이해 
2nd 
분야별 
동향 
3rd 
비즈니스 
기회 
1. 들어가면서 
• 왜 등장했나? 
• 누가 왜 하고 있나? 
• 꼭 필요한가? 
2. 기술 흝어보기 
• 비즈니스 특징 
• 가능해진 것 
• 아직 어려운 것들 
3. 사업적 이해 
• 가능한 사업들 
• 어려운 사업들 
4. 금융분야 
• 카드, 보험, 은행, 증권 
5. 제조분야 
• 생산설비, 생산공정, 가전제품 
6. 건설분야 
• 안전관리 
7. 에너지분야 
• 발전설비, 전력운용, 전력거래 
8. 의료분야 
• 의료보험, 치료분야, 예방분야 
9. 유통분야 
10. CRM과의 차이점 
11. 시장접근전략
빅데이터의 이해 
3
1. 들어가면서 
사회적 주목 죽음의 계곡 사업이 안정화되는 시기 
Gartner's 2014 Hype Cycle for Emerging Technologies Maps 
4
1. 빅데이터의 이해 / 왜 등장했나? 
• Server : sun sparc parallel processing etc. 
• Storage : SAN or NAS 
• Database : Oracle 
• 높은 처리기술 비용으로 데이터 활용 어려움 
5
1. 빅데이터의 이해 / 왜 등장했나? 
• 2005.4.1 1주년 기념 1인당 1GB에서 용량이 점차 증가 
• ‘구글은 사람들한테 더 많은 용량을 영원히 줄 것이다.’ - 조지 해릭 
• 1인당 15GB * 2.7 억명 (‘12.12) 
= 4.05 Exa Bytes = 4,050 Terra Bytes = 4,050,000 Giga Bytes 
• 메일 검색, 분류, 태그 
 Backend 인프라의 복잡성 증가 
• 가입자 12억명 
• 일 250 Terra Bytes 이상 데이터 처리 
• 25억개의 컨텐츠 공유 
• 가입자 5억명 
• 일 평균 7,000만건 트윗 
• 누적 143억건 이상 
6
1. 빅데이터의 이해 / 왜 등장했나? 
7 
x86 서버 기반 클라우드 + 
가상화 스토리지 + 
오픈소스 병렬처리 SW 
“구글 클라우드 서버” 
임대형 클라우드 사업자의 등장 
2008 뉴욕타임즈 디지털 변환 프로젝트 
• Mission : 스캔 후 pdf 로 저장 
• 분량 : 1,100만 장 (130년 어치) 
• 작업예상 : 일반서버 14년 소요, 4 TB, 100만 달러 
• AWS이용 : 1일, 250달러
1. 빅데이터의 이해 / 왜 등장했나? 
8 
고민의 
시작 
• 불특정 다수 + 대량 고객 
• 예측이 어려운 널뛰기식 트래픽 
• 광고비 중심의 인터넷 서비스 사업 
• 낮은 SW 유지보수 비용 
 오픈소스, 클라우드, 비싼 개발자 
 DevOps, Agile 
해법 
• 검색어 기반 맞춤형 배너광고 서비스 (Google Adsense) 
• 인터넷 서비스에 개인화 기능 강화 
• 고객 분석 및 타겟 마케팅 응용 
사업 
가치 
• B2C 기반 인터넷 비즈니스에서 출발 
• 현재는 기술이 비즈니스를 리딩함 
 소프트웨어 엔지니어의 역할이 큼 
특징
1. 빅데이터의 이해 / 누가 왜 하고 있나? 
9 
미국 
영국 
일본 
사회적 비용의 감소 
 안전 분야 위험예측 
 의료 서비스 품질 개선 
공공 서비스 품질의 개선 
 국방정보력의 강화 
 유행질병 사전 대응 
사회적 부가가치 인프라 
 고급 정보를 싸게 제공 
 기업 및 민간단체의 활용권장
1. 빅데이터의 이해 / 누가 왜 하고 있나? 
• Siri – 음성 데이터 수집 후 패턴 분석 
• 사용자 추천서비스 – In-App 광고 
• 소비자 분석 – 결제, 개인 취향 등 예측 
• 서비스 직접 품질의 개선 
• 타겟 마케팅 
• 사용자 분석 
• 음성인식, 자연어 검색, 지도검색 
• 사용자 추천서비스 – Adsense 광고 
• 사용자 분석 – Google Analytics 
• 서비스 직접 품질의 개선 
• 타겟 마케팅 
• 사용자 분석 
• 오픈정책 
10 
자사 제품의 
인프라로 활용 
자사 제품의 
인프라로 활용 
+ 
오픈정책
1. 빅데이터의 이해 / 누가 왜 하고 있나? 
11 
정보공개+ 
데이터개방+ 
맞춤형서비스
1. 빅데이터의 이해 / 누가 왜 하고 있나? 
• 무선사업부, MSC, VD사업부 
• 반도체 사업부 등 글로벌 빅데이터 
• Oracle, EMC, IBM 등 솔루션 PoC, ISP 수립 
• 2011 ~ 
12 
Naver 
삼성전자 
KT 
SKT 
빅데이터 
• 검색질의 일 2,000만건 
• 문서 일 130억건 
• 검색로그 3TB/일 
• 2008 ~ 
NCSoft 
• 분석로그 일 1TB 
• 분석대상 1.6 PB 
• MS-SQL  Hadoop 기반 
• 2010 ~ 2013 완성 
• 이동통신 망품질개선 
• olleh tv 사용자 분석 등 
• 오픈빅데이터, 2013.5.13 
• ICT 개방 1조2,000억 투자(3년간) 
• 2010 ~ 
정부3.0 
• data.go.kr, 공공정보 연계(’12년 10억 Call) 
• 12.12 ~ 13.03 빅데이터 BPR/ISP 정책수립 
• 13.09 미래부 빅데이터 분석 활용센터 구축 
자사 서비스 
개선 및 강화 
(시험도입) 
대외 비즈니스용 
(실험단계) 
행정 효율화 
(활용검토) 
Daum 
쿠팡 
GS 
홈쇼핑 
티몬 
기타 
등등 
LG전자 하이 
닉스 
현대자동차 
SKT 
금융권 
등등
1. 빅데이터의 이해 / 꼭 필요할까? 
13 
클라우드 
불가분 
• 클라우드 도입확산에 따른 필수 동반 기술 
서버비용의 절감  클라우드 도입  
운영관리 효율화 필요  빅데이터 기반 운영 인프라 도입 
• 과학적 마케팅에 대한 욕구 
 마케팅 비용의 효율적 효과적 사용 욕구가 큼 
• 과학적 전략 수립 욕구 
 고객 연구 및 전략 수행 결과 탐구 
• 기존 프로세스 개선 욕구 
 제조 : 수율향상, 오류 사전탐지 
 유통 : 배송 효율화 
기업필수 
인프라 
직접 생산 설비보다 
‘간접 생산 설비’ 및 ‘지원 시스템’으로의 위상 확립 중
2. 기술 흝어보기 / 비즈니스 특징 
기술 시장 
14 
• 오픈소스 기반의 요소기술 
- 각 요소 기술의 수준이 천차만별 
- 숙련된 개발자 확보가 필수 
• 기술 솔루션 + 빅데이터 요소기술 (경쟁시장) 
- CRM, 로그분석 등 기존 솔루션의 취약점 보완 
- 대표주자 : Splunk, Oracle 
• 신규 시장 창출 (초기시장) 
- 차별화된 분석기법 탐구, 기술이 시장을 선도
2. 기술 흝어보기 / 가능해진 것 
15 
전수조사 
지속적 데이터 
누적 활용 
통계정확성 
향상 
Before After 
• 경찰청 : 범죄자 정보, 범죄자 DNA 정보 
• 노선정보: 심야버스 이용노선정보 
• 인구통계: 인구이동 및 출생,사망 정보 
• 이통사 : 통화이력 정보 
 샘플링에 따른 누락 발생 
• 경찰청 : 범죄이력 정보 
• 의료정보 : 개인별 진료기록 정보, 
질병환자 DNA 정보 
• 국토부 : CCTV 정보 
• 기상청 : 기상이력 정보 
 파편화된 데이터 분석 
• 지자체 : BIS 이력정보 
• 내비게이션 회사 : 도로 정체 이력 정보 
 부정확한 가공정보 
• 일괄처리식 전수 조사 및 분석 가능 
• 실시간 전수 조사 가능 
오류 및 특이 데이터 감지 
방대한 관계 분석이 가능 
• 이력기반의 면밀한 정보 분석 
시계열 기법의 정밀도 상승 
예측 정확도가 높아짐 
• 정보 가공의 신뢰도가 높아짐 
정보 활용범위가 넓어짐
2. 기술 흝어보기 / 아직 어려운 것들 
16 
여행가형 
• 무작위로 많은 데이터를 조사함 
• 같은 데이터를 두 번 찾지 않음 
• 요구사항이 무엇인지 알지 못함 
• 메타 데이터를 많이 사용 
• 정기적으로 데이터를 모니터링 
• 정기적으로 대규모 데이터를 상세히 검토 
• 산발적으로 데이터를 사용 
• 프로파일링 툴에 의존 
• 심화 탐구를 위한 영역을 이따금 조사 
농부형 
• 정기적으로 데이터 접속 
• 무엇을 찾고 있는지 인지하고 있음 
• 대규모 데이터에 접속 
• 데이터에 예측가능한 접속 
• 데이터에 접속한 후 예측 가능한 처리 시행 
• 데이터 조회 시작 전에 요구사항을 인지하고 있음 
• 정기적으로 데이터 마트에 접속 
• 거의 현재 시점의 상세 데이터에 접속하지 않음 
• 정기적으로 소규모의 황금조각을 발견 
• 프레젠테이션 툴을 사용 
탐험가형 
• 데이터에 비정기적으로 접속 
• 무엇을 찾는지 알지 못함 
• 대량의 데이터를 조사 
• 예측 불가능한 유형의 접근 
• 때때로 큰 금덩어리를 발견 
• 종종 아무것도 찾지 못함 
• 정기적으로 현재 시점의 상세 데이터에 접근 
• 데이터 발생보다 데이터 관계성을 검토 
• 탐구와 통계적 분석 툴을 사용 
광부형 
• 통계학자 
• 주장에 대한 가설을 바탕으로 수행 
• 가설의 타당성을 입증 
• 대량의 데이터로 수행 
• 반복적으로 발생하는 독립 데이터로 수행 
• 공생방식으로 탐험가와 긴밀히 협업 
• 종종 새로운 가설과 주장을 발견 
• 아주 큰 쿼리를 제출 
• 업무에 특화된 툴을 사용 
빅데이터 기반 분석 기법 발굴 연구 필요
2. 기술 흝어보기 / 아직 어려운 것들 
17 
응용 SW 부족/ 비쌈 
HW 엔지니어링 연구 부족 
HW 엔지니어링 연구 부족 
Hadoop 기반 기술은 아직 SI 영역 
물리적 서버 분산 및 관리기술은 진화중 
관계형 연산처리에는 RDB가 가장 적합
3. 사업적 이해 / 가능한 사업들 
대분류 가능한 사업분야 예 시 특징 
18 
IT 용역 솔루션 컨설팅 및 구축 
용역 
OO 보험사 부정청구 탐지 시스템 고도화 
용역 
SAS, Oracle Exa 등 
B2B 비즈니스 중심 
HW 엔지니어링 빅데이터 서버 트러블슈팅 관련 특수분야 전문 엔지니어 비즈니스 
예상 
제품개발 응용 SW 패키지 개발 운영자 편의 도구(ex. 편리한 하둡 관리자) 
빅데이터 기반 전용 검색 엔진 
사용자 추천 및 분석 WYSWYG 도구 
상업용 패키지 
초기 시장 
오픈소스 기반 전략 
전용 제품 개발 초고속 염기서열 분석기 (병렬처리 기술 
활용) 
반도체 생산공정 모니터링 시스템 
바이털 사인 예측 감시 인큐베이터 
산업 기술 융합 필요 
블루 오션 
외산 주도 예상 
IT 서비스 인터넷 기반 
데이터 분석 및 
리포팅 서비스 
월간 IT 동향 연구 리포트 
지방 선거 긍정 부정 분석 
데이터 분석가 필요 
비정형 분석 기법 발달 
현 검색엔진 회사 중심 
고가의 전문 분석 시장 예상 
인터넷 기반 
마케팅 대행 서비스 
디지털 광고, 홍보 대행 서비스 
특정 제품 온라인 판매 대행 서비스 
플랫폼 비즈니스 
현 쇼핑몰 비즈니스 
전문 대행사 등장 예상
3. 사업적 이해 / 어려운 사업들 
19 
시장의 어려움이자 기회 
고객 데이터 분석 
아웃소싱 서비스 
Full Solution 제공 
• 고객 데이터 = 전략데이터 + 개인정보 = 중요 보안 데이터 
• 데이터를 열어서 외부인에게 보여줄 회사는 없다. 
• 아웃소싱을 할 바에야 분석하지 않는다. (기회 손실이 너무 큼) 
• 고객은 반제품 기반의 솔루션 구축보다 패키지 구매 방식을 선호 
• 고객이 보유한 데이터 형태는 다양하다. 
• 누구나 빅데이터를 가지고 있지 않다. 
• 모든 고객을 만족시켜줄 수 있는 은탄환은 없다. 
• Full Solution을 말할만큼 시장이 성숙하지 않았다.
분야별 동향 
20
4. 금융분야 / 카드, 보험 
21 
현대카드 
소비자 카드 이용 패턴 조사 
보험사기 위험 분석
4. 금융분야 / 은행, 해외 
수신 여신 
외환 기타 
22 
국내은행분야 
(도입검토 단계) 
여신 업무에 활용 
 대출상환 50% 이상 
투자자 유치 및 관리 
 투자정보 보고서 
 부동산 시세 기준자료 
자영업자 대출상품 개발 
 유치비용 감소 
 수익성 향상
5. 제조분야 / 자동차 
23 
생산공정 
품질관리 
VCRM 
운행정보 
수집관리 
• 파일럿 프로젝트 (2013.12 ~) 
- 테라데이터,오라클 등 
- kt 넥스알 
• 도요타 
- 빅데이터 교통정보서비스(2013.6) 
- 커넥티드 카 서비스 개선 
• 포드 
- 운전패턴, 환경 별 차량 상태정보 
- 74개 센서, 400만대, 일 6TB정보 
- 실리콘밸리 빅데이터 연구소(2013)
5. 제조분야 / 반도체 
24 
생산공정 
품질관리 
2014.07 SK C&C 착수 
• 반도체 수율관리 공정 적용 
기존 MMDB 기반 
샘플링을 활용한 수율분석 
하둡기반 기술 
전수데이터 실시간 수율분석
6. 건설분야 / 국토부 
25 
• IBS 지원 시스템 (검토단계) 
- 에너지 사용 효율화 
- 건물 안전 
• 지능형 고속도로 
- 도로 센서 정보 수집 
- 예측 및 사고알림 
- 빠른 길 탐지 등 
- 실시간으로 스마트차량과 통신
7. 에너지분야 / 발전소 
• 2015년까지 ICT를 접목한 스마트 발전소 化 
• 발전소 운영 및 건설정보 대상 빅데이터 구축 
• 전체 비용의 80% 연료비  효율화 기대 
26
7. 에너지분야 / 스마트그리드 
27 
• 스마트 그리드 종합운영 시스템 도입 
- 선로부하 평준화, 전력손실 최소화 
- 송변전, 배전, 영업 등 14종 시스템 통합 
• 전력 수요 예측 
- 기상청, 날씨와 전력수요 예측 
- 지역별, 용도별, 시간대별 전력수요분석 
- 탄력적 전력 공급계획
8. 의료분야 / 시장개요 
대상 데이터 서비스 주요 기술 
28 
Wellness Market 
Data • 개인 건강이력정보 
• 개인 생활이력정보 
• 가족기록 정보 
Device • 개인 모바일 기기 
• 가정용 기기 
Illness Market 
분석서비스 • Device로부터 획득한 정보, 
개인정보를 바탕으로 식이영 
양 및 건강운동 정보 제공 
처방서비스 • 분석에 따른 영양 불균형 
및 건강 불균형에 대해 처방 
생체정보 
모니터링기술 
• 생체신호 처리기술 
• 의료영상 처리기술 
일상생활 
모니터링 기술 
• 생활센서 처리기술 
• 행위정보 분류 
• 생활패턴 가시화 
U-Health 
응용기술 
• 임상결정지원기술 
• 응용서비스 프로토콜 
• 의료정보 보호 
• 시험 및 인증 
데이터 
분석기술 
• 빅데이터 기술 
• 질병 데이터 분석 기술 
• 생활건강정보 분석 기술 
대상 데이터 서비스 
Data • 질병정보 
• DNA 정보 
• 치료이력 정보 
• 진료환경 정보 
• 임상 실험정보 
Device • 질병 진단 기기 
진료서비스 • 질병 정보와 PHR을 바탕으 
로 효과적이고 개인화된 질 
병 진단 
치료서비스 • PHR의 변화를 기반으로 한 
장기적, 단기적 치료서비스 
제공 
예방서비스 • 데이터에 기반한 질병확률 
중심의 예방 서비스 제공 
임상실험 • 신약 개발 및 치료제 개발
8. 의료분야 / 보험, 병원 
29 
분당서울대병원 
• 질병관리 및 부정탐지 
- 허위 진료비 청구 탐지 
- 유행질병 사전 감지 
- 질환별, 지역별 약처방 패턴 
• 차세대임상데이터웨어하우징 
- 약물부작용 의료사고 방지 
- 누적 진료기록 60 TB 
- 외래 840만건, 입원40만건, 
수술 25만건 
- 조회시간 10분  10초로 단축
8. 의료분야 / 유전자분석 서비스 
현재 유전자 분석 서비스는 다음과 같이 9 단계를 거칩니다. 
병목구간은 이미지캡쳐를 하는 부분과 염기서열을 분석하는 단계입니다. 
클라우드 기반 빅데이터 기술은 염기서열 분석 시간을 획기적으로 단축할 수 있게 만들었습니다. 
30 
• 쪼개진 DNA 조각들을 퍼즐 맞추기. 
• 1인 26개 염기쌍 
- 1개 염색체 약 50MB * 26개 = 총용량 1.3GB 
• 기존 약 1달 소요, 비용 1천만원 
 2011. 고속 병렬처리 컴퓨팅 시 2~5일 소요 
 2012. 초고속 처리의 경우 5시간 내 가능 
(BGI 이지게노믹스) 
• 판정 비교기준 : 기 질병샘플 활용(의료진) 
- 암관련 유전자 300~600개 
표1. 유전자 프로필 검사 및 판정과정 
검사의뢰 및 
시료접수 
시료채취 
(모근, 구강상피 
세포, 혈액 등) 
DNA 추출 
PCR product 
전기영동 
PCR 증폭 DNA 정량 
결과 분석 
및 편집 
자동서열 분석기 
를 이용한 결과 
분석및 판정 
판정결과 통보 
및 판정서 발송 
※ 출처 : 김욱 교수, 생명과학과, 단국대학교 
※ 출처 : 인터넷 조사
8. 의료분야 / 자동염기서열분석기 
제품명 
• Model : ABI PRISM 3130xl Genetic Analyzer 
• 제조사 : Applied Biosystems(Hitachi high techonology), Japan 
제공기능 
• Holds Loss of Heterozygosity 
유전자 증폭기술을 이용하여 LOH의 표지가 되는 microsatellite의 대립 유전자 
의 결손 여부를 확인 
• Micorsatellite instability 
대장암 환자의 경우 암조직과 정상 조직을 분리해 MSI 유전자 검사 실시 
• 친자확인 12시간 
• 모계혈족검사 3일 
31 
• Trisomy 
삼염색체성 다운증후군을 유전자 증폭기술을 이용하여 손쉽게 진단 
• Fragile X 
유전성 정신지체의 질환으로 삼핵산 반복서열 CGG의 증폭의 반복수로 검증 
• Human Identification 
• Paternity test 친자 확인 가능 
주요소요시간 
※ 출처 : 전남대학교 의생명연구원
8. 의료분야 / 장비인프라 
Location Cores Memory Storage T flops 
쓰촨성 11,000 22TB 8.88PB 117T flops 
홍콩 7,776 9.7TB 8.515PB 83T flops 
베이찡 300 500GB 162TB 1.5T flops 
우환 1760 500GB 1PB 4T flops 
미국1 300 800GB 500TB 2T flops 
미국2 300 800GB 500TB 2T flops 
덴마크 600 1.6TB 1PB 4T flops 
합계 22,036 35.9TB 20.6PB 214T flops 
Illumina HiSeq 고성능 병렬처리에 기반한 기반기술 
AB SOLiD System 병렬처리를 위한 소프트웨어 플랫폼 
32 
BGI 
병렬처리를 위한 자체 클라우드 
인프라 보유 
AB SOLiD System 
베이징게놈연구소(이하 BGI)는 Nvidia 사의 테슬라 GPU를 기반으로 
한 클라우드 인프라를 활용해 기존 분석시간을 5일  5시간으로 단축 
컴퓨팅 
파워 
주요 
기술 
사업 
현황 
플랫폼 주요내용 
Ion Torrent 사후분광처리기술 
• 2012년 EasyGenomics 서비스 출시 
• 약 156대의 Sequencing 기계 보유 
• 생물정보학자 1,000명 보유 (전세계 DNA 데이터의 10-20% 생산) 
• 돼지복제센터, 줄기세포연구, 진단관련 연구 포함 
(※ 출처 : MIT Technology Review, 2013)
9. 유통분야 
배송경로 최적화  배송시간 단축, 물류비용 감소 
33
비즈니스 기회 
34
10. CRM과의 차이점 
35 
가설 모델 
마트 
구축 
수집 분석 리포팅 
수집 탐색 발견 가설 분석 리포팅 
CRM 
프로세스 및 
비즈니스 
빅데이터 
프로세스 및 
비즈니스 
통계전문가 + 현업담당자 SW 영역 현업 담당자 
SW 영역 데이터 탐색가 
(현업담당자) 
통계전문가 + 
현업담당자 + 
SW 엔지니어 
현업 담당자 
업무가 정형화되지 않았고 최적화된 SW가 아직 존재하지 않는 시장
11. 시장접근 전략 
36 
기억할 것 
조심해야 할 것 
• 기술보다 비즈니스 특성이 중요하다. 
- 산업분야별로 필요한 부가 기술이 상이함 
• 비즈니스의 고민을 해결하기 위한 기술을 선택 
- 데이터 분석 및 탐색가의 역할이 매우 중요 
- 고민 해결책을 발견하기 위한 최적의 인프라 
• 기대수준, 목적에 대한 비즈니스 컨설팅 필수 동반 
- 목적을 이해하지 못하면 플랫폼 도입실패 가능성 높음. 
- 기대수준이 다르면 엉뚱한 결과에 도달 
• 은탄환은 없다. 대량 판매가 어려운 사업이다. 
- 데이터 분석을 통해 혁신이 일어나야 가치를 인정받음 
- 성공가치를 입증하기 쉽지 않음
질의 응답 
37

Contenu connexe

Tendances

지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)
지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)
지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)Myungjin Lee
 
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)Amazon Web Services Korea
 
[창업자&예비창업자] 2019년 스타트업 마케팅
[창업자&예비창업자] 2019년 스타트업 마케팅[창업자&예비창업자] 2019년 스타트업 마케팅
[창업자&예비창업자] 2019년 스타트업 마케팅더게임체인저스
 
[창업&예비창업자] 사업계획서 양식
[창업&예비창업자] 사업계획서 양식[창업&예비창업자] 사업계획서 양식
[창업&예비창업자] 사업계획서 양식더게임체인저스
 
[창업자&예비창업자] 트렌드와 고객별 영업전략
[창업자&예비창업자] 트렌드와 고객별 영업전략[창업자&예비창업자] 트렌드와 고객별 영업전략
[창업자&예비창업자] 트렌드와 고객별 영업전략더게임체인저스
 
세계면세점 제휴 제안서(매장용)
세계면세점 제휴 제안서(매장용)세계면세점 제휴 제안서(매장용)
세계면세점 제휴 제안서(매장용)yacob Lee
 
[창업자&예비창업자] 도소매(점포) 사업계획서
[창업자&예비창업자] 도소매(점포) 사업계획서[창업자&예비창업자] 도소매(점포) 사업계획서
[창업자&예비창업자] 도소매(점포) 사업계획서더게임체인저스
 
[창업자&예비창업자] 스타트업 마케팅 전략
[창업자&예비창업자] 스타트업 마케팅 전략[창업자&예비창업자] 스타트업 마케팅 전략
[창업자&예비창업자] 스타트업 마케팅 전략더게임체인저스
 
MLFlow as part of ML CI/CD at Avalara
MLFlow as part of ML CI/CD at AvalaraMLFlow as part of ML CI/CD at Avalara
MLFlow as part of ML CI/CD at AvalaraManoj Mahalingam
 
사업계획서 빈스홀릭
사업계획서 빈스홀릭사업계획서 빈스홀릭
사업계획서 빈스홀릭Seong-su Park
 
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축Sungmin Kim
 
실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트JeongMin Kwon
 
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론PAP (Product Analytics Playground)
 
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...Amazon Web Services Korea
 
[창업&예비창업자] 마케팅 전략
[창업&예비창업자] 마케팅 전략[창업&예비창업자] 마케팅 전략
[창업&예비창업자] 마케팅 전략더게임체인저스
 
뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)
뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)
뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)Kim Jinbeom
 
서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기승화 양
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantiqueGautier Poupeau
 
elasticsearch_적용 및 활용_정리
elasticsearch_적용 및 활용_정리elasticsearch_적용 및 활용_정리
elasticsearch_적용 및 활용_정리Junyi Song
 

Tendances (20)

지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)
지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)
지식그래프 개념과 활용방안 (Knowledge Graph - Introduction and Use Cases)
 
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
 
[창업자&예비창업자] 2019년 스타트업 마케팅
[창업자&예비창업자] 2019년 스타트업 마케팅[창업자&예비창업자] 2019년 스타트업 마케팅
[창업자&예비창업자] 2019년 스타트업 마케팅
 
[창업&예비창업자] 사업계획서 양식
[창업&예비창업자] 사업계획서 양식[창업&예비창업자] 사업계획서 양식
[창업&예비창업자] 사업계획서 양식
 
[창업자&예비창업자] 트렌드와 고객별 영업전략
[창업자&예비창업자] 트렌드와 고객별 영업전략[창업자&예비창업자] 트렌드와 고객별 영업전략
[창업자&예비창업자] 트렌드와 고객별 영업전략
 
세계면세점 제휴 제안서(매장용)
세계면세점 제휴 제안서(매장용)세계면세점 제휴 제안서(매장용)
세계면세점 제휴 제안서(매장용)
 
[창업자&예비창업자] 도소매(점포) 사업계획서
[창업자&예비창업자] 도소매(점포) 사업계획서[창업자&예비창업자] 도소매(점포) 사업계획서
[창업자&예비창업자] 도소매(점포) 사업계획서
 
[창업자&예비창업자] 스타트업 마케팅 전략
[창업자&예비창업자] 스타트업 마케팅 전략[창업자&예비창업자] 스타트업 마케팅 전략
[창업자&예비창업자] 스타트업 마케팅 전략
 
MLFlow as part of ML CI/CD at Avalara
MLFlow as part of ML CI/CD at AvalaraMLFlow as part of ML CI/CD at Avalara
MLFlow as part of ML CI/CD at Avalara
 
사업계획서 빈스홀릭
사업계획서 빈스홀릭사업계획서 빈스홀릭
사업계획서 빈스홀릭
 
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
AWS Personalize 중심으로 살펴본 추천 시스템 원리와 구축
 
실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트실무에서 활용하는 A/B테스트
실무에서 활용하는 A/B테스트
 
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
 
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
개인화 및 추천 기능의 맞춤형 AI 서비스 혁명: Amazon Personalize - 남궁영환 솔루션즈 아키텍트, AWS / 강성문 솔루...
 
[창업&예비창업자] 마케팅 전략
[창업&예비창업자] 마케팅 전략[창업&예비창업자] 마케팅 전략
[창업&예비창업자] 마케팅 전략
 
뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)
뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)
뷰썸쇼핑몰입점제안서 Ver0.3(범용) (1)
 
서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기
 
Log design
Log designLog design
Log design
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantique
 
elasticsearch_적용 및 활용_정리
elasticsearch_적용 및 활용_정리elasticsearch_적용 및 활용_정리
elasticsearch_적용 및 활용_정리
 

Similaire à 빅데이터의 활용

Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기iron han
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선datasciencekorea
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 
1. hadoop 소개
1. hadoop 소개1. hadoop 소개
1. hadoop 소개Jino Kim
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드kosena
 
2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관
2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관
2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관제관 이
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집ABRC_DATA
 
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)Metatron
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아K data
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdfYunjeong Susan Hong
 
지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가r-kor
 
빅데이터 분석 시스템 도입과 AI 적용
빅데이터 분석 시스템 도입과 AI 적용빅데이터 분석 시스템 도입과 AI 적용
빅데이터 분석 시스템 도입과 AI 적용BESPIN GLOBAL
 
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017Amazon Web Services Korea
 
[한국IBM] 비정형데이터분석 WEX 솔루션 소개
[한국IBM] 비정형데이터분석 WEX 솔루션 소개[한국IBM] 비정형데이터분석 WEX 솔루션 소개
[한국IBM] 비정형데이터분석 WEX 솔루션 소개Sejeong Kim 김세정
 
Big Data Analytics and Data Mining
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data MiningSuHyun Jeon
 
[한국핀테크포럼] 회원사소개 Ktb솔루션
[한국핀테크포럼] 회원사소개 Ktb솔루션 [한국핀테크포럼] 회원사소개 Ktb솔루션
[한국핀테크포럼] 회원사소개 Ktb솔루션 성태 박
 
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21Donghan Kim
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기Amazon Web Services Korea
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee
 

Similaire à 빅데이터의 활용 (20)

Big Data 대충 알아보기
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기
 
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
2015-4 혁신기술로서의 빅데이터 국내 기술수용 초기 특성연구- 김정선
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 
1. hadoop 소개
1. hadoop 소개1. hadoop 소개
1. hadoop 소개
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관
2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관
2015 스마트의료기술 세미나 질의응답기반의 개방형 클라우드 서비스 이제관
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
 
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
 
지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가
 
빅데이터 분석 시스템 도입과 AI 적용
빅데이터 분석 시스템 도입과 AI 적용빅데이터 분석 시스템 도입과 AI 적용
빅데이터 분석 시스템 도입과 AI 적용
 
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
 
[한국IBM] 비정형데이터분석 WEX 솔루션 소개
[한국IBM] 비정형데이터분석 WEX 솔루션 소개[한국IBM] 비정형데이터분석 WEX 솔루션 소개
[한국IBM] 비정형데이터분석 WEX 솔루션 소개
 
Big Data Analytics and Data Mining
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data Mining
 
[한국핀테크포럼] 회원사소개 Ktb솔루션
[한국핀테크포럼] 회원사소개 Ktb솔루션 [한국핀테크포럼] 회원사소개 Ktb솔루션
[한국핀테크포럼] 회원사소개 Ktb솔루션
 
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
 
공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략공공기관의 빅데이터 구현 전략
공공기관의 빅데이터 구현 전략
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 

Plus de 수보 김

"42서울"이 가르치는 것들
"42서울"이 가르치는 것들"42서울"이 가르치는 것들
"42서울"이 가르치는 것들수보 김
 
소프트웨어 부트캠프 설계 및 운영사례(42Seoul)
소프트웨어 부트캠프 설계 및 운영사례(42Seoul)소프트웨어 부트캠프 설계 및 운영사례(42Seoul)
소프트웨어 부트캠프 설계 및 운영사례(42Seoul)수보 김
 
이노베이션 아카데미 혁신교육
이노베이션 아카데미 혁신교육이노베이션 아카데미 혁신교육
이노베이션 아카데미 혁신교육수보 김
 
예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기수보 김
 
인스타그램 따라만들기 (스타트업)
인스타그램 따라만들기 (스타트업)인스타그램 따라만들기 (스타트업)
인스타그램 따라만들기 (스타트업)수보 김
 
서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례수보 김
 
개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬수보 김
 
인터넷서비스사업의개요
인터넷서비스사업의개요인터넷서비스사업의개요
인터넷서비스사업의개요수보 김
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석수보 김
 
한국IT산업과 고용환경의변화
한국IT산업과 고용환경의변화한국IT산업과 고용환경의변화
한국IT산업과 고용환경의변화수보 김
 
새내기들을 위한 IT직장이야기
새내기들을 위한 IT직장이야기새내기들을 위한 IT직장이야기
새내기들을 위한 IT직장이야기수보 김
 
결제를 구현하고 싶은 개발팀을 위한 안내서
결제를 구현하고 싶은 개발팀을 위한 안내서결제를 구현하고 싶은 개발팀을 위한 안내서
결제를 구현하고 싶은 개발팀을 위한 안내서수보 김
 
서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)수보 김
 
아무도 알려주지 않는 팀으로 일하는 법(스타트업)
아무도 알려주지 않는 팀으로 일하는 법(스타트업)아무도 알려주지 않는 팀으로 일하는 법(스타트업)
아무도 알려주지 않는 팀으로 일하는 법(스타트업)수보 김
 
Trusted IP network solution
Trusted IP network solutionTrusted IP network solution
Trusted IP network solution수보 김
 
개발자의 현재와 미래
개발자의 현재와 미래개발자의 현재와 미래
개발자의 현재와 미래수보 김
 
SI 개발자들을 위한 퍼스널브랜딩
SI 개발자들을 위한 퍼스널브랜딩SI 개발자들을 위한 퍼스널브랜딩
SI 개발자들을 위한 퍼스널브랜딩수보 김
 
좋은 회사를 선택하는 지혜(예비 개발자 대상)
좋은 회사를 선택하는 지혜(예비 개발자 대상)좋은 회사를 선택하는 지혜(예비 개발자 대상)
좋은 회사를 선택하는 지혜(예비 개발자 대상)수보 김
 

Plus de 수보 김 (18)

"42서울"이 가르치는 것들
"42서울"이 가르치는 것들"42서울"이 가르치는 것들
"42서울"이 가르치는 것들
 
소프트웨어 부트캠프 설계 및 운영사례(42Seoul)
소프트웨어 부트캠프 설계 및 운영사례(42Seoul)소프트웨어 부트캠프 설계 및 운영사례(42Seoul)
소프트웨어 부트캠프 설계 및 운영사례(42Seoul)
 
이노베이션 아카데미 혁신교육
이노베이션 아카데미 혁신교육이노베이션 아카데미 혁신교육
이노베이션 아카데미 혁신교육
 
예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기예비 개발자를 위한 소프트웨어 세상 이야기
예비 개발자를 위한 소프트웨어 세상 이야기
 
인스타그램 따라만들기 (스타트업)
인스타그램 따라만들기 (스타트업)인스타그램 따라만들기 (스타트업)
인스타그램 따라만들기 (스타트업)
 
서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례서울시 장애인콜택시 개선을 위한 대기시간 분석사례
서울시 장애인콜택시 개선을 위한 대기시간 분석사례
 
개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬개발팀을 위한 소통과 협업스킬
개발팀을 위한 소통과 협업스킬
 
인터넷서비스사업의개요
인터넷서비스사업의개요인터넷서비스사업의개요
인터넷서비스사업의개요
 
온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석온라인 마케팅을 위한 빅데이터 분석
온라인 마케팅을 위한 빅데이터 분석
 
한국IT산업과 고용환경의변화
한국IT산업과 고용환경의변화한국IT산업과 고용환경의변화
한국IT산업과 고용환경의변화
 
새내기들을 위한 IT직장이야기
새내기들을 위한 IT직장이야기새내기들을 위한 IT직장이야기
새내기들을 위한 IT직장이야기
 
결제를 구현하고 싶은 개발팀을 위한 안내서
결제를 구현하고 싶은 개발팀을 위한 안내서결제를 구현하고 싶은 개발팀을 위한 안내서
결제를 구현하고 싶은 개발팀을 위한 안내서
 
서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)서버학개론(백엔드 서버 개발자를 위한)
서버학개론(백엔드 서버 개발자를 위한)
 
아무도 알려주지 않는 팀으로 일하는 법(스타트업)
아무도 알려주지 않는 팀으로 일하는 법(스타트업)아무도 알려주지 않는 팀으로 일하는 법(스타트업)
아무도 알려주지 않는 팀으로 일하는 법(스타트업)
 
Trusted IP network solution
Trusted IP network solutionTrusted IP network solution
Trusted IP network solution
 
개발자의 현재와 미래
개발자의 현재와 미래개발자의 현재와 미래
개발자의 현재와 미래
 
SI 개발자들을 위한 퍼스널브랜딩
SI 개발자들을 위한 퍼스널브랜딩SI 개발자들을 위한 퍼스널브랜딩
SI 개발자들을 위한 퍼스널브랜딩
 
좋은 회사를 선택하는 지혜(예비 개발자 대상)
좋은 회사를 선택하는 지혜(예비 개발자 대상)좋은 회사를 선택하는 지혜(예비 개발자 대상)
좋은 회사를 선택하는 지혜(예비 개발자 대상)
 

빅데이터의 활용

  • 1. 빅데이터의 활용 2014.09 김수보(@subokim), eBrain Academy 소장 http://subokim.wordpress.com kimsubo@gmail.com
  • 2. 주요 내용 2 1st 빅데이터의 이해 2nd 분야별 동향 3rd 비즈니스 기회 1. 들어가면서 • 왜 등장했나? • 누가 왜 하고 있나? • 꼭 필요한가? 2. 기술 흝어보기 • 비즈니스 특징 • 가능해진 것 • 아직 어려운 것들 3. 사업적 이해 • 가능한 사업들 • 어려운 사업들 4. 금융분야 • 카드, 보험, 은행, 증권 5. 제조분야 • 생산설비, 생산공정, 가전제품 6. 건설분야 • 안전관리 7. 에너지분야 • 발전설비, 전력운용, 전력거래 8. 의료분야 • 의료보험, 치료분야, 예방분야 9. 유통분야 10. CRM과의 차이점 11. 시장접근전략
  • 4. 1. 들어가면서 사회적 주목 죽음의 계곡 사업이 안정화되는 시기 Gartner's 2014 Hype Cycle for Emerging Technologies Maps 4
  • 5. 1. 빅데이터의 이해 / 왜 등장했나? • Server : sun sparc parallel processing etc. • Storage : SAN or NAS • Database : Oracle • 높은 처리기술 비용으로 데이터 활용 어려움 5
  • 6. 1. 빅데이터의 이해 / 왜 등장했나? • 2005.4.1 1주년 기념 1인당 1GB에서 용량이 점차 증가 • ‘구글은 사람들한테 더 많은 용량을 영원히 줄 것이다.’ - 조지 해릭 • 1인당 15GB * 2.7 억명 (‘12.12) = 4.05 Exa Bytes = 4,050 Terra Bytes = 4,050,000 Giga Bytes • 메일 검색, 분류, 태그  Backend 인프라의 복잡성 증가 • 가입자 12억명 • 일 250 Terra Bytes 이상 데이터 처리 • 25억개의 컨텐츠 공유 • 가입자 5억명 • 일 평균 7,000만건 트윗 • 누적 143억건 이상 6
  • 7. 1. 빅데이터의 이해 / 왜 등장했나? 7 x86 서버 기반 클라우드 + 가상화 스토리지 + 오픈소스 병렬처리 SW “구글 클라우드 서버” 임대형 클라우드 사업자의 등장 2008 뉴욕타임즈 디지털 변환 프로젝트 • Mission : 스캔 후 pdf 로 저장 • 분량 : 1,100만 장 (130년 어치) • 작업예상 : 일반서버 14년 소요, 4 TB, 100만 달러 • AWS이용 : 1일, 250달러
  • 8. 1. 빅데이터의 이해 / 왜 등장했나? 8 고민의 시작 • 불특정 다수 + 대량 고객 • 예측이 어려운 널뛰기식 트래픽 • 광고비 중심의 인터넷 서비스 사업 • 낮은 SW 유지보수 비용  오픈소스, 클라우드, 비싼 개발자  DevOps, Agile 해법 • 검색어 기반 맞춤형 배너광고 서비스 (Google Adsense) • 인터넷 서비스에 개인화 기능 강화 • 고객 분석 및 타겟 마케팅 응용 사업 가치 • B2C 기반 인터넷 비즈니스에서 출발 • 현재는 기술이 비즈니스를 리딩함  소프트웨어 엔지니어의 역할이 큼 특징
  • 9. 1. 빅데이터의 이해 / 누가 왜 하고 있나? 9 미국 영국 일본 사회적 비용의 감소  안전 분야 위험예측  의료 서비스 품질 개선 공공 서비스 품질의 개선  국방정보력의 강화  유행질병 사전 대응 사회적 부가가치 인프라  고급 정보를 싸게 제공  기업 및 민간단체의 활용권장
  • 10. 1. 빅데이터의 이해 / 누가 왜 하고 있나? • Siri – 음성 데이터 수집 후 패턴 분석 • 사용자 추천서비스 – In-App 광고 • 소비자 분석 – 결제, 개인 취향 등 예측 • 서비스 직접 품질의 개선 • 타겟 마케팅 • 사용자 분석 • 음성인식, 자연어 검색, 지도검색 • 사용자 추천서비스 – Adsense 광고 • 사용자 분석 – Google Analytics • 서비스 직접 품질의 개선 • 타겟 마케팅 • 사용자 분석 • 오픈정책 10 자사 제품의 인프라로 활용 자사 제품의 인프라로 활용 + 오픈정책
  • 11. 1. 빅데이터의 이해 / 누가 왜 하고 있나? 11 정보공개+ 데이터개방+ 맞춤형서비스
  • 12. 1. 빅데이터의 이해 / 누가 왜 하고 있나? • 무선사업부, MSC, VD사업부 • 반도체 사업부 등 글로벌 빅데이터 • Oracle, EMC, IBM 등 솔루션 PoC, ISP 수립 • 2011 ~ 12 Naver 삼성전자 KT SKT 빅데이터 • 검색질의 일 2,000만건 • 문서 일 130억건 • 검색로그 3TB/일 • 2008 ~ NCSoft • 분석로그 일 1TB • 분석대상 1.6 PB • MS-SQL  Hadoop 기반 • 2010 ~ 2013 완성 • 이동통신 망품질개선 • olleh tv 사용자 분석 등 • 오픈빅데이터, 2013.5.13 • ICT 개방 1조2,000억 투자(3년간) • 2010 ~ 정부3.0 • data.go.kr, 공공정보 연계(’12년 10억 Call) • 12.12 ~ 13.03 빅데이터 BPR/ISP 정책수립 • 13.09 미래부 빅데이터 분석 활용센터 구축 자사 서비스 개선 및 강화 (시험도입) 대외 비즈니스용 (실험단계) 행정 효율화 (활용검토) Daum 쿠팡 GS 홈쇼핑 티몬 기타 등등 LG전자 하이 닉스 현대자동차 SKT 금융권 등등
  • 13. 1. 빅데이터의 이해 / 꼭 필요할까? 13 클라우드 불가분 • 클라우드 도입확산에 따른 필수 동반 기술 서버비용의 절감  클라우드 도입  운영관리 효율화 필요  빅데이터 기반 운영 인프라 도입 • 과학적 마케팅에 대한 욕구  마케팅 비용의 효율적 효과적 사용 욕구가 큼 • 과학적 전략 수립 욕구  고객 연구 및 전략 수행 결과 탐구 • 기존 프로세스 개선 욕구  제조 : 수율향상, 오류 사전탐지  유통 : 배송 효율화 기업필수 인프라 직접 생산 설비보다 ‘간접 생산 설비’ 및 ‘지원 시스템’으로의 위상 확립 중
  • 14. 2. 기술 흝어보기 / 비즈니스 특징 기술 시장 14 • 오픈소스 기반의 요소기술 - 각 요소 기술의 수준이 천차만별 - 숙련된 개발자 확보가 필수 • 기술 솔루션 + 빅데이터 요소기술 (경쟁시장) - CRM, 로그분석 등 기존 솔루션의 취약점 보완 - 대표주자 : Splunk, Oracle • 신규 시장 창출 (초기시장) - 차별화된 분석기법 탐구, 기술이 시장을 선도
  • 15. 2. 기술 흝어보기 / 가능해진 것 15 전수조사 지속적 데이터 누적 활용 통계정확성 향상 Before After • 경찰청 : 범죄자 정보, 범죄자 DNA 정보 • 노선정보: 심야버스 이용노선정보 • 인구통계: 인구이동 및 출생,사망 정보 • 이통사 : 통화이력 정보  샘플링에 따른 누락 발생 • 경찰청 : 범죄이력 정보 • 의료정보 : 개인별 진료기록 정보, 질병환자 DNA 정보 • 국토부 : CCTV 정보 • 기상청 : 기상이력 정보  파편화된 데이터 분석 • 지자체 : BIS 이력정보 • 내비게이션 회사 : 도로 정체 이력 정보  부정확한 가공정보 • 일괄처리식 전수 조사 및 분석 가능 • 실시간 전수 조사 가능 오류 및 특이 데이터 감지 방대한 관계 분석이 가능 • 이력기반의 면밀한 정보 분석 시계열 기법의 정밀도 상승 예측 정확도가 높아짐 • 정보 가공의 신뢰도가 높아짐 정보 활용범위가 넓어짐
  • 16. 2. 기술 흝어보기 / 아직 어려운 것들 16 여행가형 • 무작위로 많은 데이터를 조사함 • 같은 데이터를 두 번 찾지 않음 • 요구사항이 무엇인지 알지 못함 • 메타 데이터를 많이 사용 • 정기적으로 데이터를 모니터링 • 정기적으로 대규모 데이터를 상세히 검토 • 산발적으로 데이터를 사용 • 프로파일링 툴에 의존 • 심화 탐구를 위한 영역을 이따금 조사 농부형 • 정기적으로 데이터 접속 • 무엇을 찾고 있는지 인지하고 있음 • 대규모 데이터에 접속 • 데이터에 예측가능한 접속 • 데이터에 접속한 후 예측 가능한 처리 시행 • 데이터 조회 시작 전에 요구사항을 인지하고 있음 • 정기적으로 데이터 마트에 접속 • 거의 현재 시점의 상세 데이터에 접속하지 않음 • 정기적으로 소규모의 황금조각을 발견 • 프레젠테이션 툴을 사용 탐험가형 • 데이터에 비정기적으로 접속 • 무엇을 찾는지 알지 못함 • 대량의 데이터를 조사 • 예측 불가능한 유형의 접근 • 때때로 큰 금덩어리를 발견 • 종종 아무것도 찾지 못함 • 정기적으로 현재 시점의 상세 데이터에 접근 • 데이터 발생보다 데이터 관계성을 검토 • 탐구와 통계적 분석 툴을 사용 광부형 • 통계학자 • 주장에 대한 가설을 바탕으로 수행 • 가설의 타당성을 입증 • 대량의 데이터로 수행 • 반복적으로 발생하는 독립 데이터로 수행 • 공생방식으로 탐험가와 긴밀히 협업 • 종종 새로운 가설과 주장을 발견 • 아주 큰 쿼리를 제출 • 업무에 특화된 툴을 사용 빅데이터 기반 분석 기법 발굴 연구 필요
  • 17. 2. 기술 흝어보기 / 아직 어려운 것들 17 응용 SW 부족/ 비쌈 HW 엔지니어링 연구 부족 HW 엔지니어링 연구 부족 Hadoop 기반 기술은 아직 SI 영역 물리적 서버 분산 및 관리기술은 진화중 관계형 연산처리에는 RDB가 가장 적합
  • 18. 3. 사업적 이해 / 가능한 사업들 대분류 가능한 사업분야 예 시 특징 18 IT 용역 솔루션 컨설팅 및 구축 용역 OO 보험사 부정청구 탐지 시스템 고도화 용역 SAS, Oracle Exa 등 B2B 비즈니스 중심 HW 엔지니어링 빅데이터 서버 트러블슈팅 관련 특수분야 전문 엔지니어 비즈니스 예상 제품개발 응용 SW 패키지 개발 운영자 편의 도구(ex. 편리한 하둡 관리자) 빅데이터 기반 전용 검색 엔진 사용자 추천 및 분석 WYSWYG 도구 상업용 패키지 초기 시장 오픈소스 기반 전략 전용 제품 개발 초고속 염기서열 분석기 (병렬처리 기술 활용) 반도체 생산공정 모니터링 시스템 바이털 사인 예측 감시 인큐베이터 산업 기술 융합 필요 블루 오션 외산 주도 예상 IT 서비스 인터넷 기반 데이터 분석 및 리포팅 서비스 월간 IT 동향 연구 리포트 지방 선거 긍정 부정 분석 데이터 분석가 필요 비정형 분석 기법 발달 현 검색엔진 회사 중심 고가의 전문 분석 시장 예상 인터넷 기반 마케팅 대행 서비스 디지털 광고, 홍보 대행 서비스 특정 제품 온라인 판매 대행 서비스 플랫폼 비즈니스 현 쇼핑몰 비즈니스 전문 대행사 등장 예상
  • 19. 3. 사업적 이해 / 어려운 사업들 19 시장의 어려움이자 기회 고객 데이터 분석 아웃소싱 서비스 Full Solution 제공 • 고객 데이터 = 전략데이터 + 개인정보 = 중요 보안 데이터 • 데이터를 열어서 외부인에게 보여줄 회사는 없다. • 아웃소싱을 할 바에야 분석하지 않는다. (기회 손실이 너무 큼) • 고객은 반제품 기반의 솔루션 구축보다 패키지 구매 방식을 선호 • 고객이 보유한 데이터 형태는 다양하다. • 누구나 빅데이터를 가지고 있지 않다. • 모든 고객을 만족시켜줄 수 있는 은탄환은 없다. • Full Solution을 말할만큼 시장이 성숙하지 않았다.
  • 21. 4. 금융분야 / 카드, 보험 21 현대카드 소비자 카드 이용 패턴 조사 보험사기 위험 분석
  • 22. 4. 금융분야 / 은행, 해외 수신 여신 외환 기타 22 국내은행분야 (도입검토 단계) 여신 업무에 활용  대출상환 50% 이상 투자자 유치 및 관리  투자정보 보고서  부동산 시세 기준자료 자영업자 대출상품 개발  유치비용 감소  수익성 향상
  • 23. 5. 제조분야 / 자동차 23 생산공정 품질관리 VCRM 운행정보 수집관리 • 파일럿 프로젝트 (2013.12 ~) - 테라데이터,오라클 등 - kt 넥스알 • 도요타 - 빅데이터 교통정보서비스(2013.6) - 커넥티드 카 서비스 개선 • 포드 - 운전패턴, 환경 별 차량 상태정보 - 74개 센서, 400만대, 일 6TB정보 - 실리콘밸리 빅데이터 연구소(2013)
  • 24. 5. 제조분야 / 반도체 24 생산공정 품질관리 2014.07 SK C&C 착수 • 반도체 수율관리 공정 적용 기존 MMDB 기반 샘플링을 활용한 수율분석 하둡기반 기술 전수데이터 실시간 수율분석
  • 25. 6. 건설분야 / 국토부 25 • IBS 지원 시스템 (검토단계) - 에너지 사용 효율화 - 건물 안전 • 지능형 고속도로 - 도로 센서 정보 수집 - 예측 및 사고알림 - 빠른 길 탐지 등 - 실시간으로 스마트차량과 통신
  • 26. 7. 에너지분야 / 발전소 • 2015년까지 ICT를 접목한 스마트 발전소 化 • 발전소 운영 및 건설정보 대상 빅데이터 구축 • 전체 비용의 80% 연료비  효율화 기대 26
  • 27. 7. 에너지분야 / 스마트그리드 27 • 스마트 그리드 종합운영 시스템 도입 - 선로부하 평준화, 전력손실 최소화 - 송변전, 배전, 영업 등 14종 시스템 통합 • 전력 수요 예측 - 기상청, 날씨와 전력수요 예측 - 지역별, 용도별, 시간대별 전력수요분석 - 탄력적 전력 공급계획
  • 28. 8. 의료분야 / 시장개요 대상 데이터 서비스 주요 기술 28 Wellness Market Data • 개인 건강이력정보 • 개인 생활이력정보 • 가족기록 정보 Device • 개인 모바일 기기 • 가정용 기기 Illness Market 분석서비스 • Device로부터 획득한 정보, 개인정보를 바탕으로 식이영 양 및 건강운동 정보 제공 처방서비스 • 분석에 따른 영양 불균형 및 건강 불균형에 대해 처방 생체정보 모니터링기술 • 생체신호 처리기술 • 의료영상 처리기술 일상생활 모니터링 기술 • 생활센서 처리기술 • 행위정보 분류 • 생활패턴 가시화 U-Health 응용기술 • 임상결정지원기술 • 응용서비스 프로토콜 • 의료정보 보호 • 시험 및 인증 데이터 분석기술 • 빅데이터 기술 • 질병 데이터 분석 기술 • 생활건강정보 분석 기술 대상 데이터 서비스 Data • 질병정보 • DNA 정보 • 치료이력 정보 • 진료환경 정보 • 임상 실험정보 Device • 질병 진단 기기 진료서비스 • 질병 정보와 PHR을 바탕으 로 효과적이고 개인화된 질 병 진단 치료서비스 • PHR의 변화를 기반으로 한 장기적, 단기적 치료서비스 제공 예방서비스 • 데이터에 기반한 질병확률 중심의 예방 서비스 제공 임상실험 • 신약 개발 및 치료제 개발
  • 29. 8. 의료분야 / 보험, 병원 29 분당서울대병원 • 질병관리 및 부정탐지 - 허위 진료비 청구 탐지 - 유행질병 사전 감지 - 질환별, 지역별 약처방 패턴 • 차세대임상데이터웨어하우징 - 약물부작용 의료사고 방지 - 누적 진료기록 60 TB - 외래 840만건, 입원40만건, 수술 25만건 - 조회시간 10분  10초로 단축
  • 30. 8. 의료분야 / 유전자분석 서비스 현재 유전자 분석 서비스는 다음과 같이 9 단계를 거칩니다. 병목구간은 이미지캡쳐를 하는 부분과 염기서열을 분석하는 단계입니다. 클라우드 기반 빅데이터 기술은 염기서열 분석 시간을 획기적으로 단축할 수 있게 만들었습니다. 30 • 쪼개진 DNA 조각들을 퍼즐 맞추기. • 1인 26개 염기쌍 - 1개 염색체 약 50MB * 26개 = 총용량 1.3GB • 기존 약 1달 소요, 비용 1천만원  2011. 고속 병렬처리 컴퓨팅 시 2~5일 소요  2012. 초고속 처리의 경우 5시간 내 가능 (BGI 이지게노믹스) • 판정 비교기준 : 기 질병샘플 활용(의료진) - 암관련 유전자 300~600개 표1. 유전자 프로필 검사 및 판정과정 검사의뢰 및 시료접수 시료채취 (모근, 구강상피 세포, 혈액 등) DNA 추출 PCR product 전기영동 PCR 증폭 DNA 정량 결과 분석 및 편집 자동서열 분석기 를 이용한 결과 분석및 판정 판정결과 통보 및 판정서 발송 ※ 출처 : 김욱 교수, 생명과학과, 단국대학교 ※ 출처 : 인터넷 조사
  • 31. 8. 의료분야 / 자동염기서열분석기 제품명 • Model : ABI PRISM 3130xl Genetic Analyzer • 제조사 : Applied Biosystems(Hitachi high techonology), Japan 제공기능 • Holds Loss of Heterozygosity 유전자 증폭기술을 이용하여 LOH의 표지가 되는 microsatellite의 대립 유전자 의 결손 여부를 확인 • Micorsatellite instability 대장암 환자의 경우 암조직과 정상 조직을 분리해 MSI 유전자 검사 실시 • 친자확인 12시간 • 모계혈족검사 3일 31 • Trisomy 삼염색체성 다운증후군을 유전자 증폭기술을 이용하여 손쉽게 진단 • Fragile X 유전성 정신지체의 질환으로 삼핵산 반복서열 CGG의 증폭의 반복수로 검증 • Human Identification • Paternity test 친자 확인 가능 주요소요시간 ※ 출처 : 전남대학교 의생명연구원
  • 32. 8. 의료분야 / 장비인프라 Location Cores Memory Storage T flops 쓰촨성 11,000 22TB 8.88PB 117T flops 홍콩 7,776 9.7TB 8.515PB 83T flops 베이찡 300 500GB 162TB 1.5T flops 우환 1760 500GB 1PB 4T flops 미국1 300 800GB 500TB 2T flops 미국2 300 800GB 500TB 2T flops 덴마크 600 1.6TB 1PB 4T flops 합계 22,036 35.9TB 20.6PB 214T flops Illumina HiSeq 고성능 병렬처리에 기반한 기반기술 AB SOLiD System 병렬처리를 위한 소프트웨어 플랫폼 32 BGI 병렬처리를 위한 자체 클라우드 인프라 보유 AB SOLiD System 베이징게놈연구소(이하 BGI)는 Nvidia 사의 테슬라 GPU를 기반으로 한 클라우드 인프라를 활용해 기존 분석시간을 5일  5시간으로 단축 컴퓨팅 파워 주요 기술 사업 현황 플랫폼 주요내용 Ion Torrent 사후분광처리기술 • 2012년 EasyGenomics 서비스 출시 • 약 156대의 Sequencing 기계 보유 • 생물정보학자 1,000명 보유 (전세계 DNA 데이터의 10-20% 생산) • 돼지복제센터, 줄기세포연구, 진단관련 연구 포함 (※ 출처 : MIT Technology Review, 2013)
  • 33. 9. 유통분야 배송경로 최적화  배송시간 단축, 물류비용 감소 33
  • 35. 10. CRM과의 차이점 35 가설 모델 마트 구축 수집 분석 리포팅 수집 탐색 발견 가설 분석 리포팅 CRM 프로세스 및 비즈니스 빅데이터 프로세스 및 비즈니스 통계전문가 + 현업담당자 SW 영역 현업 담당자 SW 영역 데이터 탐색가 (현업담당자) 통계전문가 + 현업담당자 + SW 엔지니어 현업 담당자 업무가 정형화되지 않았고 최적화된 SW가 아직 존재하지 않는 시장
  • 36. 11. 시장접근 전략 36 기억할 것 조심해야 할 것 • 기술보다 비즈니스 특성이 중요하다. - 산업분야별로 필요한 부가 기술이 상이함 • 비즈니스의 고민을 해결하기 위한 기술을 선택 - 데이터 분석 및 탐색가의 역할이 매우 중요 - 고민 해결책을 발견하기 위한 최적의 인프라 • 기대수준, 목적에 대한 비즈니스 컨설팅 필수 동반 - 목적을 이해하지 못하면 플랫폼 도입실패 가능성 높음. - 기대수준이 다르면 엉뚱한 결과에 도달 • 은탄환은 없다. 대량 판매가 어려운 사업이다. - 데이터 분석을 통해 혁신이 일어나야 가치를 인정받음 - 성공가치를 입증하기 쉽지 않음

Notes de l'éditeur

  1. 청중이 일반인 강의 수준을 쉽게 맞추어 보았습니다.
  2. 가트너 그룹, 1979년 설립, 미국 정보기술 연구 및 자문회사 매년 IT혁신이 확산되는 방향으로 Hype Cycle을 발표
  3. 우리나라 인구 수 약 5,300만 주민등록 전산화 이후 현재 3억건 까지 전산화 국세청 세무정보 + 국가 조달 정보
  4. 미국 정부는 2012년부터
  5. 현대카드의 경우, 외식과 패션 부분의 소비패턴을 분석한 '현대카드 빅데이터 리포트'를 두 차례 공개. 지난 7월에는 '직장인들이 점심시간에 상대적으로 가격이 싼 커피를 마신다'는 결과. 편의점과 연계한 마케팅을 진행해 지난해 같은 기간보다 100% 이상 관련 상품 결제가 증가. 삼성카드는 가맹점을 소비자 개인별 방문기록을 토대로 지역별 인기장소를 기준으로 선정 신용카드 이용명세 및 연관 매출 분석을 바탕으로 전국 유명 지역의 가맹점 소개 및 해당 가맹점에 대한 할인서비스 현대해상 사례 사기적발 시스템이 방대한 사고 데이터를 기반으로 ‘가해자와 피해자가 몇 달 전 사고에서는 거꾸로 서로 피해자와 가해자였음’을 분석. 조사실장이 신속히 데이터와 조사 내용을 바탕으로 가해자/피해자와의 면담. 어린 학생들이 공모해 보험금을 노린 보험사기로 밝혀짐. 현대해상의 경우 사기적발 시스템 적용 후 전체 사기 사건의 25%를 빅데이터 분석을 통해 검출. 삼성생명 사례 다른 지역과 달리 유독 통영에서만 요실금 보험금 청구 건수가 많다는 것을 감지 현지에 조사원 파견 모 보험 설계사가 ‘가입 후 2개월이 지나서 지정한 병원으로 가면 요실금 판정을 해 줄 것이고 그러면 500만 원을 단기간에 벌 수 있다’는 방식으로 영업하는 것을 적발.
  6. 여신 분야 부동산 동향조사, 특정 업체 신뢰도 및 평판조사, 고객 이력관리 나라별 동향조사 등 응용분야 넓음 씨티그룹 고객 거래명세 등 분석하여 고객 선별 대출, 또는 신용카드 발급 여부를 결정 미국 법인고객의 대출상환가능여부를 판단하는 정확도를 50% 이상 향상했습니다. 로벌 고객 데이터베이스 상의 통합 고객 거래 데이터를 스페인의 대형 의류업체와 공유해 추가 생산시설, 판매매장 위치 계획 수립 등에 활용하기도 했습니다. 뱅크오브아메리카(BoA) 자영업자를 대상으로 자금관리 지원 상품인 캐시 프로 모바일 개발 시, 소셜 미디어 분석을 통해 고객 성향을 파악 후 이를 상품 개발에 반영 실시간 디지털 마케팅 및 리스크에 대한 조기 경보 체계에도 활용했습니다. 가입자 유치비용이 25% 감소하고 고객당 수익성도 기존 12%에서 18%로 상승 채무 불이행 확률을 계산하는 데 걸리는 시간 기존 96시간에서 4시간으로 감소하였습니다. 특히, 대출계좌 40만 건에 대한 신용평가점수를 산출하는 데 걸리던 시간을 3시간에서 단 10분으로 단축 JP모건체이스 많은 양의 고객 신용카드 이용 정보와 정부가 제공하는 금융소비자 재무 정보를 통합해 새로운 소비 트렌드를 발견하고 이를 보고서로 만들어 판매 지역별로 추출한 실제 투자자들이 인지하고 있는 소셜 네트워크상에 노출된 부동산 관련 정보를 부동산 시가 산정 시 반영해서 지역별 적정 부동산 담보가치를 산정하고 이를 대출 시 또는 담보로 설정한 부동산을 매각할 경우에 기준시가로 활용
  7. 건설 자체에 대한 빅데이터 수요는 없음
  8. 약물부작용 의료사고 : 전체 의료사고의 20% 정도
  9. 약물부작용 의료사고 : 전체 의료사고의 20% 정도
  10. 약물부작용 의료사고 : 전체 의료사고의 20% 정도
  11. 약물부작용 의료사고 : 전체 의료사고의 20% 정도
  12. 유전자 분석, 염기서열 분석
  13. 유전자 분석, 염기서열 분석