머신러닝은 인공지능 내부 시스템 가운데 학습영역을 구체화한 기술로 데이터를 반복해서 기계를 학습시키는 알고리즘과 기술을 개발하는 분야이다. 머신러닝 알고리즘은 특성과 사용 분야를 기준으로 크게 유사성 베이스, 정보, 비지도, 신경망의 5가지 유형으로 분류된다. 이번 발표에서 머신러닝이 활용되는 산업별 세계 시장 규모와 실제 머신러닝이 어떻게 실생활에 적용되어 있는지 사례를 들어 설명할 예정이다. 특히 머신러닝 구현을 위해 필수적 요소인 도메인 지식 데이터의 중요성을 확인할 수 있다.
11. 입력변수 선정
입력변수에 대한 가중치 부여
선호구분 선호내용 가중치 구분 가중치 값
플레이 수 클립재생 수 10,000회 미만
10,000~30,000회
30,000~50,000회
0.3
0.6
1.0
순차 동영상 클립 시청 후 다음 번 시청한 클립 순차재생
순차미재생
1.0
0.2
함께 재생된 동영상 클립 시청 후 함께 시청한 클립 함께 재생
함께 미재생
1.0
0.2
12. 데이터 구분 설명
경제활동
금융활동 금융거래, 상품가입, 대출융자, 금융투자 등의 금융활동 이력
경제활동 온라인소비, 마일리지, 개인판매 등의 일상적인 경제활동 이력
개인입력
투자성향 투자목표, 투자예산, 자산구성, 수익률, 이자율, 위험선호도
경제성향 가격, 품질, 손익, 상품선호도, 금융 서비스 사용 설정
생활패턴 개인일정, 이동경로, 소셜네트워크, 과거행동 통계
외부서비스
연계
투자상품 투자상품 추천에 필요한 투자분야, 투자성향 정보
포트폴리오 개인 종합 자산관리에 필요한 포트폴리오 성향 비율 정보
투자상담 Agent를 통한 실시간 상담을 위한 비정형 텍스트 정보
빅데이터
인터넷정보 경제뉴스, SNS, 시장지표, 금융 레포트 등 인터넷 수집 정보
금융트렌드 비식별 정보 기반 연령, 성별, 직업, 지역별 금융 소비 트렌드
성향 분석
성향 예측
13. 데이터 구분 설명
금융
거래정보
내부고객정보 고객프로필의 직장, 소득현황 등 사회경제적 특성
내부거래정보 현재 발생된 거래와 과거의 거래내역, 연체내역
카드사용내역 신용카드, 체크카드 등의 경제활동과 관련된 소비내역
금융거래내역 타 금융기관의 거래내역, 대출내역 등의 금융거래 내역
신용정보 외부 신용평가 기관의 신용정보, 블랙리스트 정보
비금융
거래정보
통신료 통신요금 납부내역에 대한 정보
공공요금 전기료, 수도세 등 공공요금 납부내역
성향정보 성향테스트설문 개인 심리, 이미지 선호도, 약관검토시간 등 습관, 성격에 대한 설문
14. 데이터 구분 설명
정형
경제
데이터
기업공시정보 기업 재무정보, 기업 공시 데이터, 시가총액, 성장률
산업위험지표 산업신용등급, 부도 및 휴페업률, 산업 규모 및 현황
시장경제지표 금리, 환율, 물가, 주가, 유가, 부동산가격, GDP
비정형
빅 데이터
산업 동향 경제 뉴스, 기업 보고서 , 산업 동향 리포트
소비 동향 비식별 정보 기반 연령, 직업, 산업별 소비 트렌드
경제 SNS 경제관련 소셜미디어의 평판, 선호도, 긍부정 감성 정보