10. CMS 구성하는 알고리즘들
• Recommendation/Filtering Algorithm
• Tag 추천, 관련 이미지 및 영상 추천
• 주목 효과 높이는 시퀀스 추천
• Fact-Checking algorithm
• Automated Content Generating Algorithm
• Automated Stories, Automated Video Creation
11. 리사 깁스. AP 글로벌 사업 에디터
“자동화로 인해 그동안 주목받지 못했던 영세 사업
자를 포함해서 3700개가 넘는 기업의 실적 보고서
를 고객들에게 제공할 수 있게 되었습니다. 이는 이
전에 비해서 12배가 넘는 수치입니다.”
“시간이 생기면서 AP의 언론인들은 모두 UGC에
관여하거나 멀티미디어 기사를 개발할 수 있게 됐으
며, 탐사 분석이나 좀 더 복잡한 이야기에 집중할 수
있게 됐습니다.”
13. The analysis conducted by professors Elizabeth Blankespoor and Ed
deHaan, along with PhD student Christina Zhu, found compelling evidence
that automated articles increase firms’ trading volume and liquidity.
- AP, Francesco Marconi
21. 지도, 비지도, 강화 학습
• 비지도 학습(Unsupervised Learning)
• 알고 있는 지식이 없을 때 주어진 정보로부터 행동을 찾아가면서 업데이트
• 클러스터링(K-means 등)
• 지도 학습(Supervised Learning)
• 이미 알고 있는 지식을 바탕으로 원하지 않는 행동을 수정하면서 업데이트
• 서포트벡터머신, 회귀분석, 회귀분석
• 강화 학습(Reinforcement Learning)
• 이미 알고 있는 지식과 아직 조사되지 않은 영역을 탐험하는 것 사이의 균형을 잡는
방식
• 멀티암드반디트,
23. k-means 특성
• 작동 방식
• K 값 임의(분석 뒤) 설정
• 무작위로 찍은 대표점을 한 가운데로 옮기기 위해 반복적으로 데이터 트레이닝
• 데이터와 대표점의 거리를 계산하는 방식으로 대표점을 다시 찾아가게 되는 방
식
• 한계
• 더 많은 클러스터로 분류할 경우 처음 대표점을 어떻게 잡았는지에 따라 결과가
달라질 수 있다
• k 값을 몇 개로 설정할지, 설정한 뒤 무작위 대표점을 어떻게 잡을지 설계자나
기획자가 관여
24. 추천 알고리즘의 작동원리
• Content Based Filtering Algorithm
• 콘텐츠의 특성을 추출해 추천을 구현하는 방식
• 클러스터링 분석, 인공신경망(RNN), tf-idf
• CF는 Collaborative Filtering Algorithm
• Item-Item Based CF
• User-User Based CF
25. CF 알고리즘의 한계
• Cold Start Problem
• Item Cold Start, User Cold Start, System Cold Start
• 계산 효율성의 문제
• 계산량이 많아 사용자수가 많을 경우 효율성이 낮아진다
• 롱테일 문제
• 사용자들의 관심이 적은 다수의 항목은 추천을 위한 충
분한 정보를 제공하지 못한다.
29. Multi Armed Bandit의 원리
• 강화학습(Reinforcement
Learning) 알고리즘의 일종
• 탐색(Exploration)-추출
(exploitation)의 교환(trade
off)를 해결하기 위한 방법론
• 웹 사이트의 A/B 테스트, 구글
애널리틱스와 같은 원리
• 탐색 : 여러 개의 시안
• 추출 : CTR
31. 생산-소비의 관계 측면
• Mass Customization
• 공급자 중심에서 수요자 중심으로
• 뉴스의 공급과잉과 희소성의 붕괴
• 뉴스 소비자의 관심사 다양화
• Datalization(데이터화)
• Machine Readable Data의 증가(ex, 선관위, 스포츠, 공공기관)
• Word2Vec과 같은 언어의 벡터화 소프트웨어 등장(NLP 향상)
• 사물이 데이터 생산자로 전환
• Open Data의 활성화
32. 저널리즘 측면
• 데이터 처리 엄밀성에 대한 압력
• (인간) 기자 실수에 의한 오보 가능성 하락
• 팩트체크 등의 효율성과 엄밀성 증대 기대
• 정치적 중립성에 대한 사회적 압력
• 기계에 의한 배열로 정치적 편향성 회피
• 뉴스 수용자의 다양한 취향 동시적 만족
• 취향과 선호, 관심사에 따른 동시적 뉴스 생산 기대
33. 조직 및 산업적 측면
• 기자의 생산성 증대
• 더 적은 인력으로 현재 이상의 뉴스 생산
• 기자의 심층 보도 뉴스 생산 집중
• 지속적인 광고 수익 하락과 수익모델 부재
• 수익 하락으로 인건비 절감 경제적 압력 증대
36. Machine Clustered Society
• 페이스북 등에서 시민의 상호작용 범위가 관계와 관심
사에 따라 클러스터링
• 연결되면서 동시에 단절되는 흐름
• 이질 클러스터 간 교류 부재로 집단 극화(Group
polarization)
• 필터버블(Filter Bubble)의 일상화
39. Katherine Viner(가디언 편집국장). How Technology disrupted the truth.
“팩트는 독자들의 선택의 여지가 없었던 활자 시대
의 유물.(they are a relic from the age of the
printing press)”
41. 페드로 도밍고스.(2016). ‘마스터 알고리즘’. 비즈니스북스. p.95
“컴퓨터가 배울 수 있다는 사실이 컴퓨터가 스스로
의지를 획득한다는 것을 의미하지 않는다. 머신러닝
알고리즘은 우리가 정해 준 목표를 달성하는 법을
배운다. 그들은 목표를 바꾸는 일에 착수하지 않는
다.”
42. 저널리스트로서
• [대상으로서 알고리즘] 알고리즘 역공학(reverse-
engineering)을 통한 권력관계의 이해와 비판
• 플랫폼 등 알고리즘 통제 권력에 대한 비판
• [동료로서 알고리즘] 단순 반복형 기사의 기계 외주화
로 고품질 저널리즘 집중
• 알고리즘과 협업을 통한 고품질 뉴스 생산
44. 참고문헌
• 박승택, 성인재, 서상원, 황지수, 노지성, & 김대원. (2017). 기계학습 기반의 뉴스 추천 서비스
구조와 그 효과에 대한 고찰. 사이버커뮤니케이션학보, 34(1), 5-48.
• 서봉원. (2016). 콘텐츠 추천 알고리즘의 진화. 방송 트렌드&인사이트. Vol.05. 19~24. 한국
콘텐츠진흥원.
• 이성규. (2016.9.12). 언론사가 알아야 할 알고리즘② 협업 필터링 추천. 블로터.
• 이성규. (2016). 프로그래머틱 광고의 가치 증식 기제. academia.edu
• 네이버 다이어리. (2017.2.16). 인공지능 기반 추천 시스템 AiRS를 소개합니다. 네이버 블로
그.
• 카카오. (2017.5). Kakao AI Report. Vol.03.
• Marconi 등. (2017.2). a guide for newsroom in the age of smart machine. AP Insight.
• Schmit, Thomas. (2017.5.16). Smarter Journalism: Artificial Intelligence in the
Newsroom. European Journalism Observatory.