오컴 Clip IT 세미나 1회차 "머신러닝과 인공지능의 현재와 미래"
1. 인공지능과 머신러닝
- 영화 및 애니메이션에 나타나는 친화적 인공지능과 적대적 인공지능, 그리고 감성적 인공지능
- 강한 인공지능과 약한 인공지능의 차이
- 인공지능과 머신러닝의 관계
2. 딥러닝과 강화학습
- 인공지능의 중요 열쇠이자 머신러닝의 세부 이론인 딥러닝과 강화학습에 대한 개괄 소개
3. 인공지능에 대한 우리의 자세
- 과연 인공지능은 완벽한가?
- 과연 인공지능은 인간 전문가를 대체할 수 있을까?
- 데이터의 중요성
1. 1
4차 산업혁명 기술과
내 미래 직업을
함께 탐색하는 시간
IT커뮤니티 오컴에서 준비한
대학생, 취업준비생, 사회초년생을 위한 18회 무료 강연
IT기업의 최전방 실무진, 스타트업 대표, 교수가 전하는 핵심
일시 2018년 4월 6일 ~ 매월 1,3주 금요일
오후 7시 30분 ~ 9시
장소 마루 180 1층(마이크임팩트 스튜디오 역삼)
Occam
더 잘 알기 위해
함께 하고
우리가 아는 것을
사회에 공유하는
오픈 모임
2. 2
since 2015
오픈 세미나
IT 투어
강연 프로그램
교육 세미나
스타트업코리아
가상현실
IT시리즈(13권), 전기차
집필 활동
IT 컨설팅
해외 진출 컨설팅
강의, 원고 청탁
컨설팅
어린이 IOT 교과서
층간소음 측정기(IoT)
프로젝트
Occam Experience
3. 3
- 기술은 산업의 경계를 무너뜨리고, 세상을 변화 시킨다.
따라서 다양한 산업의 경계를 허물 것으로 예측되는 새롭게
등장할(또는 등장하고 있는) 기술 플랫폼을 미리 알고, 대비하면,
변화 속에서 기회를 찾을 수 있다.
• 스타트업 코리아
written by Occam
- 경제경영 대중서로서 가상현실 전반에 대해 알 수 있게 한다.
가상현실 정의, 기술, 의미, 역사, 사용영역, 비즈니스 및 생태계,
현재 이슈와 미래 전망에 대해 기술 한다.
• 가상현실
4. 4
Next Step?
- 4차 산업혁명, 블록체인, 공유경제/O2O/mobility, 5G, 드론, 사물인터넷, 인공지능, 헬스케어, 전기자동차,
증강/가상현실, 스마티시티, 자율주행자동차, 스마트팩토리/로봇
• Clip IT 시리즈 13권 (살림출판사, 18년 출간 예정)
- 최초의 전기차 구매 및 운전 가이드 서적. 전기차의 역사와 기술, 전기차가 바꿀 미래까지 전망하는 책
• 전기차, 어떻게 사야 할까? (미래의창, 18년 출간 예정)
- 최초의 전기차 구매 및 운전 가이드 서적. 전기차의 역사와 기술, 전기차 바꿀 미래까지 전망하는 책
• 규제 트렌드 2019 (프로젝트 준비 및 저자 모집 중)
- 직업의 기원과 현황, IT발전에 따른 그 직업의 미래까지 파헤치는 책(변호사, 의사, 교사, 작가, 데이터
사이언스, 변리사, CEO, 마케터, 통번역사, 작곡가)
• My Punch Line 시리즈 1 (프로젝트 준비 및 저자 모집 중)
- My Future 시리즈의 초등학생 버전, 코딩/사물인터넷/인공지능 교육교재와도 연계
• My Future 시리즈 1 (프로젝트 준비 및 저자 모집 중)
Occam은 누구에게나 열려 있습니다.
오컴 멤버 및 프로젝트 참여를 원하시면 schelling1@naver.com로 연락 바랍니다.
5. 5
photo
고태훈
Introduction
Personal History
서울대학교 산업공학과 학사, 박사
(데이터마이닝 연구실/센터)
현재 서울대학교병원 정보화실
연구조교수
Special Career
다수 프로젝트 참여 (삼성전자, 현대자동차,
현대중공업, SSG, LG전자, 현대카드 등)
스타트업 CTO 경험
저서: 『4차 산업혁명』, 『 인공지능』
(살림출판사, 18년 출간예정)
인공지능과 머신러닝의
현재와 미래
Clip IT-1, 4월 6일
14. 14
Strong AI vs. Weak (or narrow) AI
강한 인공지능 약한 인공지능
스스로 사고하여
문제 해결 능력을 갖춘 AI
스스로 사고하여
문제 해결 능력이 없는 AI
지능적인 것처럼 보이는
행동을 하는 AI
실제로 인간과 비슷한
의식을 갖고 행동하는 AI
15. 15
인공지능, 머신러닝 그리고 딥러닝
AI ⊃ ML ⊃ DL
Goodfellow, I., Bengio, Y., Courville, A., & Bengio, Y. (2016). Deep learning (Vol. 1). Cambridge: MIT press.
(https://www.deeplearningbook.org/)
16. 16
인공지능의 가장 초기 형태인 ‘지식 기반의
전문가 시스템(knowledge based expert
system)’과
좀 더 진화된 형태인 ‘머신러닝’의 차이를
스팸 문자/메일 필터링으로 이해해봅시다.
19. 19
사람이 직접 스팸을 걸러내는 시스템?
엄청나게 많은 양을 일일이 사람이 볼 수 있을까?
스팸 여부 판단을 하는데 걸리는 시간은?
20. 20
스팸 여부를 파악하는 규칙들을 만들면?
스팸 분류 전문가의 행동 패턴을 보고 스팸을 분류하는 규칙을 생성시켜보자!
특정 단어 포함 여부
- 가능성이 있는 단어: 광고, 쩜핑, 바둑이, 대출, 카지노 등등
특수문자 개수
- 만약 특수문자가 5개 이상 사용되면 스팸
…
21. 21
스팸을 분류하는 전문가 시스템 (가장 기초적인 인공지능)
스팸 분류 전문가의 행동 패턴을 기반으로 스팸을 분류하는 규칙 집합을 생성
Model
Non-spam
Spam
전문가 지식
알고리즘화
22. 22
전문가 시스템의 한계
전문가들의 지식은 완전한가?
전문가들의 지식을 빈틈없이 규칙 집합으로 표현 가능한가?
새로운 지식의 업데이트는 용이한가?
http://aliereadvisors.com/does-your-company-have-too-many-rules/
http://www.ytn.co.kr/_ln/0103_201412261420163551
23. 23
머신러닝 기반 스팸 필터링?
https://korea.googleblog.com/2015/07/blog-post.html
http://www.boannews.com/media/view.asp?idx=55053
24. 24
머신러닝 (Machine Learning)
Computer
Science
Subject Matter
Expertise
Math &
Statistics
Traditional
Software
Traditional
Research
Machine
Learning
머신러닝은 컴퓨터가
데이터를 학습하는
알고리즘과 기술을 통칭
머신러닝은 인공지능을
구현하는 구체적 접근방식
(NVIDIA 블로그 참조)
25. 25
머신러닝 기반 스팸 필터링
머신러닝은 데이터로 표현된 공간에서 스팸과 스팸이 아닌 메일/문자를 구분하는
경계를 찾아냅니다.
경계
Spam
Non-spam
학습 알고리즘
선형회귀모델
•최소자승법
•경사하강법
인공신경망
•역전파 방법
의사결정나무
•엔트로피 최소화 방법
…
26. 26
머신러닝 기반 스팸 필터링
데이터를 학습하여 생성된 모델을 이용하여 새로운 메일/문자의 스팸 여부를 예측
Model
Non-spam
Spam
Machine
learning
algorithm
학습용 데이터
27. 27
머신러닝 기반 스팸 필터링 vs. Other methods
• 사람이 직접 스팸 분류를 하는 것에 비해,
– 덜 지치면서 스팸을 분류할 수 있다 (사람의 입장에서…컴퓨터는 지치지 않는다)
– 더 빠르게 스팸을 분류할 수 있다.
• 규칙 기반의 스팸 필터링 모델에 비해,
– 여러 인자를 동시에 고려하며 스팸을 분류할 수 있다.
– 더 많은 유형의 스팸을 분류할 것으로 기대된다.
• 그러나 두 방법에 비해,
– 더 많은 양의 데이터가 필요하다.
– 더 많은 컴퓨팅이 필요하다.
31. 31
다음 중 분류 경계가 더 단순한 것은?
Goodfellow, I., Bengio, Y., Courville, A., & Bengio, Y. (2016). Deep learning (Vol. 1). Cambridge: MIT press.
(https://www.deeplearningbook.org/)
Same data, but different representations
32. 32
Deep learning = The entire machine is trainable.
Yann Lecun’s keynote in NIPS 2016
33. 33
딥러닝은 어떻게 분류 경계를 만들어가는가?
http://playground.tensorflow.org/
34. 34
딥러닝 모델의 종류
Convolution neural networks(Deep) Feed-forward networks
Recurrent neural networks Generative adversarial networks
35. 35
ImageNet Large Scale Visual Recognition Challenge (ILSVRC)
수 백만개의 이미지를 학습하여 1,000개의 이미지 클래스를 분류하는 문제를 푸는 것으
로 이미지 관련 딥러닝 모델 발전이 가속화되는데에 기여
Alexnet
VGG net
ZF net
Inception
Resnet
…
36. 36
ImageNet Large Scale Visual Recognition Challenge (ILSVRC)
수 백만개의 이미지를 학습하여 1,000개의 이미지 클래스를 분류하는 문제를 푸는 것으
로 이미지 관련 딥러닝 모델 발전이 가속화되는데에 기여
ResNet, 152 layers
(ILSVRC 2015)
37. 37
Object detection and classification
ImageNet Object Detection Challenge
(https://www.kaggle.com/c/imagenet-object-detection-challenge)
Facebooks’ DeepFace
: facial recognition systems
(Source: Facebook)
38. 38
Object detection and classification
Orbital Insights: 인공위성 사진을 분석하여 가치를 창출한 회사
- 텍스트 입력
텍스트 입력
• 텍스트 입력
Orbital Insight uses deep learning
algorithms to accurately identify cars
from satellite images at 55,000+
parking lots of major retail chains
across the U.S. Its proprietary methods
turn these raw car traffic counts into
continuous time series;
the ”normalized” time series correlate
with same-store-sales trends at the
chain level.
출처: https://orbitalinsight.com/orbital-insight-correctly-
predicts-retail-sales-miss-hit-rate-grows-78/
39. 39
Image caption generation
Microsoft COCO Image captioning challenge에서 우승한 Show and tell 모델
(made by Google)
Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2017). Show and tell: Lessons learned from the 2015 mscoco image captioning challenge. IEEE
transactions on pattern analysis and machine intelligence, 39(4), 652-663.
40. 40
Image caption generation
Microsoft COCO Image captioning challenge에서 우승한 Show and tell 모델
(made by Google)
Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2017). Show and tell: Lessons learned from the 2015 mscoco image captioning challenge. IEEE
transactions on pattern analysis and machine intelligence, 39(4), 652-663.
41. 41
Image generation
GAN (Generative adversarial network) 을 이용한 실제와 비슷한 이미지 생성
Radford, A., Metz, L., & Chintala, S. (2015). Unsupervised representation learning with deep convolutional generative adversarial
networks. arXiv preprint arXiv:1511.06434.
49. 49
알파고 제로
바둑의 간단한 규칙만을 알려주고
스스로 바둑을 두면서 점점 실력을
올린 알파고 제로
몇 가지 의의
- 기존 hand-crafted feature
를 사용하지 않고 (활로, 사석 수 등).
오로지 흰 돌, 검은 돌이 바둑판에
위치한 정보만을 이용
- 시뮬레이션을 위한 rollout 과정이
사라짐.
- 네트워크가 단순해지면서 기존보다
훨씬 적은 컴퓨팅 파워만 사용
• https://deepmind.com/blog/alphago-zero-learning-scratch/
• https://brunch.co.kr/@kakao-it/138 (카카오 AI 리포트)
51. 51
현재의 인공지능은 과연 완벽한가?
구글은 이에 대해 빠르게 사과
다음 태그들은 Google Photo에서
나타나지 않게 만듬
- gorilla
- chimp
- chimpanzee
- monkey
52. 52
현재의 인공지능은 과연 완벽한가?
Adversarial Patch (https://www.youtube.com/watch?v=i1sp4X57TL4)
53. 53
현재의 인공지능은 과연 완벽한가?
A gibbon
• Goodfellow, I. J., Shlens, J., & Szegedy, C. (2014). Explaining and harnessing adversarial examples. arXiv preprint arXiv:1412.6572.
• https://en.wikipedia.org/wiki/Gibbon
58. 58
인공지능은 인간 전문가를 대체할 수 있을까?
AI 변호사?
[지문] (Seller's Warranty in cases of Superficies or Other Rights) Article 566 (1)In cases where the
subject matter of the sale is encumbered with for the purpose of a superficies, an emphyteusis, an
easement, a right of retention or a pledge, if the buyer does not know the same and cannot achieve
the purpose of the contract on account thereof, the buyer may cancel the contract. In such cases, if
the contract cannot be cancelled, the buyer may only demand compensation for damages. (2)The
provisions of the preceding paragraph shall apply mutatis mutandis in cases where an easement that
was referred to as being in existence for the benefit of immovable property that is the subject matter
of a sale, does not exist, and in cases where a leasehold is registered with respect to the immovable
property. (3)In the cases set forth in the preceding two paragraphs, the cancellation of the contract or
claim for damages must be made within one year from the time when the buyer comes to know the
facts.
(Seller's Warranty in cases of Mortgage or Other Rights) Article 567 (1)If the buyer loses his/her
ownership of immovable property that is the object of a sale because of the exercise of an existing
statutory lien or mortgage, the buyer may cancel the contract.(2)If the buyer preserves his/her
ownership by incurring expenditure for costs, he/she may claim reimbursement of those costs from
the seller.(3)In the cases set forth in the preceding two paragraphs, the buyer may claim compensation
if he/she suffered loss.
[명제] There is a limitation period on pursuance of warranty if there is restriction due to superficies on
the subject matter, but there is no restriction on pursuance of warranty if the seller's rights were
revoked due to execution of the mortgage.
[명제의 참/거짓 여부] 참(True)
법률 정보 추출 및 심판에 대한 경진대회 (Competition on Legal
Information Extraction/Entailment: COLIEE) 샘플 데이터
59. 59
인공지능은 인간 전문가를 대체할 수 있을까?
인공지능은 결국 현재까지 관측된 정보 이외에 새로운 정보를 발견
하는 것을 할 수 없다.
- 안과 질환 중 새로운 질병이 발견되어 질병관리 체계가 변하면, 안저 영상 판독
인공지능은 적응할 수 있는가?
- 법은 항상 고정되어 있는 것이 아니라, 사회 흐름과 대다수의 이익을 추구함에 따라
지속적으로 변하는 것이다. 앞서 기존 판례 등을 바탕으로 만든 인공지능 시스템이
법이 변화한 이후에도 잘 적용될 것인가?
- 인간 전문가는 이런 상황 변화에 빠르게 대응할 수 있다는 강점이 있으며 유연함.
è 인공지능이 이를 극복할 수 있을까?
60. 60
인공지능은 인간 전문가를 대체할 수 있을까?
인공지능 모델이 적용되는 상황은 잘못된 진단, 판단이 쉽게 일어
나는 환경인 경우가 많고, 이에 대한 책임 이슈가 존재한다.
- 테러가 일어나는 상황은 대다수의 일상적인 패턴 대비 그 수가 매우 적다. 그 수준은
몇 천분의 일, 몇 만분의 일 수준이 아니라 몇 천만분의 일, 몇 억분의 일 수준으로 적
을 것이다. 기술적으로 대다수의 정상 패턴으로부터 극소수의 이상 패턴을 모두 정확
하게 구분해내는 것은 매우 어렵다. 기계학습 분야에서는 이를 범주 불균형 (class
imbalance) 이라 칭하며, 많은 연구자들이 해결하기 위해 노력하는 분야이다.
- 의료 영상으로부터 암을 진단하는 인공지능 모델이 실제 암 환자의 케이스를 정상이라
고 진단을 한다면, 이는 한 사람의 생명에 위협을 가한 결정이 된다. 그럼 인공지능 모
델의 잘못된 판단은 누가 책임질 것인가? 인공지능 모델을 설계한 사람의 잘못인가,
인공지능 모델에 학습할 데이터를 만든 사람이 잘못인가, 아니면 인공지능 모델을 도
입하자고 주장한 사람의 잘못인가.
61. 61
인공지능은 인간 전문가를 대체할 수 있을까?
현재 인공지능 모델은 인력을 대체하는 개념보다는 의사결정 지원 시스템으로 바라보는
것이 옳다고 생각한다.
구글 딥마인드의 연구에서 안과 전문의가 인공지능보다 판독 성과가 나쁘다고 하여 이
들의 필요성이 없어지는 것은 아니다. 그들은 임상적으로 새로운 질환과 이에 대한 치료
법을 꾸준히 찾아낼 것이다. 인공지능은 그들의 경험을 조금이라도 자동화하여 진단 근
거를 만드는 데에 도움을 주는 역할을 하는 것이 중요하다.
그리고 인공지능에 의해 위협을 받는 직군이 생길 수는 있으나, 그들의 역할에 인공지능
모델의 운영 및 유지 영역에 들어가고 결국 완전한 대체는 어려울 것이라고 보인다.
62. 올바른 인공지능 발전을 위하여
기술도 중요하지만,
결국 학습을 위한 데이터 생성과
확보가 매우 중요하다.
63. 63
Quality of Data
데이터의 품질은 인공지능 모델 성능의 가장 중요한 요소이다.
https://www.linkedin.com/pulse/20140922000317-25059308-garbage-in-garbage-out/
https://kerriknox.liberty.me/anarchy-during-the-gold-rush-from-eyewitnesses/
67. 강연일정
• Clip IT (9회): 4차 산업혁명 주요기술을 소개하는 강연 시리즈
• My Punch Line (9회): 선배들의 업력 노하우를 핵심 공개하는 시리즈
4월 6일
Clip IT
머신러닝과 인공지능의 현재와 미래
고태훈
서울대병원 정보화실 연구교수, 『4차 산업혁
명』,『인공지능』(오컴/살림)
4월 20일
My Punch Line
카카오 사업팀은 어떻게 일할까?
카카오 드라이버 업무 체험기
허경석
카카오모빌리티, 『공유경제, O2O, Mobility』
(오컴/살림) , 『스타트업 코리아』 (오컴)
5월 4일
Clip IT
증강/가상현실의 현재와 미래사회
우장훈
LGU+ AR/VR, 『4차 산업혁명』, 『5G』, 『증강∙
가상현실』 (오컴/살림), 『가상현실』(오컴)
5월 18일
My Punch Line
대기업과 스타트업에서 일하는 것의 차이는?
미디어 트렌드, 네이티브 애드, 그리고 ㅍㅍㅅㅅ
최기영
‘ㅍㅍㅅㅅ’ , 『드론』 (오컴/살림, 『스타트업 코
리아』, 『왜 지금 드론인가』(오컴) 등
68. 6월 1일
Clip IT
블록체인의 현재와 미래사회
유현재
한국거래소 글로벌IT사업단, 『4차 산업혁명』,
『블록체인』(오컴/살림) 등
6월 15일
My Punch Line
서울예대에서 교수로 일한다는 것은?
현재 영상분야에 속한 사람들의 관심사는?
김광집
서울예술대학교 영상학부 교수, 『가상현실』
(오컴) 등
7월 6일
Clip IT
5G의 현재와 미래사회
이상협
LGU+ 5G 기반 신사업, 『5G』(오컴/살림)
7월 20일
My Punch Line
국내 전문자격제도와
변호사, 세무사로서의 직업생활 소개
AI 혁명이 법조계에 미칠 영향
채용현
세무사, 변호사, 현재 법무부 국가송무과 공익
법무관, 『가상화폐 트렌드』
8월 3일
Clip IT
전기자동차의 현재와 미래사회
전진환
LGU+ 신기술 기반 신사업, 『전기자동차, 지
금 사도 될까?』(오컴)
69. 8월 17일
My Punch Line
스마트자동차학과 교수가 되기까지의
내 인생 그래프
내가 보는 자율주행자동차 세상의 미래는?
박성근
순천향대학교 스마트자동차학과 교수, 『자율
주행자동차』 (오컴/살림)
9월 7일
Clip IT
스마트팩토리의 현재와 미래사회
권진만
크레스프리(Cresprit) 대표, 사물인터넷 플랫
폼 ALOOH 개발, 스마트팩토리 공급
9월 21일
My Punch Line
화성에서 온 개발자, 금성에서 온 기획자
벤처기업, 제조사, 통신사의 개발자, 영업사원,
마케터, 기획자의 이야기
윤성훈
KT 멤버십마케팅팀, 『스타트업 코리아』 (오컴)
10월 5일
Clip IT
사물인터넷의 현재와 미래사회
이정용
KT IoT 사업, 『사물인터넷』(오컴/살림) 『스
타트업 코리아』, 『사물인터넷, 실천과 상상력』
(오컴) 등
10월 19일
My Punch Line
일주일만에 ‘대리’에서 ‘대표’로
대기업 퇴사 후 스타트업 창업 스토리
전일균
여행 스타트업 루텔라(Routela) 대표, 『스타
트업 코리아』 (오컴)
70. 11월 2일
Clip IT
스마트시티의 현재와 미래사회
이용주
LGU+ IoT전략팀, 『스마트시티』(오컴/살림)
11월 16일
My Punch Line
보험사에서는 무슨 일들을 할까?
회사 간의 제휴 업무란 무엇인가?
한성호
LGU+ AR/VR, 『4차 산업혁명』, 『5G』, 『증강∙
가상현실』 (오컴/살림), 『가상현실』(오컴)
12월 7일
Clip IT
헬스케어의 현재와 미래사회
김종엽
DB손해보험 제휴업무 10년, LG CNS에서
2년간 오라클 엔지니어
12월 21일
My Punch Line
스마트폰 요금은 어떻게 설계할까?
책은 왜 , 어떻게 쓸까?
편석준
오컴 대표. 『사물인터넷』, 『구글이 달로 가는
길』 등, Clip IT 시리즈(13권) 기획∙편집