SlideShare une entreprise Scribd logo
1  sur  19
Télécharger pour lire hors ligne
Structure of Model and Task
#cliche #state-of-the-Art #goal
배지연
Contents
1. Intro
2. Computer Vision
3. Review
4. Representation of Model
2
1. Intro
3
P stage Routine
>> EDA → Model Search
→ Experiment → Ensemble
다양한 성능 좋은 모델을 앙상블함으로써 일반화 성능을 높인다
4
Semantic Segmentation Competition
Backbone 대입 시 성능 향상 Backbone 대입 시 성능 하락
5
As a Result
왜 성능이 좋지 않을까?
== 왜 다른 과제에서는 좋은 성능을 보였던 모델이
이 과제에는 적합하지 않을까?
2. Computer Vision
6
사람의 시각을 모방하다 ≒ 시각 정보를 인식하다
feature map으로 표현되는 정보를 저장하고 전달하는 과정
그림 © NAVER CONNECT Foundation
Train
그림 © NAVER CONNECT Foundation
7
Bias / Specific
모델의 성능을 향상하다
>> 모델의 정보에 대한 반응을 넓히다
>> 시각의 보편적인 특징(color, shape, texture)을 반영한다
>> 인간의 시각을 모방하다
Task Metric에서의 성능을 향상하다
>>>> color, texture bias를 줄이고 shape bias를 늘리다
3. Review
8
그림 © NAVER CONNECT Foundation
Object Detection Semantic Segmentation
>> mAP50 >> mIoU
9
CNN
[https://arxiv.org/abs/1512.03385]
Convolution과 Sub Sampling을 반복하여 Feature을 찾고 연결하는 구조
ResNet
Skip Connection Bottle Neck
10
RNN
Sequential data를 입력으로 받기 위해 과거의 정보를 요약하는 hidden state를 포함하는 구조
그림 © NAVER CONNECT Foundation
>> RNN은 입력 데이터가 일부 탈락되거나 순서가 바뀌면 모델이 처리하기 어려움
>> vanishing/ exploding gradient issue
11
Vision Transformer
[https://openreview.net/forum?id=YicbFdNTTy]
12
Object Detection
전체로부터 Object의 영역을 찾고 해당 영역을 classification
>> Receptive field와 object가 어디에 존재하는지 판단하는 것이 중요
Fast R-CNN (2-stage Detector)
그림 © NAVER CONNECT Foundation
13
Object Detection
YOLO (1-stage Detector)
그림 © NAVER CONNECT Foundation
14
Semantic Segmentation
Pixcel 단위로 각 픽셀이 속하는 Object의 classification
>> Receptive field와 object를 복원하는 성능이 중요
DeepLabv3
그림 © NAVER CONNECT Foundation
15
Semantic Segmentation
U-Net
그림 © NAVER CONNECT Foundation
4. Representation of Model
16
>> Visualization
>> Diagnosis
>> Disentangling
>> Interpretation
>> Evaluation metric
>> For middle-to-end Learning
[Visual Interpretability for Deep Learning : a Survey]
모델을 표현하는 6가지 관점
도표가 제시하는 해석 방향성을 참고하여 모델의 이해 및 활용 방법을 찾을 수 있다
17
Diagnosis
1 Analyze CNN feature from a global view
>> filter의 의미와 전달력을 분석
2 Extracts image regions that directly contribute the network output
>> network output에 가장 민감하게 반응한 이미지 영역을 추출
3 The estimation of vulnerable points in the feature space
>> feature space의 bias를 진단하고 추정
4 Refine network representations based on the analysis of network feature spaces
>> 학습한 model이 놓친 부분을 찾기
5 Discover potential, biased representations
[Visual Interpretability for Deep Learning : a Survey]
18
Disentangling
각 filter로부터 시각 정보가 어떻게 연결되는지 파악하기 위한 질문
[Visual Interpretability for Deep Learning : a Survey]
Q. 각 filter는 얼마나 많은 정보를 외우고 있는가?
Q. 해당 패턴이 특정 영역이나 질감을 설명할 수 있는가?
Q. 공동으로 활성화된 패턴의 관계는 어떠한가?
Q. 개체를 설명하기 위해서 어떤 패턴이 활성화 되는가?
감사합니다
19

Contenu connexe

Similaire à [부스트캠프 Tech Talk] 배지연_Structure of Model and Task

Similaire à [부스트캠프 Tech Talk] 배지연_Structure of Model and Task (20)

스마트폰 위의 딥러닝
스마트폰 위의 딥러닝스마트폰 위의 딥러닝
스마트폰 위의 딥러닝
 
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
LINC3.0 캡스톤디자인 경진대회_로운팀.pptxLINC3.0 캡스톤디자인 경진대회_로운팀.pptx
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
 
파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)
 
iOS Architecture.pdf
iOS Architecture.pdfiOS Architecture.pdf
iOS Architecture.pdf
 
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
풀잎스쿨 - LIME 발표자료(설명가능한 인공지능 기획!)
 
200819 NAVER TECH CONCERT 01_100만 달러짜리 빠른 앱을 만드는 비법 전수
200819 NAVER TECH CONCERT 01_100만 달러짜리 빠른 앱을 만드는 비법 전수200819 NAVER TECH CONCERT 01_100만 달러짜리 빠른 앱을 만드는 비법 전수
200819 NAVER TECH CONCERT 01_100만 달러짜리 빠른 앱을 만드는 비법 전수
 
100만 달러짜리 빠른앱 만드는 비법
100만 달러짜리 빠른앱 만드는 비법100만 달러짜리 빠른앱 만드는 비법
100만 달러짜리 빠른앱 만드는 비법
 
The Cucumber for Java
The Cucumber for JavaThe Cucumber for Java
The Cucumber for Java
 
산학 제출 PPT
산학 제출 PPT산학 제출 PPT
산학 제출 PPT
 
소프트웨어 마에스트로 10기 - 책을 만나는 순간, 책을찍다
소프트웨어 마에스트로 10기 - 책을 만나는 순간, 책을찍다소프트웨어 마에스트로 10기 - 책을 만나는 순간, 책을찍다
소프트웨어 마에스트로 10기 - 책을 만나는 순간, 책을찍다
 
Achieving human parity on visual question answering alicemind
Achieving human parity on visual question answering alicemindAchieving human parity on visual question answering alicemind
Achieving human parity on visual question answering alicemind
 
Refinenet
RefinenetRefinenet
Refinenet
 
[강의] OOP 개요
[강의] OOP 개요[강의] OOP 개요
[강의] OOP 개요
 
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
Progressive Growing of GANs for Improved Quality, Stability, and Variation Re...
 
Software defect prediction: do different classifiers find the same defects?
Software defect prediction: do different classifiers find the same defects?Software defect prediction: do different classifiers find the same defects?
Software defect prediction: do different classifiers find the same defects?
 
Sw개발 hw제작설계서 임베부스러기
Sw개발 hw제작설계서 임베부스러기Sw개발 hw제작설계서 임베부스러기
Sw개발 hw제작설계서 임베부스러기
 
Vip detection sensor
Vip detection sensorVip detection sensor
Vip detection sensor
 
딥뉴럴넷 클러스터링 실패기
딥뉴럴넷 클러스터링 실패기딥뉴럴넷 클러스터링 실패기
딥뉴럴넷 클러스터링 실패기
 
UNUS Big Data BEANs 소개서
UNUS Big Data BEANs 소개서 UNUS Big Data BEANs 소개서
UNUS Big Data BEANs 소개서
 
Codex project
Codex projectCodex project
Codex project
 

Plus de CONNECT FOUNDATION

Plus de CONNECT FOUNDATION (20)

부스트캠프 웹・모바일 8기 설명회 (2023년)
부스트캠프 웹・모바일 8기 설명회 (2023년)부스트캠프 웹・모바일 8기 설명회 (2023년)
부스트캠프 웹・모바일 8기 설명회 (2023년)
 
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
[부스트캠프 웹・모바일 7기 Tech Talk]임현택_OS 그냥 재미로
 
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
[부스트캠프 웹・모바일 7기 Tech Talk]이지훈_뉴비의 시점에서 바라본 Kotlin_suspend
 
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
[부스트캠프 웹・모바일 7기 Tech Talk]오승민_Swift의 Protocol에는 감동이 있다
 
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
[부스트캠프 웹・모바일 7기 Tech Talk]안병준_프론트엔드,어쩌다 여기까지
 
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
[부스트캠프 웹・모바일 7기 Tech Talk]이휘찬-의존성 관리 어디까지 알고있니
 
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는  어떻게  재활용하는가[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는  어떻게  재활용하는가
[부스트캠프 웹・모바일 7기 Tech Talk]박명범_RecyclerView는 어떻게 재활용하는가
 
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
[부스트캠프 웹・모바일 7기 Tech Talk]김지원_너와 나의 함수형 프로그래밍
 
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
[부스트캠프 웹・모바일 7기 Tech Talk]김성은_Recoil
 
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
[부스트캠프 웹・모바일 7기 Tech Talk]고병학_WWDC 뭘 볼까
 
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
[특강] 개발자의 학습과 성장 / 이선협 (Cobalt, Inc.)
 
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
 [특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti) [특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노수진(Momenti)
 
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
[특강] 현업 개발자에게 듣는 모바일 개발자의 삶과 매력 / 노현석(카카오뱅크)
 
부스트캠프 웹∙모바일 7기 설명회
부스트캠프 웹∙모바일 7기 설명회부스트캠프 웹∙모바일 7기 설명회
부스트캠프 웹∙모바일 7기 설명회
 
[부스트캠프 Tech Talk] 신원지_Wandb Visualization
[부스트캠프 Tech Talk] 신원지_Wandb Visualization[부스트캠프 Tech Talk] 신원지_Wandb Visualization
[부스트캠프 Tech Talk] 신원지_Wandb Visualization
 
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
[부스트캠프 Tech Talk] 김제우_짝코딩(Pair Programming)
 
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
[부스트캠프 Tech Talk] 김동현_리팩터링을 통한 내실 다지기
 
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
[부스트캠프 Tech Talk] 진명훈_datasets로 협업하기
 
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
[부스트캠프 Tech Talk] 안영진_Tackling Complexity with Easy Stuff
 
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기
[부스트캠프 Tech talk] 황우진  딥러닝 가볍게 구현해보기[부스트캠프 Tech talk] 황우진  딥러닝 가볍게 구현해보기
[부스트캠프 Tech talk] 황우진 딥러닝 가볍게 구현해보기
 

Dernier

Dernier (7)

JMP를 활용한 가속열화 분석 사례
JMP를 활용한 가속열화 분석 사례JMP를 활용한 가속열화 분석 사례
JMP를 활용한 가속열화 분석 사례
 
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
JMP 기능의 확장 및 내재화의 핵심 JMP-Python 소개
 
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
실험 설계의 평가 방법: Custom Design을 중심으로 반응인자 최적화 및 Criteria 해석
 
JMP가 걸어온 여정, 새로운 도약 JMP 18!
JMP가 걸어온 여정, 새로운 도약 JMP 18!JMP가 걸어온 여정, 새로운 도약 JMP 18!
JMP가 걸어온 여정, 새로운 도약 JMP 18!
 
JMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
JMP를 활용한 전자/반도체 산업 Yield Enhancement MethodologyJMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
JMP를 활용한 전자/반도체 산업 Yield Enhancement Methodology
 
데이터 분석 문제 해결을 위한 나의 JMP 활용법
데이터 분석 문제 해결을 위한 나의 JMP 활용법데이터 분석 문제 해결을 위한 나의 JMP 활용법
데이터 분석 문제 해결을 위한 나의 JMP 활용법
 
공학 관점에서 바라본 JMP 머신러닝 최적화
공학 관점에서 바라본 JMP 머신러닝 최적화공학 관점에서 바라본 JMP 머신러닝 최적화
공학 관점에서 바라본 JMP 머신러닝 최적화
 

[부스트캠프 Tech Talk] 배지연_Structure of Model and Task

  • 1. Structure of Model and Task #cliche #state-of-the-Art #goal 배지연
  • 2. Contents 1. Intro 2. Computer Vision 3. Review 4. Representation of Model 2
  • 3. 1. Intro 3 P stage Routine >> EDA → Model Search → Experiment → Ensemble 다양한 성능 좋은 모델을 앙상블함으로써 일반화 성능을 높인다
  • 4. 4 Semantic Segmentation Competition Backbone 대입 시 성능 향상 Backbone 대입 시 성능 하락
  • 5. 5 As a Result 왜 성능이 좋지 않을까? == 왜 다른 과제에서는 좋은 성능을 보였던 모델이 이 과제에는 적합하지 않을까?
  • 6. 2. Computer Vision 6 사람의 시각을 모방하다 ≒ 시각 정보를 인식하다 feature map으로 표현되는 정보를 저장하고 전달하는 과정 그림 © NAVER CONNECT Foundation Train 그림 © NAVER CONNECT Foundation
  • 7. 7 Bias / Specific 모델의 성능을 향상하다 >> 모델의 정보에 대한 반응을 넓히다 >> 시각의 보편적인 특징(color, shape, texture)을 반영한다 >> 인간의 시각을 모방하다 Task Metric에서의 성능을 향상하다 >>>> color, texture bias를 줄이고 shape bias를 늘리다
  • 8. 3. Review 8 그림 © NAVER CONNECT Foundation Object Detection Semantic Segmentation >> mAP50 >> mIoU
  • 9. 9 CNN [https://arxiv.org/abs/1512.03385] Convolution과 Sub Sampling을 반복하여 Feature을 찾고 연결하는 구조 ResNet Skip Connection Bottle Neck
  • 10. 10 RNN Sequential data를 입력으로 받기 위해 과거의 정보를 요약하는 hidden state를 포함하는 구조 그림 © NAVER CONNECT Foundation >> RNN은 입력 데이터가 일부 탈락되거나 순서가 바뀌면 모델이 처리하기 어려움 >> vanishing/ exploding gradient issue
  • 12. 12 Object Detection 전체로부터 Object의 영역을 찾고 해당 영역을 classification >> Receptive field와 object가 어디에 존재하는지 판단하는 것이 중요 Fast R-CNN (2-stage Detector) 그림 © NAVER CONNECT Foundation
  • 13. 13 Object Detection YOLO (1-stage Detector) 그림 © NAVER CONNECT Foundation
  • 14. 14 Semantic Segmentation Pixcel 단위로 각 픽셀이 속하는 Object의 classification >> Receptive field와 object를 복원하는 성능이 중요 DeepLabv3 그림 © NAVER CONNECT Foundation
  • 15. 15 Semantic Segmentation U-Net 그림 © NAVER CONNECT Foundation
  • 16. 4. Representation of Model 16 >> Visualization >> Diagnosis >> Disentangling >> Interpretation >> Evaluation metric >> For middle-to-end Learning [Visual Interpretability for Deep Learning : a Survey] 모델을 표현하는 6가지 관점 도표가 제시하는 해석 방향성을 참고하여 모델의 이해 및 활용 방법을 찾을 수 있다
  • 17. 17 Diagnosis 1 Analyze CNN feature from a global view >> filter의 의미와 전달력을 분석 2 Extracts image regions that directly contribute the network output >> network output에 가장 민감하게 반응한 이미지 영역을 추출 3 The estimation of vulnerable points in the feature space >> feature space의 bias를 진단하고 추정 4 Refine network representations based on the analysis of network feature spaces >> 학습한 model이 놓친 부분을 찾기 5 Discover potential, biased representations [Visual Interpretability for Deep Learning : a Survey]
  • 18. 18 Disentangling 각 filter로부터 시각 정보가 어떻게 연결되는지 파악하기 위한 질문 [Visual Interpretability for Deep Learning : a Survey] Q. 각 filter는 얼마나 많은 정보를 외우고 있는가? Q. 해당 패턴이 특정 영역이나 질감을 설명할 수 있는가? Q. 공동으로 활성화된 패턴의 관계는 어떠한가? Q. 개체를 설명하기 위해서 어떤 패턴이 활성화 되는가?