SlideShare une entreprise Scribd logo
1  sur  25
Télécharger pour lire hors ligne
딥러닝을 이용한 얼굴 인식
신종주(isaac.shin)
kakao corp.(멀티미디어처리파트)
(셀럽)
누구세요?
얼굴 인식이란?
얼굴 인식 과정
1. Detection 2. Alignment 3. Normalization
4. Recognition
224
224
Contents
- 얼굴 인식 분류
- 학습 방법
- 최근 얼굴 인식 연구 방향
- 카카오의 얼굴 인식
Identification vs. Verification
Identification
- 입력 얼굴과 등록된 얼굴들을 비교해서 누구인지 알려줌
- Top-1&5 accuracy
Verification
- 주어진 두 얼굴이 같은지를 판단
- TAR@FAR=0.001
- 틀린 것이 0.1%일때 몇 % 맞췄나? 높을 수록 좋음
- LFW
?
= ≠
Probe
Gallery
LFW
Labeled Faces in the Wild (2008)
6000 pair
- 3000 pair
- 3000 pair
/ .
: 97.53%
?
Feature Embedding for Face Recognition
FC

(128,

256,
512,
1024…)
Softmax
Metric learning
Train
Dimension reduction
conv,
bn,
act,
pooling
Feature Embedding for Face Recognition
FC

(128,

256,
512,
1024…)
Euclidean
distance
Cosine
similarity
Test
FC

(128,

256,
512,
1024…)
conv,
bn,
act,
pooling
conv,
bn,
act,
pooling
Metric Learning
Triplet loss (CVPR 2015) Contrastive loss (NIPS 2014)
Center loss (ECCV 2016) Ring loss (CVPR 2018)
Angular classification
Sphere Face (CVPR 2017)

(A-Softmax)
CosFace (CVPR 2018)
(Large Margin CL) ArcFace (arxiv 2017)
NormFace (ACMMM 2017)
Weight normalization
Angular classification
ShpereFace CosFaceArcFace
Recent Databases
MSCeleb-1M (ECCV 2016)
- 10
- 1000
VGGFace2 (FG 2018)
- 9131
- 331
VGGFace2
- Network : resnet-34
- embedding size : 256
- Optimizer : Adam
- Softmax
99% !!
??
그냥 한번 학습해 보자!!
VGGFace2
우리 서비스에 이용할 수 있을까?
대부분 서양인
Acc.
TAR@FAR
=0.001
TAR@FAR
=0.01
TAR@FAR
=0.1
0.907 0.560 0.735 0.914!!
카카오의 얼굴 인식
!!
!!
카카오의 얼굴 인식
Train Val Test
3,086 

1,996,642
3,086 

222,192
343 

128,596
aug. 2
1,164 

1,262,940
1,164 

140,844
130 

29,614
aug. 4
Kakao Dataset
몇달 간 모으고, GT 찍고.......
카카오의 얼굴 인식
Evaluation
- LFW protocol 사용
Softmax Softmax+Center loss
Acc.
TAR@FAR
=0.001
TAR@FAR
=0.01
TAR@FAR
=0.1
Acc.
TAR@FAR
=0.001
TAR@FAR
=0.01
TAR@FAR
=0.1
0.991 0.976 0.992 0.998 0.997 0.996 0.997 0.998
0.985 0.921 0.980 0.999 0.999 0.999 1.0 1.0
+ 0.991 0.972 0.992 0.999 0.998 0.997 0.998 0.999
Same Diff
36,015 36,015
13,650 13,650
+ 49,665 49,665
카카오의 얼굴 인식
Data + loss Acc.
TAR@FAR
=0.001
VGGFace2 + Softmax 0.972 0.892
Kakao Dataset + Softmax 0.991 0.972
Kakao Dataset + Softmax + centerloss
(Ours)
0.998 0.997
요약
- 한국인 성능
- 서양인 + 한국인 성능
Data + loss Acc.
TAR@FAR
=0.001
VGGFace2 + Softmax 0.907 0.560
Kakao Dataset + Softmax 0.985 0.921
Kakao Dataset + Softmax + centerloss
(Ours)
0.999 0.997
43.7%p
10.5%p
카카오의 얼굴 인식
이게 끝?
- No
- 모으고, GT 찍고, 성능 높이고,
- 또 모으고, 또 GT 찍고, 성능 높이고,
- (자동화 하고), 성능 높이자.
카카오의 얼굴 인식
서비스
- 다음 라이브픽
카카오의 얼굴 인식
서비스
- 연내 API 오픈 계획
카카오의 얼굴 인식
서비스
- 연내 API 오픈 계획
참고할 사이트
1. https://github.com/davidsandberg/facenet/wiki/Training-
using-the-VGGFace2-dataset
- Tensorflow
- VGGFace2 학습
- LFW : 99.6%
2. https://github.com/deepinsight/insightface
- mxnet
- Angular classification
- MSCeleb-1M 학습
- LFW : 99.8%
Thank you.

Contenu connexe

Tendances

Tendances (20)

はじめようRGB-Dセンシングと画像処理
はじめようRGB-Dセンシングと画像処理はじめようRGB-Dセンシングと画像処理
はじめようRGB-Dセンシングと画像処理
 
ICLR2020の異常検知論文の紹介 (2019/11/23)
ICLR2020の異常検知論文の紹介 (2019/11/23)ICLR2020の異常検知論文の紹介 (2019/11/23)
ICLR2020の異常検知論文の紹介 (2019/11/23)
 
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
Visual SLAM: Why Bundle Adjust?の解説(第4回3D勉強会@関東)
 
アプリを成長させるためのログ取りとログ解析に必要なこと
アプリを成長させるためのログ取りとログ解析に必要なことアプリを成長させるためのログ取りとログ解析に必要なこと
アプリを成長させるためのログ取りとログ解析に必要なこと
 
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
SSII2020TS: 物理ベースビジョンの過去・現在・未来 〜 カメラ・物体・光のインタラクションを モデル化するには 〜
 
強化学習における好奇心
強化学習における好奇心強化学習における好奇心
強化学習における好奇心
 
LiDARとSensor Fusion
LiDARとSensor FusionLiDARとSensor Fusion
LiDARとSensor Fusion
 
Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由Cosine Based Softmax による Metric Learning が上手くいく理由
Cosine Based Softmax による Metric Learning が上手くいく理由
 
SfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法についてSfM Learner系単眼深度推定手法について
SfM Learner系単眼深度推定手法について
 
強化学習の基礎的な考え方と問題の分類
強化学習の基礎的な考え方と問題の分類強化学習の基礎的な考え方と問題の分類
強化学習の基礎的な考え方と問題の分類
 
Visual odometry presentation_without_video
Visual odometry presentation_without_videoVisual odometry presentation_without_video
Visual odometry presentation_without_video
 
Introduction to YOLO detection model
Introduction to YOLO detection modelIntroduction to YOLO detection model
Introduction to YOLO detection model
 
DeepLearningTutorial
DeepLearningTutorialDeepLearningTutorial
DeepLearningTutorial
 
ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築ROS を用いた自律移動ロボットのシステム構築
ROS を用いた自律移動ロボットのシステム構築
 
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
 
AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜AI技術の現状と課題 〜aiboおよび自然言語処理〜
AI技術の現状と課題 〜aiboおよび自然言語処理〜
 
One Class SVMを用いた異常値検知
One Class SVMを用いた異常値検知One Class SVMを用いた異常値検知
One Class SVMを用いた異常値検知
 
DeepVO - Towards Visual Odometry with Deep Learning
DeepVO - Towards Visual Odometry with Deep LearningDeepVO - Towards Visual Odometry with Deep Learning
DeepVO - Towards Visual Odometry with Deep Learning
 
[DL輪読会]Whole-Body Human Pose Estimation in the Wild
[DL輪読会]Whole-Body Human Pose Estimation in the Wild[DL輪読会]Whole-Body Human Pose Estimation in the Wild
[DL輪読会]Whole-Body Human Pose Estimation in the Wild
 
20190307 visualslam summary
20190307 visualslam summary20190307 visualslam summary
20190307 visualslam summary
 

Plus de if kakao

Plus de if kakao (20)

바닥부터 시작하는 Vue 테스트와 리팩토링
바닥부터 시작하는 Vue 테스트와 리팩토링바닥부터 시작하는 Vue 테스트와 리팩토링
바닥부터 시작하는 Vue 테스트와 리팩토링
 
카카오커머스를 지탱하는 Angular
카카오커머스를 지탱하는 Angular카카오커머스를 지탱하는 Angular
카카오커머스를 지탱하는 Angular
 
프렌즈타임 웹앱 삽질기
프렌즈타임 웹앱 삽질기프렌즈타임 웹앱 삽질기
프렌즈타임 웹앱 삽질기
 
카프카 기반의 대규모 모니터링 플랫폼 개발이야기
카프카 기반의 대규모 모니터링 플랫폼 개발이야기카프카 기반의 대규모 모니터링 플랫폼 개발이야기
카프카 기반의 대규모 모니터링 플랫폼 개발이야기
 
TOROS N2 - lightweight approximate Nearest Neighbor library
TOROS N2 - lightweight approximate Nearest Neighbor libraryTOROS N2 - lightweight approximate Nearest Neighbor library
TOROS N2 - lightweight approximate Nearest Neighbor library
 
딥러닝을 활용한 뉴스 메타 태깅
딥러닝을 활용한 뉴스 메타 태깅딥러닝을 활용한 뉴스 메타 태깅
딥러닝을 활용한 뉴스 메타 태깅
 
눈으로 듣는 음악 추천 시스템
눈으로 듣는 음악 추천 시스템눈으로 듣는 음악 추천 시스템
눈으로 듣는 음악 추천 시스템
 
Keynote / 2018
Keynote / 2018Keynote / 2018
Keynote / 2018
 
카카오 봇 플랫폼 소개
카카오 봇 플랫폼 소개카카오 봇 플랫폼 소개
카카오 봇 플랫폼 소개
 
다음웹툰의 UX(Animation, Transition, Custom View)
다음웹툰의 UX(Animation, Transition, Custom View)다음웹툰의 UX(Animation, Transition, Custom View)
다음웹툰의 UX(Animation, Transition, Custom View)
 
모바일 게임플랫폼과 인프라 구축 경험기
모바일 게임플랫폼과 인프라 구축 경험기모바일 게임플랫폼과 인프라 구축 경험기
모바일 게임플랫폼과 인프라 구축 경험기
 
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
 
카카오뱅크 모바일앱 개발 이야기
카카오뱅크 모바일앱 개발 이야기카카오뱅크 모바일앱 개발 이야기
카카오뱅크 모바일앱 개발 이야기
 
다음 모바일 첫 화면 개선기
다음 모바일 첫 화면 개선기다음 모바일 첫 화면 개선기
다음 모바일 첫 화면 개선기
 
글로벌 게임 플랫폼에서 무정지, 무점검 서버 개발과 운영 사례
글로벌 게임 플랫폼에서 무정지, 무점검 서버 개발과 운영 사례글로벌 게임 플랫폼에서 무정지, 무점검 서버 개발과 운영 사례
글로벌 게임 플랫폼에서 무정지, 무점검 서버 개발과 운영 사례
 
액티브X 없는 블록체인 기반 PKI 시스템
액티브X 없는 블록체인 기반 PKI 시스템액티브X 없는 블록체인 기반 PKI 시스템
액티브X 없는 블록체인 기반 PKI 시스템
 
Klaytn: Service-Oriented Enterprise-Grade Public Blockchain Platform
Klaytn: Service-Oriented Enterprise-Grade Public Blockchain PlatformKlaytn: Service-Oriented Enterprise-Grade Public Blockchain Platform
Klaytn: Service-Oriented Enterprise-Grade Public Blockchain Platform
 
Kakao Cloud Native Platform, 9rum
Kakao Cloud Native Platform, 9rumKakao Cloud Native Platform, 9rum
Kakao Cloud Native Platform, 9rum
 
카프카, 산전수전 노하우
카프카, 산전수전 노하우카프카, 산전수전 노하우
카프카, 산전수전 노하우
 
스프링5 웹플럭스와 테스트 전략
스프링5 웹플럭스와 테스트 전략스프링5 웹플럭스와 테스트 전략
스프링5 웹플럭스와 테스트 전략
 

딥러닝을 이용한 얼굴 인식