SlideShare a Scribd company logo
1 of 19
Download to read offline
Sparsifying Neural Network Connections
for Face Recognition
@51takahashi
• さのまる
• @51Takahashi
• 顔認証の研究開発やっています
• 今回の発表は所属組織と関係ありません
自己紹介
CVPR2016読み会
2
はじめに
CVPR2016読み会
3
• CVPR2016の顔関連の研究はどれくらい?
– 検索条件: 手動
» 39/643件(DNN/RNN系は11件)
» 全部は読めてません…
– 研究動向
» 顔認証/検索 9件(4件)⇒ 1つ紹介します
» 3D顔モデリング 7件(0件)
» 顔特徴点検出 7件(3件)
» 表情認識 6件(1件)
» 年齢 3件(2件)
» データセット 2件(0件)
» 顔属性認識 2件(0件)
» 顔検出 1件(1件)
» 視線推定 1件(0件)
» 心拍推定 1件(0件)
論文の概要
CVPR2016読み会
4
• タイトル
– Sparsifying Neural Network Connections for Face Recognition
– 顔認証のためのニューラルネットワーク結合のスパース化
• どこの研究?
– SenseTimeとThe Chinese University of Hong Kong(CUHK)の人たち
• どんな研究?
– 顔認証用CNNを枝刈りして(疎にして)パラメータ数削減・性能向上
• どんな手法?
– パラメータ数の多い最終層から順に枝刈り
» ニューロン間が無相関な結合を主に枝刈りしよう!という発想
• 結果は?
– パラメータの圧縮率は12~76%
– 顔認証の性能は若干向上
» LFWデータセットで、精度98.95% ⇒ 99.30%(圧縮率76%)
» (エラー1.05% ⇒ 0.70%)
著者紹介
CVPR2016読み会
5
• Yi Sun(SenseTime), Xiaogang Wang(CUHK), Xiaoou Tang(CUHK)
– CUHKのすごいひとたち
– CUHKのグループはCVPR2016だけで16件発表
• 顔関連の主要論文
– 顔認証
» Deep learning face representation from predicting 10,000 classes
(通称DeepID, CVPR2014) ⇒ Facebookの対抗馬
» Deep Learning Face Representation by Joint Identification-
Verification (通称DeepID2, NIPS2014)
» Surpassing Human-Level Face Verification Performance on LFW
with GaussianFace (通称GaussianFace, AAAI2015)
» Deeply learned face representations are sparse, selective, and
robust (通称DeepID2+, CVPR2015) ⇒ Googleの対抗馬
– 顔特徴点検出
» Face Alignment by Coarse-to-Fine Shape Searching (CVPR2015)
予備知識1: LFW
CVPR2016読み会
6
• 近年の顔認証=LFW (Labeled Faces in the Wild)
– 顔認証ではMNIST的な存在 (2007年~)
– 本人ペア3000組+他人ペア3000組を正しく分類する問題
• LFW (unrestricted: 外部データあり) の歴史
– 2012年
» 92.40%: Joint Bayesian, ECCV (MSRA)
– 2013年
» 95.17%: High-dimensional LBP, CVPR (MSRA)
– 2014年
» 97.35%: DeepFace*, CVPR (Facebook)
» 97.45%: DeepID*, CVPR (CUHK)
– 2015年
» 98.52%: GaussianFace, AAAI (CUHK)
» 99.47%: DeepID2+*, CVPR (CUHK)
» 99.63%: FaceNet*, CVPR (Google)
⇒ 性能は上限まで達成、高速化や省メモリ化が課題か?
Aaron Eckhartさん
はLena的存在♡
予備知識2: LFWの後継者
CVPR2016読み会
7
• LFWの終焉
– Googleの2億枚の学習画像を使った力技でほぼ完全攻略
– 新たな顔認証研究の幕開けでもあった…
• LFWの後継者
– YTF (YouTube Face, CVPR2011)
» YouTube動画からクロップしたデータセット、低画質
– IJB-A (IARPA Janus Benchmark A, CVPR2015)
» ネットで収集した画像、顔向きとか年齢とかエグい
» スポンサーはNIST (アメリカ国立標準技術研究所)
– MegaFace (CVPR2016)
» Flickrで収集した100万枚の中から特定の人を見つけるベンチマーク
» 顔認証というより顔検索
» スポンサー欄にはSamsung、Google、Intelの名前が…
– MS-Celeb-1M (ACMMM2016)
» 3日前にその存在を知りました…
Shinzo Abeさん
(IJB-Aの例)
予備知識3: DeepFace・DeepID
CVPR2016読み会
8
• ディープラーニングを使った顔認証
– 学習方法
» n人の学習データをnクラス分類するようにネットワークを学習
– 顔認証方法
» 最終隠れ層のアクティベーションを特徴量として利用
» 特徴量のコサイン類似度を計算することで顔認証の類似度になる
DeepID, CVPR2014 Bottleneckとも
本題:既存手法の問題点
CVPR2016読み会
9
• ディープラーニングを使った顔認証
– 計算コストが高い
– 必要メモリが大きい
» 小さなネットワークで顔認証したい!
» あわよくば性能向上させたい!
• ネットワークの軽量化(枝刈り)に関する先行研究
– OBD (Optimal Brain Damage) [LeCun+, NIPS1990]
– 重みの絶対値が小さい結合を枝刈り [Collins+, arXiv2014]
– BRP (Bayesian Regularization and Pruning) [Williams, NC1994]
» もっといい方法が欲しい!
• ネットワークの圧縮に関する先行研究
– ニューロンの重みをSVDしてモデルを圧縮 [Denton+, NIPS2014等]
– Knowledge distillation [Hinton+, arXiv2014]
提案手法のアイデア
CVPR2016読み会
10
• ニューロン間の相関に基づく枝刈り
– 無相関なニューロン間の結合は枝刈りしてしまおう!
– 最終層の結合から順に枝刈りさせよう!
主に最終層付近の
パラメータ数が多い!
提案手法
CVPR2016読み会
11
提案手法のアルゴリズム
1. ネットワークN0を普通に学習する (15万回)
2. for m from 1 to M
3. 最後からm層目の結合を枝刈り
4. Nm-1を初期値として、ネットワークNmを学習 (7万回)
5. end for
6. NM が完成
N0 N1 N2
… …
赤字は枝刈りした層
※プーリング層はできません
…
枝刈り
CVPR2016読み会
12
枝刈りのアルゴリズム(full/local connection層)
1. ある出力側ニューロンと結合してる入力側ニューロンの数をKとする
2. 疎性パラメータS、偏りパラメータλを決める (0<S<1、0≦λ≦1)
3. 相関計算用データで、各ニューロン間の相関 rk を計算する
4. rk において、正/負の値を rk
+/rk
-、数をK+/K-とする (K++K-=K)
5. rk
+を大きい順にソートする
6. 上位半分からλSK+個、下位半分から(1-λ)SK+個を残してランダムに刈る
7. rk
-を絶対値の大きい順にソートする
8. 上位半分からλSK-個、下位半分から(1-λ)SK-個を残してランダムに刈る
K=36個の結合の例
⇒ 枝刈り後はSK個になる
λ=0.75のとき、
強相関な結合の75%
弱相関な結合の25%
が残される
実験
CVPR2016読み会
13
• ネットワークの学習
– 学習用画像: 12,000名・290,000枚
» ディープラーニング用途としては小さめのデータセット
– 評価用画像: LFW、YTF、IJB-A
» 結果が細かすぎるのでLFWだけ紹介します…
– 疎性パラメータS: バリデーションセットで決定
– 偏りパラメータλ: 0.75
• 実装
– Caffeを使用
– 枝刈りを使った学習は、0/1のdropping matrixを使うと実装できる
実験結果1: LFW
CVPR2016読み会
14
枝刈りしたらすこし性能向上した!
12%のパラメータでもオリジナルの性能!
実験結果2: 偏りパラメータの効果
CVPR2016読み会
15
ランダム枝刈り(λ=0.5)・弱相関枝刈り(λ=1)は性能低下
実験結果3: フルスクラッチとの比較
CVPR2016読み会
16
フルスクラッチでスパースなネットワークは学習できない
実験結果4: 従来手法との比較
CVPR2016読み会
17
劇的によくなっている訳ではない…
論文のまとめ
CVPR2016読み会
18
• タイトル
– Sparsifying Neural Network Connections for Face Recognition
– 顔認証のためのニューラルネットワーク結合のスパース化
• どこの研究?
– SenseTimeとThe Chinese University of Hong Kong(CUHK)の人たち
• どんな研究?
– 顔認証用CNNを枝刈りして(疎にして)パラメータ数削減・性能向上
• どんな手法?
– パラメータ数の多い最終層から順に枝刈り
» ニューロン間が無相関な結合を主に枝刈りしよう!という発想
• 結果は?
– パラメータの圧縮率は12~76%
– 顔認証の性能は若干向上
» LFWデータセットで、精度98.95% ⇒ 99.30%(圧縮率76%)
» (エラー1.05% ⇒ 0.70%)
おつかれさまでした

More Related Content

Viewers also liked

Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Yuichi Yoshida
 
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~Takuya Akiba
 
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energiessublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energiesFujimoto Keisuke
 
PRML輪読#14
PRML輪読#14PRML輪読#14
PRML輪読#14matsuolab
 
ウェーブレット木の世界
ウェーブレット木の世界ウェーブレット木の世界
ウェーブレット木の世界Preferred Networks
 
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...Kenko Nakamura
 
Practical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architecturesPractical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architecturesKoji Matsuda
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたTakuya Minagawa
 
強化学習その2
強化学習その2強化学習その2
強化学習その2nishio
 
多項式あてはめで眺めるベイズ推定 ~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定 ~今日からきみもベイジアン~ tanutarou
 
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解くshindannin
 
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせLiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせTakuya Minagawa
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピTakahiro Kubo
 

Viewers also liked (14)

Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展
 
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~
 
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energiessublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energies
 
DeepLearningTutorial
DeepLearningTutorialDeepLearningTutorial
DeepLearningTutorial
 
PRML輪読#14
PRML輪読#14PRML輪読#14
PRML輪読#14
 
ウェーブレット木の世界
ウェーブレット木の世界ウェーブレット木の世界
ウェーブレット木の世界
 
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
 
Practical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architecturesPractical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architectures
 
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみたORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
 
強化学習その2
強化学習その2強化学習その2
強化学習その2
 
多項式あてはめで眺めるベイズ推定 ~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定 ~今日からきみもベイジアン~
 
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
 
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせLiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
 
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
 

Similar to CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition

これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...cvpaper. challenge
 
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1cvpaper. challenge
 
GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報NVIDIA Japan
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング. .
 
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-RegistrationDeep Learning JP
 
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編Daiyu Hatakeyama
 
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Posecvpaper. challenge
 
拡がるディープラーニングの活用
拡がるディープラーニングの活用拡がるディープラーニングの活用
拡がるディープラーニングの活用NVIDIA Japan
 

Similar to CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition (11)

CVPR 2018 速報
CVPR 2018 速報CVPR 2018 速報
CVPR 2018 速報
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
ICCV2019 report
ICCV2019 reportICCV2019 report
ICCV2019 report
 
DeepLearningDay2016Summer
DeepLearningDay2016SummerDeepLearningDay2016Summer
DeepLearningDay2016Summer
 
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
 
GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報
 
順序データでもベイズモデリング
順序データでもベイズモデリング順序データでもベイズモデリング
順序データでもベイズモデリング
 
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration
 
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
 
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
 
拡がるディープラーニングの活用
拡がるディープラーニングの活用拡がるディープラーニングの活用
拡がるディープラーニングの活用
 

CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition