Submit Search
Upload
CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
•
7 likes
•
3,934 views
Koichi Takahashi
Follow
CVPR2016読み会(2016/07/17)の資料 Sparsifying Neural Network Connections for Face Recognition
Read less
Read more
Technology
Report
Share
Report
Share
1 of 19
Download now
Download to read offline
Recommended
CVPR2017勉強会 Disentangled Representation Learning GAN for Pose-Invariant Face ...
CVPR2017勉強会 Disentangled Representation Learning GAN for Pose-Invariant Face ...
Koichi Takahashi
ICCV2015勉強会 顔関連論文のまとめ
ICCV2015勉強会 顔関連論文のまとめ
Koichi Takahashi
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
Kaoru Nasuno
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
Kaoru Nasuno
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
Rikiya Takahashi
Stochastic Variational Inference
Stochastic Variational Inference
Kaede Hayashi
20170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 2017
issaymk2
LCA and RMQ ~簡潔もあるよ!~
LCA and RMQ ~簡潔もあるよ!~
Yuma Inoue
Recommended
CVPR2017勉強会 Disentangled Representation Learning GAN for Pose-Invariant Face ...
CVPR2017勉強会 Disentangled Representation Learning GAN for Pose-Invariant Face ...
Koichi Takahashi
ICCV2015勉強会 顔関連論文のまとめ
ICCV2015勉強会 顔関連論文のまとめ
Koichi Takahashi
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
論文輪読資料「Multi-view Face Detection Using Deep Convolutional Neural Networks」
Kaoru Nasuno
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
論文輪読資料「FaceNet: A Unified Embedding for Face Recognition and Clustering」
Kaoru Nasuno
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
On the Dynamics of Machine Learning Algorithms and Behavioral Game Theory
Rikiya Takahashi
Stochastic Variational Inference
Stochastic Variational Inference
Kaede Hayashi
20170819 CV勉強会 CVPR 2017
20170819 CV勉強会 CVPR 2017
issaymk2
LCA and RMQ ~簡潔もあるよ!~
LCA and RMQ ~簡潔もあるよ!~
Yuma Inoue
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展
Yuichi Yoshida
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~
Takuya Akiba
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energies
Fujimoto Keisuke
DeepLearningTutorial
DeepLearningTutorial
Takayoshi Yamashita
PRML輪読#14
PRML輪読#14
matsuolab
ウェーブレット木の世界
ウェーブレット木の世界
Preferred Networks
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Kenko Nakamura
Practical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architectures
Koji Matsuda
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
Takuya Minagawa
強化学習その2
強化学習その2
nishio
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
tanutarou
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
shindannin
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
Takuya Minagawa
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
Takahiro Kubo
CVPR 2018 速報
CVPR 2018 速報
cvpaper. challenge
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
ICCV2019 report
ICCV2019 report
Tatsuya Shirakawa
DeepLearningDay2016Summer
DeepLearningDay2016Summer
Takayoshi Yamashita
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
cvpaper. challenge
GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報
NVIDIA Japan
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration
Deep Learning JP
More Related Content
Viewers also liked
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展
Yuichi Yoshida
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~
Takuya Akiba
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energies
Fujimoto Keisuke
DeepLearningTutorial
DeepLearningTutorial
Takayoshi Yamashita
PRML輪読#14
PRML輪読#14
matsuolab
ウェーブレット木の世界
ウェーブレット木の世界
Preferred Networks
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Kenko Nakamura
Practical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architectures
Koji Matsuda
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
Takuya Minagawa
強化学習その2
強化学習その2
nishio
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
tanutarou
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
shindannin
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
Takuya Minagawa
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
Takahiro Kubo
Viewers also liked
(14)
Greed is Good: 劣モジュラ関数最大化とその発展
Greed is Good: 劣モジュラ関数最大化とその発展
プログラミングコンテストでのデータ構造 2 ~動的木編~
プログラミングコンテストでのデータ構造 2 ~動的木編~
sublabel accurate convex relaxation of vectorial multilabel energies
sublabel accurate convex relaxation of vectorial multilabel energies
DeepLearningTutorial
DeepLearningTutorial
PRML輪読#14
PRML輪読#14
ウェーブレット木の世界
ウェーブレット木の世界
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
Practical recommendations for gradient-based training of deep architectures
Practical recommendations for gradient-based training of deep architectures
ORB-SLAMを動かしてみた
ORB-SLAMを動かしてみた
強化学習その2
強化学習その2
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
多項式あてはめで眺めるベイズ推定~今日からきみもベイジアン~
最小カットを使って「燃やす埋める問題」を解く
最小カットを使って「燃やす埋める問題」を解く
LiDAR点群とSfM点群との位置合わせ
LiDAR点群とSfM点群との位置合わせ
画像認識モデルを作るための鉄板レシピ
画像認識モデルを作るための鉄板レシピ
Similar to CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
CVPR 2018 速報
CVPR 2018 速報
cvpaper. challenge
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
cvpaper. challenge
ICCV2019 report
ICCV2019 report
Tatsuya Shirakawa
DeepLearningDay2016Summer
DeepLearningDay2016Summer
Takayoshi Yamashita
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
cvpaper. challenge
GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報
NVIDIA Japan
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration
Deep Learning JP
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
Daiyu Hatakeyama
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
拡がるディープラーニングの活用
拡がるディープラーニングの活用
NVIDIA Japan
Similar to CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
(11)
CVPR 2018 速報
CVPR 2018 速報
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
ICCV2019 report
ICCV2019 report
DeepLearningDay2016Summer
DeepLearningDay2016Summer
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
【CVPR 2020 メタサーベイ】Recognition (Detection, Categorization)_Group21.1
GTC 2016 ディープラーニング最新情報
GTC 2016 ディープラーニング最新情報
順序データでもベイズモデリング
順序データでもベイズモデリング
[DL輪読会]Supervision-by-Registration
[DL輪読会]Supervision-by-Registration
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
機械学習 / Deep Learning 大全 (1) 機械学習基礎編
【メタサーベイ】Face, Gesture, and Body Pose
【メタサーベイ】Face, Gesture, and Body Pose
拡がるディープラーニングの活用
拡がるディープラーニングの活用
CVPR2016読み会 Sparsifying Neural Network Connections for Face Recognition
1.
Sparsifying Neural Network
Connections for Face Recognition @51takahashi
2.
• さのまる • @51Takahashi •
顔認証の研究開発やっています • 今回の発表は所属組織と関係ありません 自己紹介 CVPR2016読み会 2
3.
はじめに CVPR2016読み会 3 • CVPR2016の顔関連の研究はどれくらい? – 検索条件:
手動 » 39/643件(DNN/RNN系は11件) » 全部は読めてません… – 研究動向 » 顔認証/検索 9件(4件)⇒ 1つ紹介します » 3D顔モデリング 7件(0件) » 顔特徴点検出 7件(3件) » 表情認識 6件(1件) » 年齢 3件(2件) » データセット 2件(0件) » 顔属性認識 2件(0件) » 顔検出 1件(1件) » 視線推定 1件(0件) » 心拍推定 1件(0件)
4.
論文の概要 CVPR2016読み会 4 • タイトル – Sparsifying
Neural Network Connections for Face Recognition – 顔認証のためのニューラルネットワーク結合のスパース化 • どこの研究? – SenseTimeとThe Chinese University of Hong Kong(CUHK)の人たち • どんな研究? – 顔認証用CNNを枝刈りして(疎にして)パラメータ数削減・性能向上 • どんな手法? – パラメータ数の多い最終層から順に枝刈り » ニューロン間が無相関な結合を主に枝刈りしよう!という発想 • 結果は? – パラメータの圧縮率は12~76% – 顔認証の性能は若干向上 » LFWデータセットで、精度98.95% ⇒ 99.30%(圧縮率76%) » (エラー1.05% ⇒ 0.70%)
5.
著者紹介 CVPR2016読み会 5 • Yi Sun(SenseTime),
Xiaogang Wang(CUHK), Xiaoou Tang(CUHK) – CUHKのすごいひとたち – CUHKのグループはCVPR2016だけで16件発表 • 顔関連の主要論文 – 顔認証 » Deep learning face representation from predicting 10,000 classes (通称DeepID, CVPR2014) ⇒ Facebookの対抗馬 » Deep Learning Face Representation by Joint Identification- Verification (通称DeepID2, NIPS2014) » Surpassing Human-Level Face Verification Performance on LFW with GaussianFace (通称GaussianFace, AAAI2015) » Deeply learned face representations are sparse, selective, and robust (通称DeepID2+, CVPR2015) ⇒ Googleの対抗馬 – 顔特徴点検出 » Face Alignment by Coarse-to-Fine Shape Searching (CVPR2015)
6.
予備知識1: LFW CVPR2016読み会 6 • 近年の顔認証=LFW
(Labeled Faces in the Wild) – 顔認証ではMNIST的な存在 (2007年~) – 本人ペア3000組+他人ペア3000組を正しく分類する問題 • LFW (unrestricted: 外部データあり) の歴史 – 2012年 » 92.40%: Joint Bayesian, ECCV (MSRA) – 2013年 » 95.17%: High-dimensional LBP, CVPR (MSRA) – 2014年 » 97.35%: DeepFace*, CVPR (Facebook) » 97.45%: DeepID*, CVPR (CUHK) – 2015年 » 98.52%: GaussianFace, AAAI (CUHK) » 99.47%: DeepID2+*, CVPR (CUHK) » 99.63%: FaceNet*, CVPR (Google) ⇒ 性能は上限まで達成、高速化や省メモリ化が課題か? Aaron Eckhartさん はLena的存在♡
7.
予備知識2: LFWの後継者 CVPR2016読み会 7 • LFWの終焉 –
Googleの2億枚の学習画像を使った力技でほぼ完全攻略 – 新たな顔認証研究の幕開けでもあった… • LFWの後継者 – YTF (YouTube Face, CVPR2011) » YouTube動画からクロップしたデータセット、低画質 – IJB-A (IARPA Janus Benchmark A, CVPR2015) » ネットで収集した画像、顔向きとか年齢とかエグい » スポンサーはNIST (アメリカ国立標準技術研究所) – MegaFace (CVPR2016) » Flickrで収集した100万枚の中から特定の人を見つけるベンチマーク » 顔認証というより顔検索 » スポンサー欄にはSamsung、Google、Intelの名前が… – MS-Celeb-1M (ACMMM2016) » 3日前にその存在を知りました… Shinzo Abeさん (IJB-Aの例)
8.
予備知識3: DeepFace・DeepID CVPR2016読み会 8 • ディープラーニングを使った顔認証 –
学習方法 » n人の学習データをnクラス分類するようにネットワークを学習 – 顔認証方法 » 最終隠れ層のアクティベーションを特徴量として利用 » 特徴量のコサイン類似度を計算することで顔認証の類似度になる DeepID, CVPR2014 Bottleneckとも
9.
本題:既存手法の問題点 CVPR2016読み会 9 • ディープラーニングを使った顔認証 – 計算コストが高い –
必要メモリが大きい » 小さなネットワークで顔認証したい! » あわよくば性能向上させたい! • ネットワークの軽量化(枝刈り)に関する先行研究 – OBD (Optimal Brain Damage) [LeCun+, NIPS1990] – 重みの絶対値が小さい結合を枝刈り [Collins+, arXiv2014] – BRP (Bayesian Regularization and Pruning) [Williams, NC1994] » もっといい方法が欲しい! • ネットワークの圧縮に関する先行研究 – ニューロンの重みをSVDしてモデルを圧縮 [Denton+, NIPS2014等] – Knowledge distillation [Hinton+, arXiv2014]
10.
提案手法のアイデア CVPR2016読み会 10 • ニューロン間の相関に基づく枝刈り – 無相関なニューロン間の結合は枝刈りしてしまおう! –
最終層の結合から順に枝刈りさせよう! 主に最終層付近の パラメータ数が多い!
11.
提案手法 CVPR2016読み会 11 提案手法のアルゴリズム 1. ネットワークN0を普通に学習する (15万回) 2.
for m from 1 to M 3. 最後からm層目の結合を枝刈り 4. Nm-1を初期値として、ネットワークNmを学習 (7万回) 5. end for 6. NM が完成 N0 N1 N2 … … 赤字は枝刈りした層 ※プーリング層はできません …
12.
枝刈り CVPR2016読み会 12 枝刈りのアルゴリズム(full/local connection層) 1. ある出力側ニューロンと結合してる入力側ニューロンの数をKとする 2.
疎性パラメータS、偏りパラメータλを決める (0<S<1、0≦λ≦1) 3. 相関計算用データで、各ニューロン間の相関 rk を計算する 4. rk において、正/負の値を rk +/rk -、数をK+/K-とする (K++K-=K) 5. rk +を大きい順にソートする 6. 上位半分からλSK+個、下位半分から(1-λ)SK+個を残してランダムに刈る 7. rk -を絶対値の大きい順にソートする 8. 上位半分からλSK-個、下位半分から(1-λ)SK-個を残してランダムに刈る K=36個の結合の例 ⇒ 枝刈り後はSK個になる λ=0.75のとき、 強相関な結合の75% 弱相関な結合の25% が残される
13.
実験 CVPR2016読み会 13 • ネットワークの学習 – 学習用画像:
12,000名・290,000枚 » ディープラーニング用途としては小さめのデータセット – 評価用画像: LFW、YTF、IJB-A » 結果が細かすぎるのでLFWだけ紹介します… – 疎性パラメータS: バリデーションセットで決定 – 偏りパラメータλ: 0.75 • 実装 – Caffeを使用 – 枝刈りを使った学習は、0/1のdropping matrixを使うと実装できる
14.
実験結果1: LFW CVPR2016読み会 14 枝刈りしたらすこし性能向上した! 12%のパラメータでもオリジナルの性能!
15.
実験結果2: 偏りパラメータの効果 CVPR2016読み会 15 ランダム枝刈り(λ=0.5)・弱相関枝刈り(λ=1)は性能低下
16.
実験結果3: フルスクラッチとの比較 CVPR2016読み会 16 フルスクラッチでスパースなネットワークは学習できない
17.
実験結果4: 従来手法との比較 CVPR2016読み会 17 劇的によくなっている訳ではない…
18.
論文のまとめ CVPR2016読み会 18 • タイトル – Sparsifying
Neural Network Connections for Face Recognition – 顔認証のためのニューラルネットワーク結合のスパース化 • どこの研究? – SenseTimeとThe Chinese University of Hong Kong(CUHK)の人たち • どんな研究? – 顔認証用CNNを枝刈りして(疎にして)パラメータ数削減・性能向上 • どんな手法? – パラメータ数の多い最終層から順に枝刈り » ニューロン間が無相関な結合を主に枝刈りしよう!という発想 • 結果は? – パラメータの圧縮率は12~76% – 顔認証の性能は若干向上 » LFWデータセットで、精度98.95% ⇒ 99.30%(圧縮率76%) » (エラー1.05% ⇒ 0.70%)
19.
おつかれさまでした
Download now