SlideShare une entreprise Scribd logo
1  sur  37
Selective Search for
Object Recognition
J. Uijlings et al., IJCV 2013
2015.5.30 #cvsaisentan
@sakanazensen
Self introduction
• @sakanazensen(魚の人)
• 某英語なIT企業の2年目戦士
• 名古屋大M卒
– Semi-supervisedな歩行者検出
– 元nagoyacvの中の人
• 生息範囲:CVやAgileなど
今日紹介する論文
• Selective Search for Object Recognition
• Jasper R. R. Uijlingsら(アムステルダム大学)
• International Journal of Computer Vision (2013)
• Segmentation As Selective Search
for Object Recognition
• ICCV2011
• オリジナル
• Exhaustive Searchが一般的
画像からの物体検出
Classifier
25,132win/imgはつらい
(640x480/OpenCVデフォルト)
detection window
やりたいこと
• 何かありげな領域を推定
• 後続の処理はそこだけに集中できる!
• より高度な識別(分類)手法が適用できる!
✓class-independent
✓high-recall
✓任意の位置・大きさ
✓高効率
“Object Hypotheses”
従来の似た研究
• どちらかと言うとSegmentationの研究
• Carreiraら[1]、Endresら[2]
• 前景背景のセグメンテーション
• “Objectness”[3]
• 学習ベース+ランダム探索
[1] J. Carreira et at;, “Constrained parametric min-cuts for
automatic object segmentation,” CVPR, 2010
[2] I. Endres et al., ”Category independent object proposals,” ECCV, 2010
[3] B. Alexe et al., “What is an object?,” CVPR, 2010
この研究のアプローチ
• ボトムアップ型の階層的セグメンテーション
• あらゆる位置・スケール(+構造)に対応
• セグメンテーション結果からObject Hypotheses生成
主要なReferrer
• DCNNベース物体検出などの前段に利用[4]
• また、Objectness[3]と共によく引用されてる印象
[4] R. Girshick et al., “Rich Feature Hierarchies for Accurate Object Detection and
Semantic Segmentation,” CVPR2014
Selective Search
Selective Search全体の流れ
一つになるまで
結合繰り返し
initial
segmentation
類似度の高い
隣接領域を結合
…
Selective Search全体の流れ
…
各層各小領域の外接矩形を
Object hypothesesとする
Selective Search全体の流れ
(1) 初期セグメンテーション𝑅 = 𝑟1, … , 𝑟𝑛
(2a) 各小領域の特徴𝐹 = {𝑓1, … , 𝑓𝑛}
(2b) 隣接小領域の類似度𝑆 = {𝑠 𝑟𝑖, 𝑟𝑗 , … }
(3) while 𝑆 ≠ 𝜙
• 𝑠(𝑟𝑖, 𝑟𝑗) = max(𝑆)
• 𝑟𝑡 = 𝑟𝑖⋃𝑟𝑗
• 𝑆から𝑟𝑖と𝑟𝑗に絡むものを全て消す
• 𝑆 = 𝑆 ∪ 𝑠(𝑟𝑡, 𝑟𝑥 , … }, 𝑅 = 𝑅 ∪ 𝑟𝑡
(4) 𝑅からObject hypothesesを生成
1. 初期セグメンテーション𝑅
• Efficient Graph-Based Image Segmentation[5]
• 高速!
• (他手法でもOK)
𝑘 = 50
𝑘 = 200
𝑘 = 500
[5] P. Felzenszwalb et al, “Efficient Graph-Based Image Segmentation”, IJCV2004
• 色特徴
• テクスチャ特徴
• 小領域の面積
• 小領域の外接矩形
2a. 各小領域の特徴𝐹抽出
𝑓𝑖
𝑓𝑗
𝑓𝑘
…
𝐹 = 𝑓1, … , 𝑓𝑛
2a. 特徴量の設計
• ミソ:線形性(加法性)
• 最初に求めるだけでOK!
|𝑟1|𝑓1⨁|𝑟2|𝑓2
𝑟1 + 𝑟2
= 𝑓1,2
𝑟1
𝑟2
𝑟1,2
陽に求めなくていい!
2b. 特徴量と類似度𝑆
• 色特徴(正規化色ヒストグラム)
• 25次元×3チャネル=75次元
• 類似度𝑆color: intersection
• マージ: 線形和
• テクスチャ特徴
• SIFT descriptorのような正規化勾配ヒストグラム
• 80次元×3チャネル=240次元※
• 類似度𝑆texture: intersection
• マージ: 線形和
※8方向☓10binとのこと。原著には詳細の言及なし
2b. 特徴量と類似度𝑆
• 面積
• スカラ
• 類似度𝑆size = 1 −
𝑟 𝑖 +|𝑟 𝑗|
|img|
• 外接矩形
• 4次元
• 類似度𝑆fill = 1 −
|boundingbox(𝑟 𝑖∪𝑟 𝑗)|− 𝑟 𝑖 −|𝑟 𝑗|
|img|
highlow
highlow
包含関係にある領域を
積極的に統合する
小さい領域を
先に統合させる
3.小領域のGreedyな統合
やるだけ!
• 類似度順に取ってきては結合・類似度再計算
https://goo.gl/tZGnkb
4. Object hypothesesの生成
𝑅内の全要素の外接矩形
各階層・各小領域の
外接矩形を算出
=
• Object hypotheses = 小領域の外接矩形
4. Object hypothesesの生成
• 数が多い&ゴミも多い 重み付き乱択で捨てる
𝑟𝑘の重み𝑣 𝑘
= rand 0, 1 × 𝑟𝑘の深さ
deeper layer
shallower layer
4. Object hypothesesの生成
• 数が多い&ゴミも多い 重み付き乱択で捨てる
重みでソートして
上から一定数採用
(´ºωº` )えっ、それでいいんだ…
Hypothesisの質と量のtrade-offに落とし込める!
Diversification
いろんなパラメータでやりまくる(!)
色空間 類似度 𝑘 #
Fast HSV, Lab
𝑆color, 𝑆texture, 𝑆size, 𝑆fill ,
𝑆texture, 𝑆size, 𝑆fill
50, 100 8通り
Quality
HSV, Lab,
rgI, H, I
𝑆color, 𝑆texture, 𝑆size, 𝑆fill ,
𝑆texture, 𝑆size, 𝑆fill ,
𝑆fill , 𝑆size
50, 100,
150, 300
80通り
• 結果が偏らないよう、多様なObject hypotheses
が必要…
Output
• 各パラメータ組合せでの出力を統合
• ゴミも含んでいます
• けど物体らしきものはなるべくカバーします
Detection/Recognition
への応用例
例:一般的な学習
Ground Truth
SVM
Classifier
Pos
Neg
FPs=Hard Negs
Negativeは(通常)
ランダムに切り出し
Try detection
Retrain
例:Selective Searchを活用して学習
Ground Truth
SVM
Classifier
Pos
Try detection
(based on object hypotheses)
FPs=Hard Negs
Selective Search
Pos領域に少し重なる
hypothesesを切り出す
Neg
Retrain
Experiments
Object hypothesisの例
• Best Overwrap(真値とのAND面積比)
.874 .884 .863
.882 .873
Object hypothesisの評価
• 評価指標
Recall 0~1
出てきてほしい物体総数のうち
実際出せた割合
MABO
Mean Average
Best Overwrap
0~1
クラスごとのBest Overwrapの平均
(Recallの連続版的な雰囲気)
Hypothesesが多いと良くなる
Diversificationすると良くなる
いろんなパラメータでやりまくる! 実際の効果は
# combination # hypotheses MABO Time
Single 1パターン 362 .693 0.71s
Fast 8パターン 2,147 .799 3.79s
Quality 80パターン 10,108 .878 17.15s
多クラスObject Recognition精度評価
• ILSVRC2011 (Localization) [6]
※Xerox Research Centre Europeの誤植?
Method
Error ratio
(Flat)
Error ratio
(Hierarchical)
Proposed .425 .285
ISI Lab
(University of Tokyo)※ .565 .410
[6] Olga Russakovsky et al., “ImageNet Large Scale Visual Recognition
Challenge,” arXiv:1409.0575, 2014
原著でのその他の実験
• 各特徴量/色空間の寄与
• 階層的処理の効果
• 物体クラスごとのObject hypothesisの評価
• …
実装してみた!
• オリジナル実装(ICCV版+IJCV版)
• http://koen.me/research/selectivesearch/
• MATLAB
• pcodeばっかりで読めない……
• 魚実装
• ほぼPure python
• fork it!
belltailjp/selective_search_py.git
✓任意のパラメータ組合せ
✓Object hypotheses数の変更
✓並列処理
個人的なイメージ
• 意外と力技
• 多様な結果を出したい→よろしいならば80通りのパラメータだ
• Object Hypothesisの切り捨ての辺りは工夫の余地ありそう?
• 手法はシンプル・明快で実装も容易
• 速度的には検出ガチ勢にはまだ辛い
• 10−1~101sec/imgのオーダー

Contenu connexe

Tendances

My article s_endo
My article s_endoMy article s_endo
My article s_endoShinEndo1
 
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Yusuke Uchida
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用Takashi Abe
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺n_hidekey
 
論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNNTakashi Abe
 
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)Akisato Kimura
 
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介Ryohei Ueda
 
Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章孝好 飯塚
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakikanejaki
 
第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料Takashi Shinozaki
 
Res netと派生研究の紹介
Res netと派生研究の紹介Res netと派生研究の紹介
Res netと派生研究の紹介masataka nishimori
 
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Hirokatsu Kataoka
 
[DL輪読会]End-to-End Object Detection with Transformers
[DL輪読会]End-to-End Object Detection with Transformers[DL輪読会]End-to-End Object Detection with Transformers
[DL輪読会]End-to-End Object Detection with TransformersDeep Learning JP
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話Yusuke Uchida
 
MS COCO Dataset Introduction
MS COCO Dataset IntroductionMS COCO Dataset Introduction
MS COCO Dataset IntroductionShinagawa Seitaro
 
論文紹介 "DARTS: Differentiable Architecture Search"
論文紹介 "DARTS: Differentiable Architecture Search"論文紹介 "DARTS: Differentiable Architecture Search"
論文紹介 "DARTS: Differentiable Architecture Search"Yuta Koreeda
 
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object DetectionDeep Learning JP
 

Tendances (20)

20141008物体検出器
20141008物体検出器20141008物体検出器
20141008物体検出器
 
My article s_endo
My article s_endoMy article s_endo
My article s_endo
 
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 
論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN論文紹介: Fast R-CNN&Faster R-CNN
論文紹介: Fast R-CNN&Faster R-CNN
 
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
関西CVPRML勉強会 2012.2.18 (一般物体認識 - データセット)
 
20150930
2015093020150930
20150930
 
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
三次元点群処理ライブラリPCLと 統合ロボットシステム研究での 利用例の紹介
 
Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezaki
 
第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料
 
Res netと派生研究の紹介
Res netと派生研究の紹介Res netと派生研究の紹介
Res netと派生研究の紹介
 
Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)Deep Residual Learning (ILSVRC2015 winner)
Deep Residual Learning (ILSVRC2015 winner)
 
[DL輪読会]End-to-End Object Detection with Transformers
[DL輪読会]End-to-End Object Detection with Transformers[DL輪読会]End-to-End Object Detection with Transformers
[DL輪読会]End-to-End Object Detection with Transformers
 
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
 
MS COCO Dataset Introduction
MS COCO Dataset IntroductionMS COCO Dataset Introduction
MS COCO Dataset Introduction
 
論文紹介 "DARTS: Differentiable Architecture Search"
論文紹介 "DARTS: Differentiable Architecture Search"論文紹介 "DARTS: Differentiable Architecture Search"
論文紹介 "DARTS: Differentiable Architecture Search"
 
[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection[DL輪読会]Focal Loss for Dense Object Detection
[DL輪読会]Focal Loss for Dense Object Detection
 

En vedette

20160417dlibによる顔器官検出
20160417dlibによる顔器官検出20160417dlibによる顔器官検出
20160417dlibによる顔器官検出Takuya Minagawa
 
Lake Crest について調べてみた
Lake Crest について調べてみたLake Crest について調べてみた
Lake Crest について調べてみたYutaka Yasuda
 
Computer systems for school kids
Computer systems for school kidsComputer systems for school kids
Computer systems for school kidsRajesh Tivrekar
 
Deep Learning for Image Recognition in Python
Deep Learning for Image Recognition in PythonDeep Learning for Image Recognition in Python
Deep Learning for Image Recognition in PythonHideki
 
文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?Seiichi Uchida
 
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
高速な物体候補領域提案手法 (Fast Object Proposal Methods)高速な物体候補領域提案手法 (Fast Object Proposal Methods)
高速な物体候補領域提案手法 (Fast Object Proposal Methods)Takao Yamanaka
 
研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術Shinnosuke Takamichi
 
AI Monetization Landascape in US
AI Monetization Landascape in USAI Monetization Landascape in US
AI Monetization Landascape in USOsaka University
 
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Yasutomo Kawanishi
 

En vedette (11)

20160417dlibによる顔器官検出
20160417dlibによる顔器官検出20160417dlibによる顔器官検出
20160417dlibによる顔器官検出
 
20140131 R-CNN
20140131 R-CNN20140131 R-CNN
20140131 R-CNN
 
Lake Crest について調べてみた
Lake Crest について調べてみたLake Crest について調べてみた
Lake Crest について調べてみた
 
JAWS DAYS 2015
JAWS DAYS 2015JAWS DAYS 2015
JAWS DAYS 2015
 
Computer systems for school kids
Computer systems for school kidsComputer systems for school kids
Computer systems for school kids
 
Deep Learning for Image Recognition in Python
Deep Learning for Image Recognition in PythonDeep Learning for Image Recognition in Python
Deep Learning for Image Recognition in Python
 
文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?文字認識はCNNで終わるのか?
文字認識はCNNで終わるのか?
 
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
高速な物体候補領域提案手法 (Fast Object Proposal Methods)高速な物体候補領域提案手法 (Fast Object Proposal Methods)
高速な物体候補領域提案手法 (Fast Object Proposal Methods)
 
研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術研究発表のためのプレゼンテーション技術
研究発表のためのプレゼンテーション技術
 
AI Monetization Landascape in US
AI Monetization Landascape in USAI Monetization Landascape in US
AI Monetization Landascape in US
 
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
 

KantoCV/Selective Search for Object Recognition

Notes de l'éditeur

  1. 異なるパラメータのセットで(これを原著ではstrategyと呼んでいる)、同じ所に集中して出るなら、やはりそこはconfidentだとみなせる。
  2. 異なるパラメータのセットで(これを原著ではstrategyと呼んでいる)、同じ所に集中して出るなら、やはりそこはconfidentだとみなせる。
  3. 異なるパラメータのセットで(これを原著ではstrategyと呼んでいる)、同じ所に集中して出るなら、やはりそこはconfidentだとみなせる。