SlideShare a Scribd company logo
1 of 9
論文紹介
物体検出モデルの特徴について
遠藤 伸
1.Feature Pyramid Networks for Object Detection
Feature Pyramidは、異なったスケール物体検出システムにおいて基本技術となりうるが、コンピュータリソー
スに対する消費量が大きいことから、実際の物体検出機ではなかなか採用されなかった。そこでTsung-Yi Lin氏
らがFPN(Feature Pyramid Network)を提唱した。COCOの検知システムにおけるベンチマークテストでも、
処理速度および再現性(AR)を向上させた。
Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath
Hariharan, Serge Belongie;
どんなもの?
議論はある?
Faster R-CNNは領域提案と物体検出を分離したツーステージ検出モデルにより領域の識別制度を向上させた。
しかし、サイズが大きい画像に対しては検出精度が良好であるが、サイズが小さい画像に対しては、検出精度
があまり良くないという問題点があった。(「FPN発明の概要」https://benrishi-ai.com/fpn01/参照)
どうやって有効だと検証?
80カテゴリをカバーするCOCO検知用データセットを使用。単一スケールの特徴マップを使用した2つのテスト
ケースに対して、FPNは平均再現率(AR)の向上が認められた。また処理速度においても6~7FPSのスピード
をマークした。
論文:Feature Pyramid Networks for Object Detection
参考資料:FPN発明の概要(https://benrishi-ai.com/fpn01/)
1.Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath
Hariharan, Serge Belongie;
先行研究に対して何がスゴイ?
Faster R-CNNに対して、画像識別処理速度の向上および再現性を向上させたこと。
技術の手法や肝は?
次に読むべき論文は?
① SSD: Single Shot MultiBox Detector
② U-Net: Convolutional Networks for Biomedical Image Segmentation
Feature Pyramidの方式は4通り紹介されている。
(a)Featurerized Image pyramid → スケールごとに特徴マップを作成する。処理速度が遅い。
(b)Single feature map → 最近(2017年)の傾向。全スケールから単一サイズの特徴マップを作成する。
処理速度の向上が見込める。Fast R-CNN、Fasetr R-CNNで使用される。
(c)Pyramidal feature hierarchy → ConvNet(畳込み層)で生成した特徴量の各層を特徴マップのように
再利用する。SSD(Single Shot MultiBox Detector)で使用されている。
(d)Feature Pyramid Network → (b)と(c)を組合せ発展させたもの。COnvNetで生成した特徴マップを基
準に、逆畳込みして各層の特徴マップを再現する。今回のFPNである。
FPNは処理速度および再現性をかなり向上させた。
1.Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath
Hariharan, Serge Belongie;
【Feature Pyramidの方式】
特徴
マップ
特徴
マップ
特徴
マップ
特徴
マップ
2.SSD( Single Shot MultiBox Detector)
SSDは様々なスケールの特徴層を、デフォルトボックスとして使うことにより、画像検知性能を向上させた。サ
イズの異なる画像に対しても、サイズの異なる畳み込み層を追加して、さまざまなスケールで検知することを可
能にした。
Wei Liu1 , Dragomir Anguelov2 , Dumitru Erhan3 , Christian
Szegedy3 , Scott Reed4 , Cheng-Yang Fu1 , Alexander C. Berg
どんなもの?
議論はある?
どうやって有効だと検証?
論文:SSD: Single Shot MultiBox Detector
参考資料:【物体検出】SSD(Single Shot MultiBox Detector)の解説(https://benrishi-ai.com/fpn01/)
R-CNNは、入力画像に対して様々にバウンディングボックスを動かしながら、CNN演算処理を行っていたため1
枚の画像から物体検知するのに時間がかかっていた。そのうちFast R-CNN、Faster R-CNNの処理速度を上回る
SSDが提案された。
PASCAL VOC2007 test detection resultsを使用したベンチマークテストでは、大部分のクラスでSSDの平均適合
率が、Fast R-CNN、Faster R-CNNよりも向上していた。
2.SSD( Single Shot MultiBox Detector)
先行研究に対して何がスゴイ?
技術の手法や肝は?
次に読むべき論文は?
Faster R-CNNに対して、画像識別処理速度の向上および再現性を向上させたこと。
U-Net: Convolutional Networks for Biomedical Image Segmentation
①スケールの異なる畳み込み層を追加することができ、各畳み込み層をデフォルトボックスとして使用する
ことにより様々なサイズの画像の検知を行う。
②デフォルトボックスごとに、クラス分類CNNおよび位置検出CNNを作成し、クラス特徴と位置特徴を算出
する。
③各デフォルトボックスとグランドトゥルースを比較し、IOUが高いものを抽出する。
2.SSD( Single Shot MultiBox Detector)
サイズが異なる畳み込
み層を追加することに
より、さまざまなス
ケールで検知できるよ
うにする。
クラス分類
CNN
位置検出
CNN
デフォルトボックス
3.U-Net: Convolutional Networks for Biomedical Image Segmentation
どんなもの?
議論はある?
どうやって有効だと検証?
論文: U-Net: Convolutional Networks for Biomedical Image Segmentation
Olaf Ronneberger, Philipp Fischer, and Thomas Brox Computer Science Department and BIOSS Centre for Biological Signalling
Studies, University of Freiburg, Germany
U-Netは2015年に発表され、FCN(Fully Convolutional Network)に似た技術として注目され、主に意味のある
領域に分割することにより、画像の中の意味ある物体を検出する手法。主に医療分野での画像診断に大きな成果
を発揮した。
U-Net適用事例の一つである、電子顕微鏡記録のニューロン構造のセグメンテーションで、他のモデルに比べ
ワーピングエラーが最低であった。
SSDと本稿のU-Netの特徴を合わせたものが、先に話したFPNといわれている。SSDはボトムアップパスウエイ
とFeaturePyramidのみの機能を持つ。U-Nstはボトムアップパスウエイ、トップダウンパスウエイ、スキップ接
続機能を持つが、 FeaturePyramidの機能を持たない。
2.SSD( Single Shot MultiBox Detector)
先行研究に対して何がスゴイ?
技術の手法や肝は?
次に読むべき論文は?
一番目に発表したFPNのFuturePyramidにおける(c)Pyramidal feature hierarchyの特徴を持ち、ボトムアップ
パスウエイとトップダウンパスウエイを行うが、特徴マップを作成せず、ピクセル単位の特徴量を持つので、通
常の物体検知システムよりもノード数が多くなる。またFCNと同じようにボトムアップとトップダウンを接続す
るスキップ接続を行う。全結合層がなく畳み込み層だけであるのもFCNと同様である。
特になし
画像データの畳み込みと、その逆の画像データの復元処理を行うことで、画像の中の物体検知能力が向上したこ
と。

More Related Content

What's hot

KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object RecognitionKantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognitionbelltailjp
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)Takanori Ogata
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習Yusuke Uchida
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺n_hidekey
 
20150803.山口大学講演
20150803.山口大学講演20150803.山口大学講演
20150803.山口大学講演Hayaru SHOUNO
 
第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料Takashi Shinozaki
 
20160825 IEICE SIP研究会 講演
20160825 IEICE SIP研究会 講演20160825 IEICE SIP研究会 講演
20160825 IEICE SIP研究会 講演Hayaru SHOUNO
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用Takashi Abe
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向Yusuke Uchida
 
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向Hiroshi Fukui
 
Image net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural NetworksImage net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural NetworksShingo Horiuchi
 
【2017.04】cvpaper.challenge 2017
【2017.04】cvpaper.challenge 2017【2017.04】cvpaper.challenge 2017
【2017.04】cvpaper.challenge 2017cvpaper. challenge
 
画像認識における幾何学的不変性の扱い
画像認識における幾何学的不変性の扱い画像認識における幾何学的不変性の扱い
画像認識における幾何学的不変性の扱いSeiji Hotta
 
Tutorial-DeepLearning-PCSJ-IMPS2016
Tutorial-DeepLearning-PCSJ-IMPS2016Tutorial-DeepLearning-PCSJ-IMPS2016
Tutorial-DeepLearning-PCSJ-IMPS2016Takayoshi Yamashita
 
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single MachineFast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single MachineTakuya Minagawa
 
ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東
ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東
ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東Yukiyoshi Sasao
 
Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章孝好 飯塚
 

What's hot (20)

KantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object RecognitionKantoCV/Selective Search for Object Recognition
KantoCV/Selective Search for Object Recognition
 
SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)SSD: Single Shot MultiBox Detector (ECCV2016)
SSD: Single Shot MultiBox Detector (ECCV2016)
 
画像認識と深層学習
画像認識と深層学習画像認識と深層学習
画像認識と深層学習
 
大規模画像認識とその周辺
大規模画像認識とその周辺大規模画像認識とその周辺
大規模画像認識とその周辺
 
MIRU2018 tutorial
MIRU2018 tutorialMIRU2018 tutorial
MIRU2018 tutorial
 
20150930
2015093020150930
20150930
 
20150803.山口大学講演
20150803.山口大学講演20150803.山口大学講演
20150803.山口大学講演
 
第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料第1回NIPS読み会・関西発表資料
第1回NIPS読み会・関西発表資料
 
DeepLearningDay2016Summer
DeepLearningDay2016SummerDeepLearningDay2016Summer
DeepLearningDay2016Summer
 
20160825 IEICE SIP研究会 講演
20160825 IEICE SIP研究会 講演20160825 IEICE SIP研究会 講演
20160825 IEICE SIP研究会 講演
 
物体検出の話Up用
物体検出の話Up用物体検出の話Up用
物体検出の話Up用
 
畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向畳み込みニューラルネットワークの研究動向
畳み込みニューラルネットワークの研究動向
 
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
 
Image net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural NetworksImage net classification with Deep Convolutional Neural Networks
Image net classification with Deep Convolutional Neural Networks
 
【2017.04】cvpaper.challenge 2017
【2017.04】cvpaper.challenge 2017【2017.04】cvpaper.challenge 2017
【2017.04】cvpaper.challenge 2017
 
画像認識における幾何学的不変性の扱い
画像認識における幾何学的不変性の扱い画像認識における幾何学的不変性の扱い
画像認識における幾何学的不変性の扱い
 
Tutorial-DeepLearning-PCSJ-IMPS2016
Tutorial-DeepLearning-PCSJ-IMPS2016Tutorial-DeepLearning-PCSJ-IMPS2016
Tutorial-DeepLearning-PCSJ-IMPS2016
 
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single MachineFast, Accurate Detection of 100,000 Object Classes on a Single Machine
Fast, Accurate Detection of 100,000 Object Classes on a Single Machine
 
ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東
ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東
ArtTrack: Articulated Multi-Person Tracking in the Wild : CV勉強会関東
 
Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章Pythonで体験する深層学習 5章
Pythonで体験する深層学習 5章
 

Similar to My article s_endo

NNKproject Japanese version
NNKproject Japanese versionNNKproject Japanese version
NNKproject Japanese versionnao takatoshi
 
NNKproject Japanese version2
NNKproject Japanese version2NNKproject Japanese version2
NNKproject Japanese version2nao takatoshi
 
Muramatsu Bachelor Thesis
Muramatsu Bachelor ThesisMuramatsu Bachelor Thesis
Muramatsu Bachelor Thesispflab
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリングNorishige Fukushima
 
AI技術を利用した果樹園の樹列検出
AI技術を利用した果樹園の樹列検出AI技術を利用した果樹園の樹列検出
AI技術を利用した果樹園の樹列検出Masahiro Tsukano
 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 Preferred Networks
 
Tatsuya Sueki Bachelor Thesis
Tatsuya Sueki Bachelor ThesisTatsuya Sueki Bachelor Thesis
Tatsuya Sueki Bachelor Thesispflab
 
文献紹介:EfficientDet: Scalable and Efficient Object Detection
文献紹介:EfficientDet: Scalable and Efficient Object Detection文献紹介:EfficientDet: Scalable and Efficient Object Detection
文献紹介:EfficientDet: Scalable and Efficient Object DetectionToru Tamaki
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systemscvpaper. challenge
 
CNNの構造最適化手法について
CNNの構造最適化手法についてCNNの構造最適化手法について
CNNの構造最適化手法についてMasanoriSuganuma
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)MasanoriSuganuma
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2Hirokatsu Kataoka
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakikanejaki
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...cvpaper. challenge
 
mi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンmi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンkunihikokaneko1
 
NAS-FPN:Learning Scalable Feature Pyramid Architecture for Object Detection
NAS-FPN:Learning Scalable Feature Pyramid Architecture for Object DetectionNAS-FPN:Learning Scalable Feature Pyramid Architecture for Object Detection
NAS-FPN:Learning Scalable Feature Pyramid Architecture for Object Detectionharmonylab
 
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用Preferred Networks
 

Similar to My article s_endo (20)

Efficient Det
Efficient DetEfficient Det
Efficient Det
 
NNKproject Japanese version
NNKproject Japanese versionNNKproject Japanese version
NNKproject Japanese version
 
NNKproject Japanese version2
NNKproject Japanese version2NNKproject Japanese version2
NNKproject Japanese version2
 
Muramatsu Bachelor Thesis
Muramatsu Bachelor ThesisMuramatsu Bachelor Thesis
Muramatsu Bachelor Thesis
 
3次元計測とフィルタリング
3次元計測とフィルタリング3次元計測とフィルタリング
3次元計測とフィルタリング
 
AI技術を利用した果樹園の樹列検出
AI技術を利用した果樹園の樹列検出AI技術を利用した果樹園の樹列検出
AI技術を利用した果樹園の樹列検出
 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
東北大学講義資料 実世界における自然言語処理 - すべての人にロボットを - 坪井祐太 
 
Tatsuya Sueki Bachelor Thesis
Tatsuya Sueki Bachelor ThesisTatsuya Sueki Bachelor Thesis
Tatsuya Sueki Bachelor Thesis
 
Road damge ai
Road damge aiRoad damge ai
Road damge ai
 
miyamori m
miyamori mmiyamori m
miyamori m
 
文献紹介:EfficientDet: Scalable and Efficient Object Detection
文献紹介:EfficientDet: Scalable and Efficient Object Detection文献紹介:EfficientDet: Scalable and Efficient Object Detection
文献紹介:EfficientDet: Scalable and Efficient Object Detection
 
【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems【CVPR 2020 メタサーベイ】Vision Applications and Systems
【CVPR 2020 メタサーベイ】Vision Applications and Systems
 
CNNの構造最適化手法について
CNNの構造最適化手法についてCNNの構造最適化手法について
CNNの構造最適化手法について
 
CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)CNNの構造最適化手法(第3回3D勉強会)
CNNの構造最適化手法(第3回3D勉強会)
 
【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2【チュートリアル】コンピュータビジョンによる動画認識 v2
【チュートリアル】コンピュータビジョンによる動画認識 v2
 
cvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezakicvsaisentan20141004 kanezaki
cvsaisentan20141004 kanezaki
 
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
 
mi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンmi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョン
 
NAS-FPN:Learning Scalable Feature Pyramid Architecture for Object Detection
NAS-FPN:Learning Scalable Feature Pyramid Architecture for Object DetectionNAS-FPN:Learning Scalable Feature Pyramid Architecture for Object Detection
NAS-FPN:Learning Scalable Feature Pyramid Architecture for Object Detection
 
20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用20170419PFNオープンハウス リサーチャーの仕事_公開用
20170419PFNオープンハウス リサーチャーの仕事_公開用
 

My article s_endo

  • 2. 1.Feature Pyramid Networks for Object Detection Feature Pyramidは、異なったスケール物体検出システムにおいて基本技術となりうるが、コンピュータリソー スに対する消費量が大きいことから、実際の物体検出機ではなかなか採用されなかった。そこでTsung-Yi Lin氏 らがFPN(Feature Pyramid Network)を提唱した。COCOの検知システムにおけるベンチマークテストでも、 処理速度および再現性(AR)を向上させた。 Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie; どんなもの? 議論はある? Faster R-CNNは領域提案と物体検出を分離したツーステージ検出モデルにより領域の識別制度を向上させた。 しかし、サイズが大きい画像に対しては検出精度が良好であるが、サイズが小さい画像に対しては、検出精度 があまり良くないという問題点があった。(「FPN発明の概要」https://benrishi-ai.com/fpn01/参照) どうやって有効だと検証? 80カテゴリをカバーするCOCO検知用データセットを使用。単一スケールの特徴マップを使用した2つのテスト ケースに対して、FPNは平均再現率(AR)の向上が認められた。また処理速度においても6~7FPSのスピード をマークした。 論文:Feature Pyramid Networks for Object Detection 参考資料:FPN発明の概要(https://benrishi-ai.com/fpn01/)
  • 3. 1.Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie; 先行研究に対して何がスゴイ? Faster R-CNNに対して、画像識別処理速度の向上および再現性を向上させたこと。 技術の手法や肝は? 次に読むべき論文は? ① SSD: Single Shot MultiBox Detector ② U-Net: Convolutional Networks for Biomedical Image Segmentation Feature Pyramidの方式は4通り紹介されている。 (a)Featurerized Image pyramid → スケールごとに特徴マップを作成する。処理速度が遅い。 (b)Single feature map → 最近(2017年)の傾向。全スケールから単一サイズの特徴マップを作成する。 処理速度の向上が見込める。Fast R-CNN、Fasetr R-CNNで使用される。 (c)Pyramidal feature hierarchy → ConvNet(畳込み層)で生成した特徴量の各層を特徴マップのように 再利用する。SSD(Single Shot MultiBox Detector)で使用されている。 (d)Feature Pyramid Network → (b)と(c)を組合せ発展させたもの。COnvNetで生成した特徴マップを基 準に、逆畳込みして各層の特徴マップを再現する。今回のFPNである。 FPNは処理速度および再現性をかなり向上させた。
  • 4. 1.Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie; 【Feature Pyramidの方式】 特徴 マップ 特徴 マップ 特徴 マップ 特徴 マップ
  • 5. 2.SSD( Single Shot MultiBox Detector) SSDは様々なスケールの特徴層を、デフォルトボックスとして使うことにより、画像検知性能を向上させた。サ イズの異なる画像に対しても、サイズの異なる畳み込み層を追加して、さまざまなスケールで検知することを可 能にした。 Wei Liu1 , Dragomir Anguelov2 , Dumitru Erhan3 , Christian Szegedy3 , Scott Reed4 , Cheng-Yang Fu1 , Alexander C. Berg どんなもの? 議論はある? どうやって有効だと検証? 論文:SSD: Single Shot MultiBox Detector 参考資料:【物体検出】SSD(Single Shot MultiBox Detector)の解説(https://benrishi-ai.com/fpn01/) R-CNNは、入力画像に対して様々にバウンディングボックスを動かしながら、CNN演算処理を行っていたため1 枚の画像から物体検知するのに時間がかかっていた。そのうちFast R-CNN、Faster R-CNNの処理速度を上回る SSDが提案された。 PASCAL VOC2007 test detection resultsを使用したベンチマークテストでは、大部分のクラスでSSDの平均適合 率が、Fast R-CNN、Faster R-CNNよりも向上していた。
  • 6. 2.SSD( Single Shot MultiBox Detector) 先行研究に対して何がスゴイ? 技術の手法や肝は? 次に読むべき論文は? Faster R-CNNに対して、画像識別処理速度の向上および再現性を向上させたこと。 U-Net: Convolutional Networks for Biomedical Image Segmentation ①スケールの異なる畳み込み層を追加することができ、各畳み込み層をデフォルトボックスとして使用する ことにより様々なサイズの画像の検知を行う。 ②デフォルトボックスごとに、クラス分類CNNおよび位置検出CNNを作成し、クラス特徴と位置特徴を算出 する。 ③各デフォルトボックスとグランドトゥルースを比較し、IOUが高いものを抽出する。
  • 7. 2.SSD( Single Shot MultiBox Detector) サイズが異なる畳み込 み層を追加することに より、さまざまなス ケールで検知できるよ うにする。 クラス分類 CNN 位置検出 CNN デフォルトボックス
  • 8. 3.U-Net: Convolutional Networks for Biomedical Image Segmentation どんなもの? 議論はある? どうやって有効だと検証? 論文: U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger, Philipp Fischer, and Thomas Brox Computer Science Department and BIOSS Centre for Biological Signalling Studies, University of Freiburg, Germany U-Netは2015年に発表され、FCN(Fully Convolutional Network)に似た技術として注目され、主に意味のある 領域に分割することにより、画像の中の意味ある物体を検出する手法。主に医療分野での画像診断に大きな成果 を発揮した。 U-Net適用事例の一つである、電子顕微鏡記録のニューロン構造のセグメンテーションで、他のモデルに比べ ワーピングエラーが最低であった。 SSDと本稿のU-Netの特徴を合わせたものが、先に話したFPNといわれている。SSDはボトムアップパスウエイ とFeaturePyramidのみの機能を持つ。U-Nstはボトムアップパスウエイ、トップダウンパスウエイ、スキップ接 続機能を持つが、 FeaturePyramidの機能を持たない。
  • 9. 2.SSD( Single Shot MultiBox Detector) 先行研究に対して何がスゴイ? 技術の手法や肝は? 次に読むべき論文は? 一番目に発表したFPNのFuturePyramidにおける(c)Pyramidal feature hierarchyの特徴を持ち、ボトムアップ パスウエイとトップダウンパスウエイを行うが、特徴マップを作成せず、ピクセル単位の特徴量を持つので、通 常の物体検知システムよりもノード数が多くなる。またFCNと同じようにボトムアップとトップダウンを接続す るスキップ接続を行う。全結合層がなく畳み込み層だけであるのもFCNと同様である。 特になし 画像データの畳み込みと、その逆の画像データの復元処理を行うことで、画像の中の物体検知能力が向上したこ と。