SlideShare une entreprise Scribd logo
1  sur  20
Introduction to
Image Recognition



                Nov 28, 2008
Contents
画像処理の目的
画像処理の歴史
画像認識に使う処理
  二値化
  輪郭抽出
  エッジ抽出
  平滑化 
  対応領域探索
画像処理の目的
画像変換(画像 → 画像)
   画質変換
    ぼやかし 鮮明化 セピア レリーフ風 光の当たり方
   幾何学変換
    拡大・縮小 回転 平行移動 透視変換(視点変換)

画像認識(画像 → 文字・記号)
  個人照合(指紋認証)
  防犯侵入監視
  文字認識
  似ている画像検索
  似ている商品検索 http://like.com

CG(文字・記号 → 画像)
画像処理の歴史
      1960年代  主に科学に関係した画像処理
        手書き郵便番号読取装置
http://kagakukan.toshiba.co.jp/history/1goki/1967postmatter/index.html
        人工衛星写真の処理
        泡箱の飛跡写真の処理(ハフ変換によるニュートリノ検出)
http://ja.wikipedia.org/wiki/%E6%B3%A1%E7%AE%B1


       1970年代  医療や工業
CT断層写真(鮮明な断層写真の提供)
        リモートセンシング(遠隔探索)
             宇宙資源衛星ランドサット
                   地球表面の資源データを地上に伝送
        工業用画像処理(不良品の自動検出、半導体組立)
http://www.incom.co.jp/productnavi/index.php/product/20983

   1980年代
  図面認識、文書理解 複写機への応用
  画像処理用サブルーチンパッケージSPIDER(電子総合研究所)
画像認識でのアルゴリズム

 二値化
 輪郭抽出
 エッジ抽出
 平滑化
 対応領域探索
二値化(Binarization)
画像中の画素をある値(閾値)を境に白または黒のいずれかを持つような
二値画像に変換すること




不要な情報をおとすため画像処理の前処理としてよく使われる。
背景を黒画素、前景を白画素とするか、またはこの逆に変換する。
     メリット
     画像の単純化(不要な情報を落とす)
      
     デメリット
     情報の消失
閾値をどうやって決めるか
グレースケール化する際、単純には以下のように RGB から変換した値を使う。

(R + G + B) ÷ 3

これを濃度と呼び、この値に閾値を設けて二値化を行う。
場合によってはこれを使わずに、YCrCb 表色系の Y(輝度) を用いることもある。
 Y = 0.299 x R + 0.587 x G + 0.114 x B


閾値の決定方法
  閾値の値を適切に指定しないと、↓のような問題がある

   閾値が高すぎたり低すぎたりした場合 → 全体的に白っぽくなったり
                              黒っぽくなったりする

1.  濃度ヒストグラムに基づく方法    ・・・ この方法だけ説明します
2.  画像をいくつかに分割し,各領域ごとに設定する方法(レベルスライス)
3.  画像の局所性質を生かし,この性質を利用する方法
      最初に濃度が急激に変わるところを取り出してから、濃度ヒストグラムの方法を使う
4.  ラプラシアン・ヒストグラム法
...
濃度ヒストグラム
   画像の濃度を横軸に、ある濃度を持つ画素数を縦軸にとった統計グラフ。




p-タイル法
   新聞の文字の認識の場合、文字がある面積がある程度わかっている場合に有効。
モード法
   対象とする図形と背景の濃度値の差が大きく、濃度ヒストグラムにはっきりと谷が
   出来るときに有効
判別分析法
   ある閾値を一つ決めて二つのクラスに分割。クラス内分散とクラス間分散の分散比が
   最大になるように閾値を決定。
輪郭抽出(Outline Extraction)
輪郭とは物体の外形をあらわす線。

用途
  ・物体の面積、周囲長、円形度、重心などの特徴量の計算
  ・文字認識、指紋認証、顔認識

輪郭抽出手順

1, 入力画像を、背景を白、物体を黒にした二値画像に変換
2, 入力画像を端から順に走査し、最初の輪郭点を決定
3, 最初の輪郭点を中心として左回りに隣接する領域を調べ、
  値をもつ点を次の輪郭点とする
4, 中心を新たに見つけた輪郭点に移動させ、3の処理を再度行う。
5, 開始点に戻ってくるまで繰り返し、得られた閉曲線を輪郭とする
エッジ抽出(Edge Extraction)
 エッジとは濃度が急激に変化する点

 用途
   ・大量生産されている部品から不良品を識別
   ・自動車の自動走行(搭載されているカメラで道路の白線を抽出し、
 白線をはみださないようにする。)
   ・複数の深度に焦点があっている画像を作製する
 http://www.frontier.kyoto-u.ac.jp/rc03/omake/focused.html




エッジと輪郭の違い

輪郭と見たところは同じですが、エッジの場合は得られた画素間に関係はな
い。
輪郭は座標系列のリストで、輪郭の上の画素には順番がついているので一周
することができます。



  以下で具体的なエッジ抽出方法を説明します。
エッジ抽出方法
エッジ抽出では以下のようなオペレータを各画素に対して適用してエッジの強さをはかる。
真ん中が実際にエッジを測定したい画素に対応する。




                     左のような濃度を持つ画素を例にすると、上のようなオ
                     ペレータをかけて得られるエッジの強さは

                     57x1 + 96x1 + 34x1 + 30x1 + 165x(-4)= -443

                     このように一般に 0 - 255 の範囲に入らない場合もあ
                     るので、その場合は正規化する。

エッジ抽出の種類
   Sobel オペレータ
   Laplacian オペレータ
   prewitt 法
   Roberts オペレータ(今回は説明しない)
   Gabor filter(今回は説明しない)
   wavelet を使った方法(今回は説明しない)
   ...
Sobel オペレータ
一次微分を基本にしたオペレータ



特徴
・垂直方向のエッジ、水平方向のエッジを別々に抽出できる
・垂直方向の後に水平方向、または水平方向の後に垂直方向のオペレータで
 エッジを抽出することでノイズに強くなる。
Laplacian オペレータ
二次微分を基本にしたオペレータ

特徴
・ノイズに弱い
                               四方向
 (Laplacian オペレータを使う前にガウス関数を               八方向
  重みとして使った平滑化を行うのが一般的)
・細い線や線の端点に強く反応する




                     四方向             八方向
テンプレートマッチング法( prewitt 法)
一次微分を基本にしたオペレータ。
テンプレートマッチング法は標準パターンをいくつか用意しておき、画像の一部分と比較して最も
値が大きいものを選んでいく方法。
prewitt 法の場合、エッジに対して下記の8つのマスクパターンを用意して、それぞれを測定した
い画素に適用する。測定した結果、最も大きい値のマスクを採用しエッジの大きさを決める。
平滑化(Smoothing)
平滑化とは画像の濃度を平らに滑らかにする手法。 画像中のノイズを除去するために行う。


平均化フィルタ
  注目画素とその周辺の輝度値に
  右のようなレートを掛け合わせて濃度を求める。




ガウシアンフィルタ
  平均化フィルタと違い右のような中央画素の重みを
大きくしたようなレートを掛け合わせる。



メディアンフィルタ
  右の図のような濃度分布があった場合、
  中心画素および周辺画素の濃度の中での中央値 41 で
165 を置き換える。
  上の二つのフィルタに比べてエッジが消えにくいという
  特徴がある。また、ゴマ塩ノイズの除去にも有効。
対応領域探索

対応領域探索とは、例えば顔認識の場合与えられた画像の中から
顔と判断される部分を調べること。

入力画像の中にある物体があるかどうかを調べるには、物体の画像を入力画像と
重ね合わせることで対応する領域があるか調べる、マッチングという方法で行う。
また、このマッチングという方法は特定物体追跡にも使われる。
テンプレートマッチング法
手順
1、あらかじめ検出したい物体のテンプレート画像を用意する
2、テンプレート画像の左上端を対象画像の左上端にセットし、類似度を計算
3、テンプレート画像を1pixel 右に動かし、テンプレート画像との類似度を計算
4、右端まで行ったら、 一つ下のピクセルに移動し、テンプレート画像を左端に移動
5、テンプレート画像の右下端が対象画像の右下端に一致するまで繰り返し、類似度が
  高い領域を調べる。


                類似度の候補

                濃度差の絶対値の総和(SAD: Sum of Absolute Difference)
                濃度差の二乗和(SSD: Sum of Squared Difference)
                正規化相互相関関数(NCC: Normalized Cross-Correlation)
                ...

                SAD, SSD は値が小さいほど類似度が高い。
                NCC は値が大きいほど類似度が高い。
                NCC は SAD, SSD に比べて濃度の相対的な違いなどの影響を
                受けにくい。
また、テンプレート画像の作り方によっても検出精度は大きく変わる。

グラスゴー大学 顔検出
http://www.itmedia.co.jp/news/articles/0801/26/news005.html




照合方法
  RGBのそれぞれの画素を比較する方法
  グレースケールに変換してから比較する方法
  ヒストグラムを作成し比較する方法(ヒストグラムインタセクション)
まとめ
画像処理、画像認識についての方法をいくつかまとめてみた。
  二値化
  輪郭抽出
  エッジ抽出
  平滑化
  対応領域探索

他にも紹介したいものがあったが、時間の関係でできなかった。
  表色系
  幾何学変換(回転、拡大・縮小)
  ハフ変換
  オープニング・クロージング
  形状特徴抽出
ご清聴ありがとうございました。

Contenu connexe

Tendances

Hr 032 資訊系進路圖
Hr 032 資訊系進路圖Hr 032 資訊系進路圖
Hr 032 資訊系進路圖handbook
 
DS-032-間歇運動機構
DS-032-間歇運動機構DS-032-間歇運動機構
DS-032-間歇運動機構handbook
 
profit from the core
profit from the coreprofit from the core
profit from the coreRink Tang
 
DS-031-超精密位置感測與控制技術簡介
DS-031-超精密位置感測與控制技術簡介DS-031-超精密位置感測與控制技術簡介
DS-031-超精密位置感測與控制技術簡介handbook
 
About Thinking
About ThinkingAbout Thinking
About ThinkingRon Liu
 
Hr 006 心理系進路圖
Hr 006 心理系進路圖Hr 006 心理系進路圖
Hr 006 心理系進路圖handbook
 
CRE-001-研發記錄簿撰寫說明 楊維漢教授
CRE-001-研發記錄簿撰寫說明 楊維漢教授CRE-001-研發記錄簿撰寫說明 楊維漢教授
CRE-001-研發記錄簿撰寫說明 楊維漢教授handbook
 
CEO-006-成功主管的8個Know How
CEO-006-成功主管的8個Know HowCEO-006-成功主管的8個Know How
CEO-006-成功主管的8個Know Howhandbook
 
关于中国教育技术学科建设与专业建设的思考
关于中国教育技术学科建设与专业建设的思考关于中国教育技术学科建设与专业建设的思考
关于中国教育技术学科建设与专业建设的思考wangyunwu
 
IE-021 汽車零組件供應鏈之研究
IE-021 汽車零組件供應鏈之研究IE-021 汽車零組件供應鏈之研究
IE-021 汽車零組件供應鏈之研究handbook
 
修改既有流程提升品牌質感增加收益5
修改既有流程提升品牌質感增加收益5修改既有流程提升品牌質感增加收益5
修改既有流程提升品牌質感增加收益5guest0813d8
 
系统测试用例设计方法
系统测试用例设计方法系统测试用例设计方法
系统测试用例设计方法telab
 
世界文化與自然遺產
世界文化與自然遺產世界文化與自然遺產
世界文化與自然遺產Amy Yeh
 
出國點檢表
出國點檢表出國點檢表
出國點檢表5045033
 
人际沟通
人际沟通人际沟通
人际沟通sancoyh
 
華攝氏設計有限公司簡介
華攝氏設計有限公司簡介華攝氏設計有限公司簡介
華攝氏設計有限公司簡介John Hung
 
2003ASAP菸農轉作(史瓊月)
2003ASAP菸農轉作(史瓊月)2003ASAP菸農轉作(史瓊月)
2003ASAP菸農轉作(史瓊月)None
 

Tendances (20)

Hr 032 資訊系進路圖
Hr 032 資訊系進路圖Hr 032 資訊系進路圖
Hr 032 資訊系進路圖
 
DS-032-間歇運動機構
DS-032-間歇運動機構DS-032-間歇運動機構
DS-032-間歇運動機構
 
profit from the core
profit from the coreprofit from the core
profit from the core
 
DS-031-超精密位置感測與控制技術簡介
DS-031-超精密位置感測與控制技術簡介DS-031-超精密位置感測與控制技術簡介
DS-031-超精密位置感測與控制技術簡介
 
About Thinking
About ThinkingAbout Thinking
About Thinking
 
Hr 006 心理系進路圖
Hr 006 心理系進路圖Hr 006 心理系進路圖
Hr 006 心理系進路圖
 
CRE-001-研發記錄簿撰寫說明 楊維漢教授
CRE-001-研發記錄簿撰寫說明 楊維漢教授CRE-001-研發記錄簿撰寫說明 楊維漢教授
CRE-001-研發記錄簿撰寫說明 楊維漢教授
 
CEO-006-成功主管的8個Know How
CEO-006-成功主管的8個Know HowCEO-006-成功主管的8個Know How
CEO-006-成功主管的8個Know How
 
关于中国教育技术学科建设与专业建设的思考
关于中国教育技术学科建设与专业建设的思考关于中国教育技术学科建设与专业建设的思考
关于中国教育技术学科建设与专业建设的思考
 
新聞整理
新聞整理新聞整理
新聞整理
 
IE-021 汽車零組件供應鏈之研究
IE-021 汽車零組件供應鏈之研究IE-021 汽車零組件供應鏈之研究
IE-021 汽車零組件供應鏈之研究
 
修改既有流程提升品牌質感增加收益5
修改既有流程提升品牌質感增加收益5修改既有流程提升品牌質感增加收益5
修改既有流程提升品牌質感增加收益5
 
系统测试用例设计方法
系统测试用例设计方法系统测试用例设计方法
系统测试用例设计方法
 
世界文化與自然遺產
世界文化與自然遺產世界文化與自然遺產
世界文化與自然遺產
 
出國點檢表
出國點檢表出國點檢表
出國點檢表
 
人际沟通
人际沟通人际沟通
人际沟通
 
華攝氏設計有限公司簡介
華攝氏設計有限公司簡介華攝氏設計有限公司簡介
華攝氏設計有限公司簡介
 
Format 1
Format 1Format 1
Format 1
 
Frbifri
FrbifriFrbifri
Frbifri
 
2003ASAP菸農轉作(史瓊月)
2003ASAP菸農轉作(史瓊月)2003ASAP菸農轉作(史瓊月)
2003ASAP菸農轉作(史瓊月)
 

En vedette

画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量takaya imai
 
Introduction to fuzzy kmeans on mahout
Introduction to fuzzy kmeans on mahoutIntroduction to fuzzy kmeans on mahout
Introduction to fuzzy kmeans on mahouttakaya imai
 
SSII2014 チュートリアル資料
SSII2014 チュートリアル資料SSII2014 チュートリアル資料
SSII2014 チュートリアル資料Masayuki Tanaka
 
Learning to rank for IR
Learning to rank for IRLearning to rank for IR
Learning to rank for IRtakaya imai
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量についてla_flance
 
New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...
New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...
New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...takaya imai
 
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -MPRG_Chubu_University
 

En vedette (8)

画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
 
Productgraph
ProductgraphProductgraph
Productgraph
 
Introduction to fuzzy kmeans on mahout
Introduction to fuzzy kmeans on mahoutIntroduction to fuzzy kmeans on mahout
Introduction to fuzzy kmeans on mahout
 
SSII2014 チュートリアル資料
SSII2014 チュートリアル資料SSII2014 チュートリアル資料
SSII2014 チュートリアル資料
 
Learning to rank for IR
Learning to rank for IRLearning to rank for IR
Learning to rank for IR
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量について
 
New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...
New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...
New Approach to Data Analysis System “Tableau + TreasureData” at Tableau User...
 
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
 

Image Recognition