公聴会 発表スライド
- 2. 概要
序論
研究背景および目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
2
- 3. 概要
序論
研究背景および目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
3
- 5. 研究背景および目的(1/2)
画像認識
画像に含まれる何らかの意味がある認識対象を識別
セキュリティ,工業用検査,娯楽などの様々な分野で需要増加
認識対象の多さ・データの複雑さから多種多様な手法が提案
統計的機械学習に基づく画像認識
デジタル機器の普及により多種多様で膨大な画像が存在
計算機の発展により画像を高速に処理可能
⇒統計的機械学習に基づく画像認識手法が注目
画像認識のための汎用的な統計モデルの構築
顔画像認識,文字認識,ジェスチャ認識など
様々な画像・タスクに適用可能なモデル
5
- 8. 概要
序論
研究背景および目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
8
- 11. その他の先行研究例
HMMに基づく手法
1次元HMMを人間の顔認識に利用[Samaria et.al; ‘93]
Embedded HMM [Nefian et.al; ‘03]
Pseudo 2-D HMM [Kuo et.al; ‘94]
2次元DPマッチングに基づく手法 [Uchida et al; ‘01]
画像間のマッピングをコスト関数により制御
柔軟かつ正確なマッピングのためのコスト関数の決定
には事前知識が必要
11
- 12. その他の先行研究例
HMMに基づく手法
1次元HMMを人間の顔認識に利用[Samaria et.al; ‘93]
⇒幾何学的変動に対する頑健性を欠く
Embedded HMM [Nefian et.al; ‘03]
Pseudo 2-D HMM [Kuo et.al; ‘94]
2次元DPマッチングに基づく手法 [Uchida et al; ‘01]
画像間のマッピングをコスト関数により制御
柔軟かつ正確なマッピングのためのコスト関数の決定
には事前知識が必要
12
- 13. その他の先行研究例
HMMに基づく手法
1次元HMMを人間の顔認識に利用[Samaria et.al; ‘93]
⇒幾何学的変動に対する頑健性を欠く
Embedded HMM [Nefian et.al; ‘03]
⇒画像の幾何学的連続性を保つことが困難
Pseudo 2-D HMM [Kuo et.al; ‘94]
2次元DPマッチングに基づく手法 [Uchida et al; ‘01]
画像間のマッピングをコスト関数により制御
柔軟かつ正確なマッピングのためのコスト関数の決定
には事前知識が必要
13
- 14. その他の先行研究例
HMMに基づく手法
1次元HMMを人間の顔認識に利用[Samaria et.al; ‘93]
⇒幾何学的変動に対する頑健性を欠く
Embedded HMM [Nefian et.al; ‘03]
⇒画像の幾何学的連続性を保つことが困難
Pseudo 2-D HMM [Kuo et.al; ‘94]
⇒取りうる状態の組合せが多く計算量が膨大(指数オーダー)
2次元DPマッチングに基づく手法 [Uchida et al; ‘01]
画像間のマッピングをコスト関数により制御
柔軟かつ正確なマッピングのためのコスト関数の決定
には事前知識が必要
14
- 16. 可変固有画像モデル[Higaki el al.; ‘07]
基底とノイズベクトルが分離型格子2次元HMMから生成
: 観測データ
: 因子負荷行列
: 因子ベクトル
: 固有画像 (基底)
: ノイズベクトル
利点 : 状態間の共分散や相関と幾何学的変動をモデル化
16
- 18. パラメトリック固有空間法との関連
パラメトリック固有空間法[Murase; ‘02]の特徴
連続的に見かけが変化する画像を固有空間上の多様体で表現
一連の画像を多様体上の軌跡として表現
対象の大きさ・輝度の正規化が前提
位置ずれの変動は基底の線形和で表現
⇒より多くの学習画像を必要とする
可変固有画像モデル
認識対象の幾何学的変動を状態遷移により表現
状態遷移で合わせきれない部分を基底により表現
例:照明変動や顔の表情の変化など
18
より少ないデータで汎用性の高いモデルを実現
- 21. 概要
序論
研究背景および目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
21
- 22. 概要
序論
研究背景および目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
22
- 38. 関数の逐次最大化による最尤推定
E-step : 事後確率の計算
M-step : モデルパラメータの推定
同時事後確率の計算量が膨大
⇒実時間では最適化が困難
EMアルゴリズム
変分EMアルゴリズムによる計算量削減
:観測データ :状態遷移系列 :シフト状態遷移系列 :モデルパラメータ
38
- 45. 実験条件(2/2)
データの変動の種類
回転変動のみ
位置・大きさ・回転変動
意図した変動をモデルが表現可能か否かの検証が目的
回転変動の場合
状態位置のシフトによりどこまで回転が表現できるかを検証
モデル自体は±45度程度の範囲を表現する能力
位置・大きさの変動の場合
認識対象が画像内に十分収まる範囲で検証
45
データのサイズの変動 500×500 ~ 600×600
データの位置の変動 中心から40×20ピクセル以内
データの回転角 -10°~ 10°(正規乱数)
- 64. 概要
序論
研究背景と目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
64
- 76. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
HMMの出力確率分布
76
- 77. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
HMMの出力確率分布 ⇒ 各特徴量分布の積
77
- 78. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
静的特徴量 1次動的特徴量
(速度)
2次動的特徴量
(加速度)
HMMの出力確率分布 ⇒ 各特徴量分布の積
78
- 79. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
観測系列
0.8
0.4
0.0
-0.4
-0.8
-1.2
50 100 150 200 250 300 350 400 4500
Time (frame)
静的特徴量 1次動的特徴量
(速度)
2次動的特徴量
(加速度)
HMMの出力確率分布 ⇒ 各特徴量分布の積
79
- 80. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
観測系列
0.8
0.4
0.0
-0.4
-0.8
-1.2
50 100 150 200 250 300 350 400 4500
Time (frame)
静的特徴量 1次動的特徴量
(速度)
2次動的特徴量
(加速度)
HMMの出力確率分布 ⇒ 各特徴量分布の積
HMMの平均系列 ⇒ 階段上の不連続な系列
HMMの平均系列
80
- 81. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
観測系列
0.8
0.4
0.0
-0.4
-0.8
-1.2
50 100 150 200 250 300 350 400 4500
Time (frame)
静的特徴量 1次動的特徴量
(速度)
2次動的特徴量
(加速度)
トラジェクトリHMMの確率分布 ⇒ の分布として正規化
HMMの平均系列
81
- 82. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
観測系列
0.8
0.4
0.0
-0.4
-0.8
-1.2
50 100 150 200 250 300 350 400 4500
Time (frame)
静的特徴量 1次動的特徴量
(速度)
2次動的特徴量
(加速度)
トラジェクトリHMMの確率分布 ⇒ の分布として正規化
HMMの平均系列
正規化定数
82
- 83. トラジェクトリHMM [Zen et al; ‘06]
時間的関係を考慮した静的特徴量の統計モデル
静的特徴量,動的特徴量の関係を明示的にモデル化
観測系列
0.8
0.4
0.0
-0.4
-0.8
-1.2
50 100 150 200 250 300 350 400 4500
Time (frame)
トラジェクトリHMMの平均系列 ⇒ 状態内で滑らかに変化
静的特徴量 1次動的特徴量
(速度)
2次動的特徴量
(加速度)
トラジェクトリHMMの確率分布 ⇒ の分布として正規化
HMMの平均系列
正規化定数
83
- 98. 顔画像認識実験による有効性の検証
認識率は4-fold cross validationで評価
実験条件(1/2)
データベース XM2VTS
原画像サイズ 720×576
画像サイズ 16×16
階調数 256,グレースケール
学習データ 1人あたり6枚×100人
テストデータ 1人あたり2枚×100人
2次元HMM状態数
4×4, 6×6, 8×8
10×10, 12×12
98
- 99. 比較手法
NoUpdate : SL2Dのパラメタを提案モデル用に線形変換
ParamUpdate:NoUpdateのパラメタの値を最適化
状態系列は3手法とも同一(SL2DのViterbi状態系列)
実験条件(2/2)
手法 パラメタの更新
SL2D (従来法) -
NoUpdate なし
ParamUpdate あり
99
- 105. 今後の課題・将来の展望
今後の課題
適切な窓行列の設計,状態推定アルゴリズムの検討
様々なデータセット上で他の手法との性能比較・評価
省メモリ・高速化と認識性能の両立
将来の展望
前処理・特徴量選択・モデル構造選択の同時最適化
例:識別モデル(CRFなど)を活用した特徴量・モデル構造選択
画像を用いた様々なタスクへの応用可能性
例:3次元物体認識,動画像認識,画像探索,文字認識など
プログラムをオープンソースとして公開(C++)
105
- 106. 概要
序論
研究背景と目的
分離型格子2次元HMMの概要及び既存手法との関連
研究紹介
分離型格子2次元HMMの拡張
回転変動への対応
観測間の相関を捉えるモデル
活動報告
106
- 108. 研究活動(1/3)
総務省 SCOPE プロジェクト
期間 2009/11 ~ 2011/12
「講演者のための
多言語音声合成技術に関する研究開発」
共同研究機関
京都市立芸術大学
独立行政法人情報通信機構
話者選択モジュールの開発に従事しプロジェクトに貢献
おはよう
音声翻訳
システム
Good Morning
108
- 109. 研究活動(2/3)
JST CREST uDialogue プロジェクト
期間 2011/10 ~ 2017/03
「コンテンツ生成の循環系を軸とした
次世代音声技術基盤の確立」
共同研究機関
名古屋工業大学国際音声技術研究所
名古屋工業大学情報基盤センター
エジンバラ大学
研究者の方々と活発に意見を
交換しプロジェクトの発展に貢献
名工大双方向
音声案内システム
モバイル環境
音声対話システム
109
Notes de l'éditeur
- 物体をモデル化するにあたり,3次元物体の表現について考えます.
物体が3次元であることから,3次元モデルによる表現を考えることができます.
3次元モデルは物体の構造を詳細に表現することが出来ます.
しかし,状態遷移の組み合わせが増加するため,□
計算コストは大きいといえます.そこで,□
2次元モデルによる物体表現を考えます.□
物体を周回軌道から撮影した画像が既にデータ化されています.
このデータから,□
物体の展開図を1枚の画像として表現することが出来ます.
この展開図を,□
円筒形の側面として考え,物体を簡潔に表現します.
このように円筒形とすることで,3次元物体を2次元で表現します.□
- そこで提案する手法が,円筒構造を有する分離型2次元格子HMMです.
これは分離型2次元格子HMMを拡張したモデルです.
まず状態を,物体の模様などの特徴を表現する物体状態と,
画像内の背景や,物体のでっぱりなどの端の部分を表現する
背景状態とで分けます.
そして物体状態の横方向の状態遷移を環状化しました.
縦の状態遷移と組み合わせることで物体状態は円筒形になり,
先ほど述べたようにして物体の側面を表現することが可能となります.
このとき,物体状態と背景状態の切り替わりは任意の状態から
行えるようになっています.□
- 提案手法では,物体状態の情報を得るために,
物体を周囲から撮影した画像で学習を行います.
それによって,物体状態は特徴の連続性を維持することができるため,
どのような向きの物体画像が来ても同物体として認識ができ,
物体の向きの変動に対応しています.
また,学習データの角度情報から初期モデルを推定するため,
物体の角度情報をモデルが保持しているといえます.□
- モデルに角度情報が備わっているため,認識を行う際,
テストデータに対してどのような物体状態が用いられているかで,
観測角度の推定を行うことが出来ます.
例えばこのようなテストデータを認識すると,□
物体状態はこのようになると,モデルの角度情報から,
物体の観測角度を推定できます.
物体状態の系列を求めることは認識を行うことと同義なため,□
提案法は観測角度に依らない物体認識と同時に,
観測角度の推定が可能であるということを示しています.□
- ほぼ読み上げるだけ