発表スライド.pdf

ポーズ推定を用いた
歩容識別の開発・実装
ITカレッジAIシステム科 G020C1118 吉田紫穏

前提と目的
歩容識別技術とは･･･人の歩き方で人物を認識する技術
→ センサと対象人物に距離があっても認識に影響しない
大別して２つの手法がある
⚫アピアランスベース手法･･･歩容シルエットを用いる手法
⚫モデルベース手法･･･関節体モデルを用いる手法
そこで…
深層学習による姿勢推定モデルを用いて関節体モデルを作成し、
歩容識別に活用する手法を提案する
本製作はその提案にあたって実装してみたものである
識別フェーズだけでなく、関節体モデルの作成にも深層学習を活用す
ることで、技術的、時間的なコストを削減することが狙い
技術的、時間的にコスト高
１

提案手法 - Ⅰ環境と全体像
歩行映像撮影
動画データ前処理
人物検出/姿勢推定
関節体モデル
補正処理
人物識別
識別結果出力
２
処理の流れ
◼ ハードウェア環境
CPU：Intel Core i9-9900K
GPU：NVIDIA GeForce RTX2080Ti
◼ ソフトウェア環境
Windows 10 Home
Python 3.8.12 (Anaconda3)
CUDA v11.4
◼ 使用ライブラリ
OpenCV 4.5.4
GluonCV 0.11.0
MXNet 1.7.0
TensorFlow 2.7.0

提案手法 - Ⅱ歩行データ
３
◼ 歩行映像撮影
歩行映像の撮影は汎用カメラを用いて１視点固定で行った。
本製作では、２５人分の歩行映像を撮影し、
最終的に１６人分の歩行映像を使用した。
うち、９人分は不正解データとして学習させた。
残りの７人分を正解データとして学習および推論させた。
◼ 動画データ前処理
動画をフレーム毎に画像として保存し、RGB形式のままモデルへと
入力させる。

提案手法 - Ⅲ人物検出/姿勢推定
４
◼ 人物検出
人物検出にはGluonCVの学習済みYOLOv3を利用する。
◼ 姿勢推定
姿勢推定にはResNetベースの学習済みモデルを利用する。
この姿勢推定モデルから得た関節体モデルを識別フェーズで用いる。
なお本製作では、この２つのモデルに対して再学習などの調整を加え
ることはしない。
推定結果の例 ▶ 関節体モデルの例 ▶

提案手法 – Ⅳ関節体モデル補正処理
５
◼ 推定精度の不安定性
姿勢推定モデルにより高速に関節体モデルを得ることができた
しかし、推定精度の不安定さが目立つ
通常、姿勢推定モデルの変更、調整を行って解消すべき
しかし、本製作ではモデルを変更することなく、正常データが得られ
ないかを考えた。
異常データの例

提案手法 – Ⅳ関節体モデル補正処理
６
◼ データ補正方法
対象
t t+1 t+2 t+3 t+4
t-1
t-2
t-3
t-4
各関節部の座標の移動平均と標準偏差を計算
移動平均 - 標準偏差 < (x,y) < 移動平均 + 標準偏差
の範囲を超える座標は異常値 → 移動平均値に置換

提案手法 – Ⅴ人物識別
７
◼ 人物識別モデル
右図のような非常にシンプルなCNNを実装。
入力データは高さ480px, 幅300pxに切り取り/パディングする。
識別時、不正解データと識別対象データの一方を学習。
学習後、学習に用いていない識別対象データを推論にかける。
3x3 conv, 16/1
2x2 maxpooling, pad
3x3 conv, 16/1
2x2 maxpooling, pad
3x3 conv, 32/1
2x2 maxpooling, pad
1024 dense
image
1 dense
output
relu
relu
relu
relu
sigmoid
False
A
CNN ?
trained
CNN
A?
Not A?
まず不正解データと
識別対象の一方を
学習させる
不正解データと識別対象の一方
を学習させたCNNにもう一方の
データを流して推論

結果
８
ラベルA~G：
行方向は学習データ
列方向は推論データ
識別モデル返却値：
同一人物である確率
結果算出：
40 Epochs x 試行回数3回の平均値
確率の数値こそ低いがおおむね識
別できているようにみえる。
しかし、不安定性も拭えない。
t＼p A B C D E F G
A 20.53 11.60 8.25 3.04 0.79 2.44 3.40
B 7.72 22.45 1.81 6.65 9.92 21.36 1.93
C 10.45 6.21 25.86 20.05 23.75 8.46 12.79
D 12.70 18.86 28.54 25.56 33.70 22.15 5.66
E 2.72 20.54 13.91 15.64 45.69 7.49 1.98
F 17.14 21.79 17.52 21.93 34.27 60.96 11.71
G 8.20 7.81 6.23 3.21 1.46 15.97 6.02
単位 %
赤字は正解ケースよりも高い確率である(FP)ことを表す
下線はそのグループで2番目に高い確率であることを表す

結論と展望
９
• 深層学習を用いたモデルベース手法による歩容識別の開発・実装
には成功した。
• より高い精度の歩容識別モデルを構築することができれば、さら
に高い識別精度が得られると考察する。
• データの簡易的な補正処理を取り入れてみたが、他の補正手法と
組み合わせてみるなど調整の余地がある。
• 識別モデルについても、より高次元の特徴量を抽出できるモデル
の構築やハイパーパラメータの調整を検討することで望む結果が
得られるのではないかと考察する。

おわり
GitHub：
himazin331/Pose-GaitRecognition
参考文献：
歩行動作に基づく人物識別に関する研究
https://ipsj.ixsq.nii.ac.jp/ej/index.php?active_action=repository_view_main_item_detail&page_id=13
&block_id=8&item_id=186786&item_no=1
歩容認証とその科学捜査への応用 - J-Stage
https://www.jstage.jst.go.jp/article/essfr/14/4/14_318/_pdf/-char/ja
歩容認証の高精度化のための人物領域の抽出精度の評価
https://jglobal.jst.go.jp/en/detail?JGLOBAL_ID=201702228596984881
Amazon SageMakerと画像認識のための深層学習ツールキットGluonCVによる人の姿勢推定
https://dev.classmethod.jp/articles/amazon-sagemaker-gluoncv-pose-estimation/

発表スライド.pdf

Recommandé

Recommandé

Contenu connexe

En vedette

En vedette (20)

発表スライド.pdf