SlideShare une entreprise Scribd logo
1  sur  43
9. 姿勢推定
1
金子邦彦
(ディープラーニング,Python を使用)
(全15回)
https://www.kkaneko.jp/cc/ae/index.html
全体まとめ
• AI の進展により,画像からの姿勢推定ができるよ
うになってきた
2
ランドマークとボーン
ランドマークの位置情報
は3次元(縦,横,奥行き)
アウトライン
3
番号 項目
復習
9-1 姿勢推定
9-2 人体の姿勢推定
9-3 頭部の姿勢推定,オブジェクトの姿勢推定
9-4 演習
各自,資料を読み返したり,課題に取り組んだりも行う
機械学習
• 学習による上達の能力
• 訓練データを使用して,学習を行う
4
マルチスケールの画像
どこかのスケールでは,物体は「所定の大きさ」に近くなる
⇒ ディープラーニングでの処理が簡単になる
これで,さまざまな大きさの物体を扱う 5
課題:物体の大きさがさまざま
解決へのアプローチ
さまざまなスケールの画像を作る(マルチスケール)
9-1. 姿勢推定
6
人体の姿勢推定
7
撮影
人工知能で処理
姿勢推定の結果
マーカーレス:画像,ビデオから姿勢推定を行う.
特別な機材は使わない
人体の姿勢推定の例
8
(OpenPose を使用)
9
(Detectron2 の DensePose を使用)
人体の姿勢推定の例
10
ビデオの例
11
人体の姿勢推定の例(動画)
12
姿勢推定の用途①
13
• 状況把握,行動予測
姿勢推定の用途②
14
• 行動検知
姿勢推定の用途③
15
• 危険の察知,救援・救護
姿勢推定の用途④
16
• 監視,防犯
姿勢推定の用途⑤
17
• トレーニング,フィットネス,エクササイズ
姿勢推定の用途⑥
• アバター(バーチャル・キャラクタ)の操作
18
アバター(バーチャル・キャラクタ)
姿勢推定の用途⑦
• 集団行動の観察,分析,監視
19
Qi Dang, Jianqin Yin, Bin Wang, Wenqing Zheng,
Deep Learning Based 2D Human Pose Estimation: A SurveyDeep Learning Based 2D Human Pose Estimation: A Survey,
Tsinghua Science and TechnologyTsinghua Science and Technology,
Volume 24 Issue 6 Article 5, 2019.
姿勢推定の用途⑧
• 姿勢推定の結果を用いて,画像から人物を切り出
す
20
姿勢推定のさまざまな用途
• 状況把握,行動予測
• 行動検知
• 危険の察知,救援・救護
• 監視,防犯
• トレーニング,フィットネス,エクササイズ
• 集団行動の観察,分析,監視
など
21
姿勢推定のバリエーション
• 物体,頭部の位置推定
変形しない
• 人体の姿勢推定
関節があり動く
• 手や足の指の姿勢推定
関節があり動く
22
9-2. 人体の姿勢推定
23
人体の姿勢推定
• 人体のランドマーク(顔,胴体,手,足の中の特
定の点)の位置推定
• 人体の姿勢についての情報を得る
24
ランドマークとボーン
25
OpenPoseのランドマークとボーン
画像で表示した
ボーン情報
ランドマークのデータファイル
(特徴点の x, y 座標と
個々の信頼度のデータ)
ボーン = 骨格,ランドマーク = 点
ランドマークとボーン
26
ボーン = 骨格,ランドマーク = 点
OpenPose では,25個のランドマークが定
まっている
(OpenPose は,人体の姿勢推定の一手法)
0:鼻 1:首 2:右肩 3:右ひじ 4:右手首
5:左肩6:左ひじ 7:左手首 8:真ん中腰
9:右腰 10:右ひざ 11:右足首 12:左腰
13:左ひざ 14:左足首 15:右目16:左目
17:右耳 18:左耳 19:左足親指 20:左足小指
21:左かかと 22:右足親指 23:右足小指
24:右かかと
OpenPoseのランドマークとボーン
人体の姿勢推定の例
27
(OpenPose を使用)
• 人体の一部分が隠れている場合
可能な範囲でのランドマークを推定
ランドマークの位置推定
28
①元画像 ②ランドマークの ③ランドマークと
位置推定 ボーン
Qi Dang, Jianqin Yin, Bin Wang, Wenqing Zheng,
Deep Learning Based 2D Human Pose Estimation: A SurveyDeep Learning Based 2D Human Pose Estimation: A Survey,
Tsinghua Science and TechnologyTsinghua Science and Technology,
Volume 24 Issue 6 Article 5, 2019.
②ランドマークの位置推定:Body Part Detection 法では,元画像の中から,顔,
首,肩,手などの部位を検出する
③ランドマークとボーン:②の結果と体全体の情報から,ランドマークの位置
の特定,ボーンの生成を行う
ランドマークの位置推定
29
Ce Zheng, Wenhan Wu, Taojiannan Yang, Sijie Zhu, Chen Chen, Ruixu Liu, Ju Shen, Nasser Kehtarnavaz and Mubarak Shah,
Deep Learning-Based Human Pose Estimation: A Survey,
ArXiv, abs/2012.13392, 2019.
ランドマークの位置推定
・ディープラーニングを使用
・顔,首,肩,手などの部位
それぞれについて位置を推定
ランドマークの位置推定
30
Alejandro Newell, Kaiyu Yang, and Jia Deng,
Stacked Hourglass Networks for Human Pose Estimation,
arXiv:1603.06937v2, 2016.
https://arxiv.org/pdf/1603.06937v2.pdf
ランドマークの位置推定
・ディープラーニングを使用
・顔,首,肩,手などの部位それぞれについて位置を推定
ランドマークの位置推定
31
Alejandro Newell, Kaiyu Yang, and Jia Deng,
Stacked Hourglass Networks for Human Pose Estimation,
arXiv:1603.06937v2, 2016.
https://arxiv.org/pdf/1603.06937v2.pdf
画像の縮小 画像の拡大
各レベルでの推定結果を
後段へ
ランドマークの位置推定
部位の大きさはさまざま ⇒ マルチスケールの画像を使う
• 画像を複数レベルに縮小し,各レベルで部位を検出
• 元の大きさに戻しながら,検出結果を重ね合わせ
9-3. 頭部の姿勢推定,物体の姿勢
推定
32
物体の姿勢推定
• 画像から,物体の位置情報(たて、よこ、奥行
き)と回転情報を得る
33
Wen, B and Bekris, Kostas E,
BundleTrack: 6D Pose Tracking for Novel Objects without Instance or Category-Level 3D Models,
IEEE/RSJ International Conference on Intelligent Robots and Systems, 2021.
頭部の姿勢推定
34
• 頭部の画像から,頭部の位置情報(たて、よこ、
奥行き)と回転情報を得る
lincolnhard/head-pose-estimation を使用
https://github.com/lincolnhard/head-pose-estimation
x
y
z
基準となる3つの軸から,どれだけ回転したか
ロール
(roll)
ピッチ
(pitch)
ヨー
(yaw)
物体の位置推定,頭部の位置推定
• 画像から,物体や頭部の次の結果を得る
位置情報(縦,横,奥行きの3つの数値)
回転情報(3つの回転軸なので,3つの数値)
36
物体の姿勢推定の用途
• ロボットハンドによる物体移動
37
Wen, B and Bekris, Kostas E,
BundleTrack: 6D Pose Tracking for Novel Objects without Instance or Category-Level 3D Models,
IEEE/RSJ International Conference on Intelligent Robots and Systems, 2021.
物体の姿勢推定
• 部分的に隠蔽された物体についても、姿勢推定(位置と角度)が推定
できるように
(姿勢推定により,セグメンテーションの精度が向上する,という考え
方も)
38
Segmentation-driven 6D Object Pose Estimation
Yinlin Hu, Joachim Hugonot, Pascal Fua, Mathieu Salzmann
arXiv:1812.02541, 2018.
9-4. 演習
39
Google Colaboratory の使い方概要 ①
40
Google Colaboratory ノートブック
コードセルの再実行や変更には,
Google アカウントでのログインが必要
実行
コードセル
テキストセル
コードセル
コードセル
• WEBブラウザでアクセス
• コードセルは
Python プログラム.
各自の Google アカウント
でログインすれば,
変更,再実行可能
Google Colaboratory の使い方概要 ②
41
実行
一番上のコードセルから順々に実行
実行
人体の姿勢推定
1. 使用するページ:
https://colab.research.google.com/drive/13nOMSW0Dzx_LjN
9XEG99jtvgMACl4m9V
2. 必要な事前知識
ランドマーク,ボーン
3. 各自で行うこと
各自で説明、ソースコード、実行結果を確認する.
42
全体まとめ
• AI の進展により,画像からの姿勢推定ができるよ
うになってきた
43
ランドマークとボーン
ランドマークの位置情報
は3次元(縦,横,奥行き)

Contenu connexe

Plus de kunihikokaneko1

cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い kunihikokaneko1
 
cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション  cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション kunihikokaneko1
 
cs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンスcs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンスkunihikokaneko1
 
cs-5. 人工知能の概要
cs-5. 人工知能の概要 cs-5. 人工知能の概要
cs-5. 人工知能の概要 kunihikokaneko1
 
cs-4. プログラミング入門
cs-4. プログラミング入門cs-4. プログラミング入門
cs-4. プログラミング入門kunihikokaneko1
 
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックスcs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックスkunihikokaneko1
 
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素 cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素 kunihikokaneko1
 
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタcs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタkunihikokaneko1
 
mi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンmi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンkunihikokaneko1
 
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線kunihikokaneko1
 
mi-6. 画像分類システム
mi-6. 画像分類システムmi-6. 画像分類システム
mi-6. 画像分類システムkunihikokaneko1
 
mi-5. ディープラーニング
mi-5. ディープラーニングmi-5. ディープラーニング
mi-5. ディープラーニングkunihikokaneko1
 
mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習kunihikokaneko1
 
mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例kunihikokaneko1
 
mi-1. 人工知能の概要
mi-1. 人工知能の概要mi-1. 人工知能の概要
mi-1. 人工知能の概要kunihikokaneko1
 
Coding Standards of C++ について
 Coding Standards of C++ について  Coding Standards of C++ について
Coding Standards of C++ について kunihikokaneko1
 
co-3. サブクラス、継承
co-3. サブクラス、継承co-3. サブクラス、継承
co-3. サブクラス、継承kunihikokaneko1
 
co-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出しco-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出しkunihikokaneko1
 

Plus de kunihikokaneko1 (20)

cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い cs-8. 表計算ソフトウエアを用いたデータの扱い
cs-8. 表計算ソフトウエアを用いたデータの扱い
 
cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション  cs-7. 乱数,シミュレーション
cs-7. 乱数,シミュレーション
 
cs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンスcs-6. データベースとデータサイエンス
cs-6. データベースとデータサイエンス
 
cs-5. 人工知能の概要
cs-5. 人工知能の概要 cs-5. 人工知能の概要
cs-5. 人工知能の概要
 
cs-4. プログラミング入門
cs-4. プログラミング入門cs-4. プログラミング入門
cs-4. プログラミング入門
 
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックスcs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
cs-3. パノラマ画像,ストリートビュー,3次元コンピュータグラフィックス
 
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素 cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
cs-2. コンピュータによる画像制作,人工知能でできること,情報のコード化,デジタル画像,画素
 
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタcs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
cs-1. 無料ソフトウエア,無料データ,エコシステム,Scratch プログラミング,Scratch のキャラクタ
 
mi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョンmi-8. 人工知能とコンピュータビジョン
mi-8. 人工知能とコンピュータビジョン
 
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
mi-7. 学習と検証, 学習不足, 過学習, 学習曲線
 
mi-6. 画像分類システム
mi-6. 画像分類システムmi-6. 画像分類システム
mi-6. 画像分類システム
 
mi-5. ディープラーニング
mi-5. ディープラーニングmi-5. ディープラーニング
mi-5. ディープラーニング
 
mi-4. 機械学習
mi-4. 機械学習mi-4. 機械学習
mi-4. 機械学習
 
mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習mi-3. データサイエンス・AIの演習
mi-3. データサイエンス・AIの演習
 
mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例mi-2. データサイエンス・AIの事例
mi-2. データサイエンス・AIの事例
 
mi-1. 人工知能の概要
mi-1. 人工知能の概要mi-1. 人工知能の概要
mi-1. 人工知能の概要
 
kaneko202304.pptx
kaneko202304.pptxkaneko202304.pptx
kaneko202304.pptx
 
Coding Standards of C++ について
 Coding Standards of C++ について  Coding Standards of C++ について
Coding Standards of C++ について
 
co-3. サブクラス、継承
co-3. サブクラス、継承co-3. サブクラス、継承
co-3. サブクラス、継承
 
co-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出しco-2. メソッド定義と呼び出し
co-2. メソッド定義と呼び出し
 

ae-9. 姿勢推定