SlideShare a Scribd company logo
1 of 19
確率ロボティクスと移動ロボットの行動生成
第9回
上田隆一
本日の内容
• POMDP
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 2
POMDP
• 部分観測マルコフ決定過程
• 状態が自明でない場合のマルコフ決定過程
– センサ情報から得られるが、部分的
• ほぼ、自律型ロボットの問題に相当
• 他者がいるとさらに問題が難しくなるが、
POMDPでは考えない/扱えない
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 3
定式化
• 状態が直接観測できず、観測から間接的に分かる
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 4
問題の例
• スイカ割り
– 自分とスイカの相対姿勢がはっきり分からない
– 他者からの情報で
• スイカ割り(目隠しをしなくても)
– 実は目隠しをしなくても相対姿勢が絶対的に
分かっているわけではない
– 単なる程度の問題で、実世界では常に不確かさが伴う
– ロボットにやらせると大変でしょう?
• 枠組みや問題の複雑さを知っておくことが設計の際に重要
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 5
• 位置推定が曖昧な場合の行動決定
– 自己位置推定の時に出たご指摘の通り
– 単にパーティクルの平均値をとるだけでは
タスクに失敗するかもしれない
– そもそも確率分布には平均値が意味を
持たないものもある
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 6
平均
図: パーティクルの分布が二つに分かれて
いて平均値が何も意味を持たない場合
問題の例(続き)
• その他人間の場合
– 人生の中のPOMDPを見つけてみましょう
(丸投げ)
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 7
問題の例(続き)
確率的な自己位置推定との関係
• ロボットがbelから行動決定
– 観測→信念
• 状態の上で定義された方策ではなく、
belの上で定義された方策となる
– bel: 信念
– 「信念に対する方策」
• どうやって求めるか?
• そもそも求められるのか?
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 8
問題の大きさ
• 状態が100個、行動が2種類の場合
• MDP
– 方策のパターンは2^100通り
– 価値反復を使うと
O(状態数・行動数・タスクの長さ)
で方策を1個選ぶことができる
• POMDP
– belは100個の上で定義される関数
• 無限に存在
– 無限にあるものに対する方策のパターンは無限
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 9
POMDPとハンドコーディング
• 例えば、パーティクルの分布から
移動ロボットの行動を決めるコードを書いてみましょう
– 例えば脱輪したり縁石に乗り上げたりしないで、
できるだけ早く角を曲がる場合を考えてみましょう
– (たいていの場合)ほぼ無限に場合分けできる
• 疲れる
– そもそも「無理」
という場合も
• 豊富な研究テーマ
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 10
角を曲がるための研究テーマの例
• なんとなくセンサを乗っけて対処しようとしたり、
コーディングでごまかすのはもったいない
– 問題をきっちり定式化することで、研究として扱える
– 実はロボットで扱う一般的(そして深刻)な問題になっている
• 曖昧さを考慮した行動の選択
– 今日の後半はこの話だけ
• 他にも考えられる(次のページ)
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 11
• 観測戦略
– 位置が分からないような状況で角に
突っ込まないために能動的に観測
• ロボットの形状やセンサの配置を考える
– 角に突っ込んでも壊れない
– 形状が情報処理の負荷を下げる(身体性とも関連)
• 確率分布の表現
– 普通のパーティクルフィルタは一箇所にパーティクルが
集まりがち
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 12
信念からの方策の求め方
• 無限に存在するbel(信念状態)に対してどのように
行動を対応づけて方策を作るか?
• ここでは以下の二つについて扱う
(他に探索等の手法)
– 方法1:
• 信念状態を有限個に分類して行動を割り付け
• MDPのように学習や価値反復で
– 方法2:
• 事前にMDPの問題を解いて再利用
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 13
方法1(AMDPと呼ばれる手法群)
• 信念の数を有限個に近似
• 例[Roy 99]
– 距離センサを持つ移動ロボットのナビゲーション問題
– 4次元の状態空間を作る
• xyqを離散化
• 位置推定の分布がどれだけ曖昧か数値化して離散化
• 状態遷移はなんとか計算
– 得られる行動
• 自己位置が分からなくならないように壁沿いを走る
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 14
方法2(QMDP, 他)
• MDPの計算結果を利用する
– 状態遷移の法則性が分かっているが、ロボットが
自分の状態を完全に分からない場合に使える
• 例[Littman95]
– 確率密度関数belと価値関数Vから価値の
期待値を計算
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 15
• 例
– 下のような碁盤の目の環境を考える
– 1マスが1状態
– 行動は上下左右
– 同じ重みを持ったパーティクル10個が分布
– タスクはゴール(G)に
最短歩数で到達すること
– 数字はコスト
– 灰色のところに入ろうとすると
戻される
– 問題
• 一番「価値の高い」行動は?
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 16
3 2 1 G
4 3 2 1
5 4
6 5 6 7
• これだとどうなるでしょう?
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 17
G
4 3 2 1
5
6 7 8 9
probabilistic flow control[ueda2015]
• 手前味噌ですが・・・
• 期待値計算において
「重み = パーティクルの重み/価値」とする
– ゴールに近いパーティクルが
行動決定に大きな影響を与える
• 投機的な行動が生成され、
ロボットがゴールを探すようになる
– ただしこれでもデッドロックは
発生する
• 問題を完全には解いていないので
• 研究は続く・・・
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 18
G
4 3 2 1
5
6 7 8 9
重み1/3
重み1/7
次回
• POMDPの一つの解としてPFCの実機実装を扱う
• その後、PFCとは違う論文を読む
– 偏るので
Oct. 7, 2015 確率ロボティクスと移動ロボットの行動生成 19

More Related Content

What's hot

What's hot (13)

確率ロボティクス第三回
確率ロボティクス第三回確率ロボティクス第三回
確率ロボティクス第三回
 
確率ロボティクス第四回
確率ロボティクス第四回確率ロボティクス第四回
確率ロボティクス第四回
 
確率ロボティクス第11回
確率ロボティクス第11回確率ロボティクス第11回
確率ロボティクス第11回
 
Robot frontier lesson1
Robot frontier lesson1Robot frontier lesson1
Robot frontier lesson1
 
Robot frontier lesson2
Robot frontier lesson2Robot frontier lesson2
Robot frontier lesson2
 
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
 
Robot frontier lesson3 2018
Robot frontier lesson3 2018Robot frontier lesson3 2018
Robot frontier lesson3 2018
 
Robot frontier lesson2 2018
Robot frontier lesson2 2018Robot frontier lesson2 2018
Robot frontier lesson2 2018
 
Robot frontier lesson1 2018
Robot frontier lesson1 2018Robot frontier lesson1 2018
Robot frontier lesson1 2018
 
日本ロボット学会第139回ロボット工学セミナー
日本ロボット学会第139回ロボット工学セミナー日本ロボット学会第139回ロボット工学セミナー
日本ロボット学会第139回ロボット工学セミナー
 
Robot frontier lesson3
Robot frontier lesson3Robot frontier lesson3
Robot frontier lesson3
 
博士論文本審査スライド
博士論文本審査スライド博士論文本審査スライド
博士論文本審査スライド
 
LL Ring Recursive ライトニングトーク
LL Ring Recursive ライトニングトークLL Ring Recursive ライトニングトーク
LL Ring Recursive ライトニングトーク
 

More from Ryuichi Ueda

2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド
2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド
2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド
Ryuichi Ueda
 

More from Ryuichi Ueda (20)

第27回ロボティクスシンポジアスライド
第27回ロボティクスシンポジアスライド第27回ロボティクスシンポジアスライド
第27回ロボティクスシンポジアスライド
 
シェル・ワンライナー160本ノック
シェル・ワンライナー160本ノックシェル・ワンライナー160本ノック
シェル・ワンライナー160本ノック
 
シェル芸勉強会と会場の話
シェル芸勉強会と会場の話シェル芸勉強会と会場の話
シェル芸勉強会と会場の話
 
移動ロボットのナビゲーション
移動ロボットのナビゲーション移動ロボットのナビゲーション
移動ロボットのナビゲーション
 
PythonとJupyter Notebookを利用した教科書「詳解確率ロボティクス」の企画と執筆
PythonとJupyter Notebookを利用した教科書「詳解確率ロボティクス」の企画と執筆PythonとJupyter Notebookを利用した教科書「詳解確率ロボティクス」の企画と執筆
PythonとJupyter Notebookを利用した教科書「詳解確率ロボティクス」の企画と執筆
 
第45回シェル芸勉強会オープニングスライド
第45回シェル芸勉強会オープニングスライド第45回シェル芸勉強会オープニングスライド
第45回シェル芸勉強会オープニングスライド
 
bash(の変な使い方)update
bash(の変な使い方)updatebash(の変な使い方)update
bash(の変な使い方)update
 
第41回シェル芸勉強会 午後オープニング
第41回シェル芸勉強会 午後オープニング第41回シェル芸勉強会 午後オープニング
第41回シェル芸勉強会 午後オープニング
 
Searching Behavior of a Simple Manipulator only with Sense of Touch Generated...
Searching Behavior of a Simple Manipulator only with Sense of Touch Generated...Searching Behavior of a Simple Manipulator only with Sense of Touch Generated...
Searching Behavior of a Simple Manipulator only with Sense of Touch Generated...
 
20181113_子ども夢ロボット&トーク
20181113_子ども夢ロボット&トーク20181113_子ども夢ロボット&トーク
20181113_子ども夢ロボット&トーク
 
第37回シェル芸勉強会イントロ
第37回シェル芸勉強会イントロ第37回シェル芸勉強会イントロ
第37回シェル芸勉強会イントロ
 
シェル芸勉強会にみる、コミュニティを通じたIT学習
シェル芸勉強会にみる、コミュニティを通じたIT学習シェル芸勉強会にみる、コミュニティを通じたIT学習
シェル芸勉強会にみる、コミュニティを通じたIT学習
 
ROSチュートリアル ROBOMECH2018
ROSチュートリアル ROBOMECH2018ROSチュートリアル ROBOMECH2018
ROSチュートリアル ROBOMECH2018
 
poster of PFoE used in ICRA 2018
poster of PFoE used in ICRA 2018poster of PFoE used in ICRA 2018
poster of PFoE used in ICRA 2018
 
第34回シェル芸勉強会
第34回シェル芸勉強会第34回シェル芸勉強会
第34回シェル芸勉強会
 
第32回信号処理シンポジウム「Raspberry PiとROSを 使ったロボットシステム」
第32回信号処理シンポジウム「Raspberry PiとROSを使ったロボットシステム」第32回信号処理シンポジウム「Raspberry PiとROSを使ったロボットシステム」
第32回信号処理シンポジウム「Raspberry PiとROSを 使ったロボットシステム」
 
2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド
2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド
2017年10月18日 シェル芸勉強会 meets バイオインフォマティクス vol.1 スライド
 
第31回シェル芸勉強会スライド
第31回シェル芸勉強会スライド第31回シェル芸勉強会スライド
第31回シェル芸勉強会スライド
 
direct use of particle filters for decision making
direct use of particle filters for decision makingdirect use of particle filters for decision making
direct use of particle filters for decision making
 
電子工作で光で動くロボットをつくろう!
電子工作で光で動くロボットをつくろう!電子工作で光で動くロボットをつくろう!
電子工作で光で動くロボットをつくろう!
 

Recently uploaded

Recently uploaded (7)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 

確率ロボティクス第九回