3. 問題設定:
物体操作命令を対象とした状況依存言語理解
• 何が難しいか?
– 不完全情報
– シンボルグラウンディング
Instruction: “Bottle, please”
Name: bottle
Situation: An almost empty plastic
water bottle. The water bottle on the
desk.
ユーザの意図
“Bring the plastic bottle
on the desk to me, please”
9. 分散表現
Visual Genomeデータセット[Krishna+ 16]を元に、評価用
データセットを構築した
• Object Manipulation Multimodal Data Set
– 動作タスク成功度(=動作が成功しそうか)を人手でラベル付け
• 言語由来の特徴量のみを利用
– PV-DM[Le+ 14](472万文で学習)を用いて、「名称」「状況」の
説明文をパラグラフ分散表現に変換
Name: bottle
Situation: insulated water
bottle with sipper top. ... a set
of keys by the water bottle.
ラベル
1:禁止
2:不可能
3:困難
4:容易
分散表現
Name: bottle
Situation: a bottle in a
woman's hand. … woman
holding a water bottle.
ラベル
1:禁止
2:不可能
3:困難
4:容易
タスク成功に重要な情報が
言語で表現されている