SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
ゲーム環境におけるタグ情報の利用と
戦略進化に関する研究
システム情報工学専攻
複雑系工学講座
調和系工学分野
濱田 貴広
はじめに
タグ
チープトーク
タグ
シグナリング
コスト送信内容
ゲーム理論における,事前コミュニケーション
シグナリング
プレイヤがある行動を選択することによって自分のタイプを
顕示しようとする行為 → コストをかけることで戦略的効果の発揮
チープトーク
コストのかからないシグナリング
有
無
無
意図的
意図的
非意図的
・誰からも可視な外見上の特徴
・プレイヤの行動と明示的な相関はない
・意図的な変更不可
・コストゼロ
関連研究
[Riole 97] [Alkemade et. al. 00]
[Axtell et. al. 00]
IPDゲームで,類似したタグを持つプレイヤを相手として
選択することによる協調関係の形成
相手選択に使用
行動選択に使用
タグで特徴付けられるプレイヤ集団の行動に対する期待を形成し,
それをもとに行動選択する.
要求ゲームにおける規範の形成,平等規範の安定性
チキンゲームにおける,タグの複雑化,集団サイズの利得への影響
[Hoffmann 01]
目的
ゲーム環境において,タグ情報を利用するプレイヤとそうでないプ
レイヤが混在する集団では,タグ情報がどのくらい意味のあるも
のになるのかを考察する
プレイヤはタグを識別して行動することを前提
タグで特徴づけられるプレイヤ集団をひとまとめに考えて,
次回以降の相手の行動を予測する.
ステレオタイプ化
モデルとゲーム
)}{,}{,( NiiNii fSNG 
},{ DCSi 
プレイヤ集合
行動選択
利得関数
}2,1{N
ゲーム
タグ
C D
C 4,4 1,3
D 3,1 2,2
C D
C 3,3 2,4
D 4,2 1,1
C D
C 3,3 1,4
D 4,1 2,2
チキンゲーム
囚人のジレンマゲーム
鹿狩りゲーム
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
支配戦略が存在しない
ナッシュ均衡の対称性
リスク支配な戦略がない
支配戦略が存在しない
ナッシュ均衡の非対称性
支配戦略が存在するが
パレート最適ではない
2人非協力ゲーム・1 shot - game
2
21: RSSfi 
}1,...,1,0{  tTti
・・・ プレイヤに唯一で意図的な変更不可
プレイヤのタイプと戦略
入力
行動履歴
出力
行動提示
タグ
<出力>
D
C
1 1
2
行動m(記憶長)
C D
C C
0
1
D Dt-1
…
各タグをもつプレイヤに対する履歴
m=2 … タグで特徴付けられた
集団全体に対する履歴
ステレオタイプ化した戦略表現
<入力>
tm
2
戦略遺伝子列長 :
それぞれのタグを持つプレイヤに対する戦略
0
D C D C D D D D
・・・
D C D C
1 t-1
i. Type D : Tag Distinguish
ii. Type N : Noise Input
タグが特定の集団に対応付いている
タグが特定の集団に対応付いていない
xランダムに決定
t )( Tt 
)( Tx
戦略進化のプロセス
GAでプレイヤの戦略を適応的に更新する
適応度 ⇒ 平均利得
ルーレット選択
二点交叉 ( 同タイプ,同タグの相手とのみ )
突然変異 ( 戦略遺伝子列,タイプ,タグ )
P(player数)
M(ゲーム回数)
T(タグの種類の数)
m(記憶長)
GAの世代数
交叉率
タグ変異率
戦略タイプ変異率
突然変異率
試行回数
100
平均 40
設定による
2
10000
0.5
0.01
0.01
0.001 ( per bit )
20
入力情報の影響の定量化
 
 Xx
xpxpXHH )(log)()( 2
 
 YyXx
yxpyxpYXH , 2 )|(log),()|(
)|()(),( YXHXHYXIItag 
},{ DCXx 
},...,1{ tYy 
行動の不確実性
タグ入力の情報量
行動
タグ
)(xp 各行動の選択割合
プレイヤの行動に対して,タグ情報がどのくらい影響を与えているのかを定量化
実験
Type D のプレイヤのみの集団
Type D と Type N のプレイヤの混合集団
tagI と平均利得の関係
tagI と平均利得の関係Type Dのプレイヤ集団の
Type Dと Type N のプレイヤ集団の平均利得の比較
T = 1
Type Dのみの集団
2
2.2
2.4
2.6
2.8
3
3.2
3.4
3.6
3.8
4
0 0.02 0.04 0.06 0.08 0.1 0.12
tagI
平
均
利
得
T = 1, 2, 3, 4, 5, 6, 7.
初期状態 : 各タグを持つプレイヤ数はほぼ同数
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある
それぞれの設定における全世代,全試行の平均をプロット
Type D + Type N の混合集団
2
2.2
2.4
2.6
2.8
3
3.2
3.4
3.6
3.8
4
0 0.02 0.04 0.06 0.08 0.1 0.12
tagI
タ
イ
プ
D
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
T = 2, 3, 4, 5.
初期状態 : type D とtype N のプレイヤは同数
各タグを持つプレイヤ数もほぼ同数
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
それぞれの設定における全世代,全試行の平均をプロット
鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある
Type D + Type N の混合集団
0
1
2
3
4
2 3 4 5
0
1
2
3
4
2 3 4 5
0
1
2
3
4
2 3 4 5
鹿狩りゲームにおいてのみType Dの平均利得が高い
T = 2, 3, 4, 5.
初期状態 : type D とtype N のプレイヤは同数
各タグを持つプレイヤ数はほぼ同数
それぞれの設定における全世代,全試行の平均
各
タ
イ
プ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
TT
T
鹿狩りゲーム チキンゲーム
囚人のジレンマゲーム
各
タ
イ
プ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
各
タ
イ
プ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
type Nのプレイヤの平均利得
type Dのプレイヤの平均利得
考察
Type Dのプレイヤのみの集団では,タグの情報量と平均利得に
正の相関があるので,特に鹿狩りゲームではタグ情報は意味 が
ある
Type DとType Nのプレイヤの混合集団では,
鹿狩りゲームで,Type Dのプレイヤにおいてタグの情報量と
平均利得に正の相関があり,かつ平均利得に関して, Type D
がType Nを上回ったので,タグ情報は意味がある
・・・タグ情報に意味を持つのはゲームの性質による
まとめ
タグ情報を利用するプレイヤ間のゲームを扱った
タグ情報を利用しないプレイヤが混在する状況では,ゲー
ムによっては,進化の過程でタグ情報に対する行動の期待が
実現されにくくなり,ジレンマ型のゲームにおいては,タグ情
報は意味を持たなくなる
タグ情報を特定の集団に対応付けて行動選択するプレイヤ
集団では,タグ情報は意味がある

Contenu connexe

En vedette (20)

itou m
itou mitou m
itou m
 
Arai m
Arai mArai m
Arai m
 
kanehira m
kanehira mkanehira m
kanehira m
 
sasaki m
sasaki msasaki m
sasaki m
 
kadota b
kadota bkadota b
kadota b
 
Sugawara b
Sugawara bSugawara b
Sugawara b
 
onodera b
onodera bonodera b
onodera b
 
mori b
mori bmori b
mori b
 
kobayashi b
kobayashi bkobayashi b
kobayashi b
 
kobayashi_m
kobayashi_mkobayashi_m
kobayashi_m
 
kikuchi_b
kikuchi_bkikuchi_b
kikuchi_b
 
tsuji m
tsuji mtsuji m
tsuji m
 
nakano b
nakano bnakano b
nakano b
 
matsuo m
matsuo mmatsuo m
matsuo m
 
hayasaka b
hayasaka bhayasaka b
hayasaka b
 
yamauchi b
yamauchi byamauchi b
yamauchi b
 
segawa_b
segawa_bsegawa_b
segawa_b
 
fukui m
fukui mfukui m
fukui m
 
kanehira m
kanehira mkanehira m
kanehira m
 
yamagata m
yamagata myamagata m
yamagata m
 

Plus de harmonylab

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也harmonylab
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究harmonylab
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...harmonylab
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究harmonylab
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究harmonylab
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...harmonylab
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backboneharmonylab
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Modelsharmonylab
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimationharmonylab
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Modelsharmonylab
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimationharmonylab
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Modelsharmonylab
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究harmonylab
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究harmonylab
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究harmonylab
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究harmonylab
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究harmonylab
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究harmonylab
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...harmonylab
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究harmonylab
 

Plus de harmonylab (20)

【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
 
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
 
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
 
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
 
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
 
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
 
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile BackboneDLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
 
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat ModelsDLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
DLゼミ: Llama 2: Open Foundation and Fine-Tuned Chat Models
 
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose EstimationDLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
 
Voyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language ModelsVoyager: An Open-Ended Embodied Agent with Large Language Models
Voyager: An Open-Ended Embodied Agent with Large Language Models
 
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose EstimationDLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
DLゼミ: Ego-Body Pose Estimation via Ego-Head Pose Estimation
 
ReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language ModelsReAct: Synergizing Reasoning and Acting in Language Models
ReAct: Synergizing Reasoning and Acting in Language Models
 
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究形態素解析を用いた帝国議会議事速記録の変遷に関する研究
形態素解析を用いた帝国議会議事速記録の変遷に関する研究
 
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
【卒業論文】深層生成モデルを用いたユーザ意図に基づく衣服画像の生成に関する研究
 
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究灯油タンク内の液面高計測を用いた灯油残量推定システムに関する研究
灯油タンク内の液面高計測を用いた 灯油残量推定システムに関する研究
 
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究深層自己回帰モデルを用いた俳句の生成と評価に関する研究
深層自己回帰モデルを用いた俳句の生成と評価に関する研究
 
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究競輪におけるレーティングシステムを用いた予想記事生成に関する研究
競輪におけるレーティングシステムを用いた予想記事生成に関する研究
 
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
【卒業論文】B2Bオークションにおけるユーザ別 入札行動予測に関する研究
 
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...A Study on Estimation of Household Kerosene Consumption for Optimization of D...
A Study on Estimation of Household Kerosene Consumption for Optimization of D...
 
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
マルチエージェント深層強化学習による自動運転車両の追越行動の獲得に関する研究
 

hamada m