hamada m

ゲーム環境におけるタグ情報の利用と
戦略進化に関する研究
システム情報工学専攻
複雑系工学講座
調和系工学分野
濱田貴広

はじめに
タグ
チープトーク
タグ
シグナリング
コスト送信内容
ゲーム理論における，事前コミュニケーション
シグナリング
プレイヤがある行動を選択することによって自分のタイプを
顕示しようとする行為 → コストをかけることで戦略的効果の発揮
チープトーク
コストのかからないシグナリング
有
無
無
意図的
意図的
非意図的
・誰からも可視な外見上の特徴
・プレイヤの行動と明示的な相関はない
・意図的な変更不可
・コストゼロ

関連研究
[Riole 97] [Alkemade et. al. 00]
[Axtell et. al. 00]
IPDゲームで，類似したタグを持つプレイヤを相手として
選択することによる協調関係の形成
相手選択に使用
行動選択に使用
タグで特徴付けられるプレイヤ集団の行動に対する期待を形成し，
それをもとに行動選択する．
要求ゲームにおける規範の形成，平等規範の安定性
チキンゲームにおける，タグの複雑化，集団サイズの利得への影響
[Hoffmann 01]

目的
ゲーム環境において，タグ情報を利用するプレイヤとそうでないプ
レイヤが混在する集団では，タグ情報がどのくらい意味のあるも
のになるのかを考察する
プレイヤはタグを識別して行動することを前提
タグで特徴づけられるプレイヤ集団をひとまとめに考えて，
次回以降の相手の行動を予測する．
ステレオタイプ化

モデルとゲーム
)}{,}{,( NiiNii fSNG 
},{ DCSi 
プレイヤ集合
行動選択
利得関数
}2,1{N
ゲーム
タグ
C D
C 4,4 1,3
D 3,1 2,2
C D
C 3,3 2,4
D 4,2 1,1
C D
C 3,3 1,4
D 4,1 2,2
チキンゲーム
囚人のジレンマゲーム
鹿狩りゲーム
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
支配戦略が存在しない
ナッシュ均衡の対称性
リスク支配な戦略がない
支配戦略が存在しない
ナッシュ均衡の非対称性
支配戦略が存在するが
パレート最適ではない
2人非協力ゲーム・1 shot - game
2
21: RSSfi 
}1,...,1,0{  tTti
・・・プレイヤに唯一で意図的な変更不可

プレイヤのタイプと戦略
入力
行動履歴
出力
行動提示
タグ
＜出力＞
D
C
1 1
2
行動m（記憶長）
C D
C C
0
1
D Dt-1
…
各タグをもつプレイヤに対する履歴
m=2 … タグで特徴付けられた
集団全体に対する履歴
ステレオタイプ化した戦略表現
＜入力＞
tm
2
戦略遺伝子列長 :
それぞれのタグを持つプレイヤに対する戦略
0
D C D C D D D D
・・・
D C D C
1 t-1
i. Type D : Tag Distinguish
ii. Type N : Noise Input
タグが特定の集団に対応付いている
タグが特定の集団に対応付いていない
xランダムに決定
t )( Tt 
)( Tx

戦略進化のプロセス
GAでプレイヤの戦略を適応的に更新する
適応度 ⇒ 平均利得
ルーレット選択
二点交叉（同タイプ，同タグの相手とのみ）
突然変異（戦略遺伝子列，タイプ，タグ）
P（player数）
M（ゲーム回数）
T（タグの種類の数）
m（記憶長）
GAの世代数
交叉率
タグ変異率
戦略タイプ変異率
突然変異率
試行回数
100
平均 40
設定による
2
10000
0.5
0.01
0.01
0.001 ( per bit )
20

入力情報の影響の定量化
 
 Xx
xpxpXHH )(log)()( 2
 
 YyXx
yxpyxpYXH , 2 )|(log),()|(
)|()(),( YXHXHYXIItag 
},{ DCXx 
},...,1{ tYy 
行動の不確実性
タグ入力の情報量
行動
タグ
)(xp 各行動の選択割合
プレイヤの行動に対して，タグ情報がどのくらい影響を与えているのかを定量化

実験
Type D のプレイヤのみの集団
Type D と Type N のプレイヤの混合集団
tagI と平均利得の関係
tagI と平均利得の関係Type Dのプレイヤ集団の
Type Dと Type N のプレイヤ集団の平均利得の比較

T = 1
Type Dのみの集団
2
2.2
2.4
2.6
2.8
3
3.2
3.4
3.6
3.8
4
0 0.02 0.04 0.06 0.08 0.1 0.12
tagI
平
均
利
得
T = 1, 2, 3, 4, 5, 6, 7.
初期状態：各タグを持つプレイヤ数はほぼ同数
鹿狩りゲーム
チキンゲーム
鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある
それぞれの設定における全世代，全試行の平均をプロット

Type D + Type N の混合集団
2
2.2
2.4
2.6
2.8
3
3.2
3.4
3.6
3.8
4
0 0.02 0.04 0.06 0.08 0.1 0.12
tagI
タ
イ
プ
Ｄ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
T = 2, 3, 4, 5.
初期状態 : type D とtype N のプレイヤは同数
各タグを持つプレイヤ数もほぼ同数
鹿狩りゲーム
チキンゲーム
それぞれの設定における全世代，全試行の平均をプロット
鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある

Type D + Type N の混合集団
0
1
2
3
4
2 3 4 5
0
1
2
3
4
2 3 4 5
0
1
2
3
4
2 3 4 5
鹿狩りゲームにおいてのみType Dの平均利得が高い
T = 2, 3, 4, 5.
初期状態 : type D とtype N のプレイヤは同数
各タグを持つプレイヤ数はほぼ同数
それぞれの設定における全世代，全試行の平均
各
タ
イ
プ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
TT
T
鹿狩りゲームチキンゲーム
各
タ
イ
プ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
各
タ
イ
プ
の
プ
レ
イ
ヤ
ー
の
平
均
利
得
type Nのプレイヤの平均利得
type Dのプレイヤの平均利得

考察
Type Dのプレイヤのみの集団では，タグの情報量と平均利得に
正の相関があるので，特に鹿狩りゲームではタグ情報は意味が
ある
Type DとType Nのプレイヤの混合集団では，
鹿狩りゲームで，Type Dのプレイヤにおいてタグの情報量と
平均利得に正の相関があり，かつ平均利得に関して， Type D
がType Nを上回ったので，タグ情報は意味がある
・・・タグ情報に意味を持つのはゲームの性質による

まとめ
タグ情報を利用するプレイヤ間のゲームを扱った
タグ情報を利用しないプレイヤが混在する状況では，ゲー
ムによっては，進化の過程でタグ情報に対する行動の期待が
実現されにくくなり，ジレンマ型のゲームにおいては，タグ情
報は意味を持たなくなる
タグ情報を特定の集団に対応付けて行動選択するプレイヤ
集団では，タグ情報は意味がある

hamada m

Recommandé

Recommandé

Contenu connexe

En vedette

En vedette (20)

Plus de harmonylab

Plus de harmonylab (20)

hamada m