Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』
- 7. 問題定義 – 入力と出力
• 入力
– ネットワーク
– アクション履歴
• 出力
– 3種類のConfirmityの内、各ユーザにとってどれが重要
か
– アクションの予測
G = (V,E,C, X)
A ={(a,vi,t)}a,i,t
q*
= argmaxq Pq (Yt
|G, A)
Y*
= argmaxYt+1 Pq* (Yt+1
|G, A)
2013/09/08 KDD2013読み会
- 8. 問題定義 – Individual Conformity
• 3種類のConformity – Individual Conformity
– 同調する相手が誰かは関係なしに、あるユーザのそもそも
の同調しやすやを表す
– (友人と同じアクションを、友人がアクションを行ってか
ら、閾値時間 ε 以内に行った回数) / (全アクション数)
– 自分のアクションの内、友人がちょっと前に同じアクショ
ンを行っていた割合
2013/09/08 KDD2013読み会
- 9. 問題定義 – Peer Conformity
• 3種類のConformity – Peer Conformity
– 特定の友人に対する同調しやすさ
– (友人 v’ と同じアクションを、友人 v’ がアクション
を行ってから、閾値時間 ε 以内に行った回数) / (あ
る友人 v’ の全アクション数)
– 友人のアクションの内、自分がちょっと後に同じア
クションを行った割合
2013/09/08 KDD2013読み会
- 10. 問題定義 – Group Conformity
• 3種類のConformity – Group Conformity
– 特定のグループに対する同調しやすさ
– (グループ内のユーザと同じアクションを、そのユーザが
アクションを行ってから、閾値時間 ε 以内に行った回数)
/ (あるグループ Ck に属するユーザの τ %以上が行った全
アクション数)
– グループの τ%以上のメンバーが行ったアクションの内、
自分が他のグループメンバーのちょっと後に同じアクショ
ンをした割合
2013/09/08 KDD2013読み会
- 11. (再掲)問題定義 – 入力と出力
• 入力
– ネットワーク
– アクション履歴
• 出力
– 3種類のConfirmityの内、各ユーザにとってどれが重要
か
– アクションの予測
G = (V,E,C, X)
A ={(a,vi,t)}a,i,t
q*
= argmaxq Pq (Yt
|G, A)
Y*
= argmaxYt+1 Pq* (Yt+1
|G, A)
2013/09/08 KDD2013読み会
- 13. Confluence Model – 目的関数
• 目的関数(Hammersley-Clifford theoremを使った)
q =({a},{b},{g},{m})パラメータ:
2013/09/08 KDD2013読み会
- 14. Confluence Model – Peer Conformity Factor
• Peer Conformity Factor
– Conformityがあったと認める
閾値 ε を決めるのは難しい
– Conformityが、アク
ションの時間差に応じて小さく
なっていくと考える
– 実験では、 ε = 1, λ = 2 とした
2013/09/08 KDD2013読み会
- 15. Confluence Model – Group Conformity Factor
• Group Conformity Factor
– τ = 0.25とした
– 各グループのメンバー25%以
上が行ったアクションのみに、
Conformityを考える
– 複数のグループに所属してい
る場合、それぞれGroup
Conformity Factorを考える
– Newman法を使用して、グルー
プに分けた
2013/09/08 KDD2013読み会
- 16. Confluence Model – Individual conformity factor
• Individual conformity factor
2013/09/08 KDD2013読み会
- 17. (再掲)Confluence Model – 目的関数
• 目的関数(Hammersley-Clifford theoremを使った)
q =({a},{b},{g},{m})パラメータ:
2013/09/08 KDD2013読み会
- 18. Confluence Model – Feature Definition
• Conformity要素とは別の要素も考慮した
– ユーザ属性
• フレンド数、直近3タイムスタンプでの新規フレンド数、所属グ
ループ数、直近3タイムスタンプでの新規グループ数
– Opinion leader
• ユーザがOpinion leaderか否か(Influence Rankを使用)
– Structure hole
• ユーザがStructure holeか否か
– Social ties
• フレンド間の繋がりの強弱(コミュニケーション頻度とコモン
ネイバー数)
– Social balance
• 4種類のトライアドがあるか否か
2013/09/08 KDD2013読み会
- 19. Confluence Model – Feature Definition
• Conformity要素とは別の要素も考慮した
– ユーザ属性、Opinion leader、Structure holeは、
として目的関数に混ぜた
– Social ties、Social balanceは
と同じ形式で、目的関数に混ぜた
f (yi, xi, j )
g(yi, y'j, pcf (vi,vj ))
2013/09/08 KDD2013読み会
- 20. Confluence Model – Distributed Model Learning
• 分散学習アルゴリズムを提案
– 実際のソーシャルネットワークは、ノード数多いの
で、スケールする学習アルゴリズムが必要
1. グラフをサブグラフに分け、各サブグラフ内で、各
パラメータについての目的関数の勾配を算出(ス
レーブで並列処理)
2. 全パラメータを勾配にもとづいて、最適化(マス
ターで行う)
2013/09/08 KDD2013読み会
- 21. Confluence Model –Model Inference
• 学習したパラメータ θ を使用して、t + 1 のアク
ションを予測する
Y*
= argmaxYt+1 Pq* (Yt+1
|G, A)
2013/09/08 KDD2013読み会
- 22. 実験 - データセット
• データセット
– Flickr
• アクション:写真にコメント
– Gowalla
• アクション:チェックイン
– Weibo
• アクション:2012年の10個のホットトピックについてのつぶ
やき
– Co-Author
• アクション:ある分野の論文執筆
2013/09/08 KDD2013読み会
- 24. 実験
• 評価手法
– Prediction Accuracy
• アクション予測
• Precision、Recall、F1値、AUC
– Scalability Performance
– Qualitative Case Study
• 比較手法
– SVM
• ユーザ属性、individual conformityを使用
– ロジスティック回帰
• ユーザ属性、individual conformityを使用
– CRF
• ユーザ属性、ソーシャル属性、individual conformity、peer
conformityを使用
2013/09/08 KDD2013読み会
- 26. 実験 – Factor Contribution Analysis
• CF(Conformity Factor)を入れた時の伸び大きい(2
〜20%増加)
2013/09/08 KDD2013読み会
- 27. 実験 – Effects of Conformity
• CF(Conformity Factor)を入れないとすごい下がる
• Group Conformityが一番効いてる
2013/09/08 KDD2013読み会
- 30. 実験 – Qualitative Case Study
• Peer Conformityの影響が
大きいアクション1を
行っているユーザの多い
グループ1は、繋がりが
疎で、対立的な意見のコ
メンが多い
• Group Conformityの影響
が大きいアクション2を
行っているユーザの多い
グループ2は、繋がりが
密で、旅グループぽい
2013/09/08 KDD2013読み会