SlideShare a Scribd company logo
1 of 31
Confluence: Conformity Influence in
Large Social Networks
Jie Tang, Sen Wu, Jimeng Sun
KDD2013読み会
Gunosy Inc.
Coffee Yoshida
2013/09/08 KDD2013読み会
概要
• グループや友人に同調して、意見や行動を変更
する社会的な影響があり、Comformityと呼ぶ
– Comformity = 順応、従順、服従
• 3種類のConformity(individual, peer, group)の影
響を定式化したConfluenceモデルを提案する
• Flickr、Gowalla、Weibo、Co-Authorのデータを使
い、Confluenceモデルでユーザのアクションを予
測する実験を行った
2013/09/08 KDD2013読み会
イントロ
• Conformityとは
– 社会心理学とかで言われる、グループの規範に従うように、
態度・信念・行動を変更すること
• Conformityを引き起こす原因
– 個人のステータス、個人間の影響、周りのプレッシャー、
などなど、、
• Conformityに取り組む理由
– 社会心理学とは別の視点からConformityに取り組み、その
影響を定式化することによって、ソーシャルネットワーク
上の複雑なダイナミクスを理解するのに役立つ
2013/09/08 KDD2013読み会
イントロ
• Conformityに取り組む上での課題
1.色々な要素が混ざったConformityを、どのように区
別・定義するか?
2.どのようにモデルを構築するか?
3.どのように、提案モデルが、実際のソーシャル
ネットワーク上で有効であるかを示すか?
2013/09/08 KDD2013読み会
イントロ
• Conformityに取り組む上での課題
1.色々な要素が混ざったConformityを、どのように区別・
定義するか?
⇒ individual, peer conformity, group conformityの3つに分けた
2.どのようにモデルを構築するか?
⇒ probabilistic factor graph modelであるConfluence Modelを提
案した
3.どのように、提案モデルが、実際のソーシャルネット
ワーク上で有効であるかを示すか?
⇒ 4つのソーシャルネットワーク(Flickr、Gowalla、Weibo、
Co-Author)で実験した(アクション予測について)
2013/09/08 KDD2013読み会
問題定義 - Notations
2013/09/08 KDD2013読み会
問題定義 – 入力と出力
• 入力
– ネットワーク
– アクション履歴
• 出力
– 3種類のConfirmityの内、各ユーザにとってどれが重要
か
– アクションの予測
G = (V,E,C, X)
A ={(a,vi,t)}a,i,t
q*
= argmaxq Pq (Yt
|G, A)
Y*
= argmaxYt+1 Pq* (Yt+1
|G, A)
2013/09/08 KDD2013読み会
問題定義 – Individual Conformity
• 3種類のConformity – Individual Conformity
– 同調する相手が誰かは関係なしに、あるユーザのそもそも
の同調しやすやを表す
– (友人と同じアクションを、友人がアクションを行ってか
ら、閾値時間 ε 以内に行った回数) / (全アクション数)
– 自分のアクションの内、友人がちょっと前に同じアクショ
ンを行っていた割合
2013/09/08 KDD2013読み会
問題定義 – Peer Conformity
• 3種類のConformity – Peer Conformity
– 特定の友人に対する同調しやすさ
– (友人 v’ と同じアクションを、友人 v’ がアクション
を行ってから、閾値時間 ε 以内に行った回数) / (あ
る友人 v’ の全アクション数)
– 友人のアクションの内、自分がちょっと後に同じア
クションを行った割合
2013/09/08 KDD2013読み会
問題定義 – Group Conformity
• 3種類のConformity – Group Conformity
– 特定のグループに対する同調しやすさ
– (グループ内のユーザと同じアクションを、そのユーザが
アクションを行ってから、閾値時間 ε 以内に行った回数)
/ (あるグループ Ck に属するユーザの τ %以上が行った全
アクション数)
– グループの τ%以上のメンバーが行ったアクションの内、
自分が他のグループメンバーのちょっと後に同じアクショ
ンをした割合
2013/09/08 KDD2013読み会
(再掲)問題定義 – 入力と出力
• 入力
– ネットワーク
– アクション履歴
• 出力
– 3種類のConfirmityの内、各ユーザにとってどれが重要
か
– アクションの予測
G = (V,E,C, X)
A ={(a,vi,t)}a,i,t
q*
= argmaxq Pq (Yt
|G, A)
Y*
= argmaxYt+1 Pq* (Yt+1
|G, A)
2013/09/08 KDD2013読み会
Confluence Model – 図
2013/09/08 KDD2013読み会
Confluence Model – 目的関数
• 目的関数(Hammersley-Clifford theoremを使った)
q =({a},{b},{g},{m})パラメータ:
2013/09/08 KDD2013読み会
Confluence Model – Peer Conformity Factor
• Peer Conformity Factor
– Conformityがあったと認める
閾値 ε を決めるのは難しい
– Conformityが、アク
ションの時間差に応じて小さく
なっていくと考える
– 実験では、 ε = 1, λ = 2 とした
2013/09/08 KDD2013読み会
Confluence Model – Group Conformity Factor
• Group Conformity Factor
– τ = 0.25とした
– 各グループのメンバー25%以
上が行ったアクションのみに、
Conformityを考える
– 複数のグループに所属してい
る場合、それぞれGroup
Conformity Factorを考える
– Newman法を使用して、グルー
プに分けた
2013/09/08 KDD2013読み会
Confluence Model – Individual conformity factor
• Individual conformity factor
2013/09/08 KDD2013読み会
(再掲)Confluence Model – 目的関数
• 目的関数(Hammersley-Clifford theoremを使った)
q =({a},{b},{g},{m})パラメータ:
2013/09/08 KDD2013読み会
Confluence Model – Feature Definition
• Conformity要素とは別の要素も考慮した
– ユーザ属性
• フレンド数、直近3タイムスタンプでの新規フレンド数、所属グ
ループ数、直近3タイムスタンプでの新規グループ数
– Opinion leader
• ユーザがOpinion leaderか否か(Influence Rankを使用)
– Structure hole
• ユーザがStructure holeか否か
– Social ties
• フレンド間の繋がりの強弱(コミュニケーション頻度とコモン
ネイバー数)
– Social balance
• 4種類のトライアドがあるか否か
2013/09/08 KDD2013読み会
Confluence Model – Feature Definition
• Conformity要素とは別の要素も考慮した
– ユーザ属性、Opinion leader、Structure holeは、
として目的関数に混ぜた
– Social ties、Social balanceは
と同じ形式で、目的関数に混ぜた
f (yi, xi, j )
g(yi, y'j, pcf (vi,vj ))
2013/09/08 KDD2013読み会
Confluence Model – Distributed Model Learning
• 分散学習アルゴリズムを提案
– 実際のソーシャルネットワークは、ノード数多いの
で、スケールする学習アルゴリズムが必要
1. グラフをサブグラフに分け、各サブグラフ内で、各
パラメータについての目的関数の勾配を算出(ス
レーブで並列処理)
2. 全パラメータを勾配にもとづいて、最適化(マス
ターで行う)
2013/09/08 KDD2013読み会
Confluence Model –Model Inference
• 学習したパラメータ θ を使用して、t + 1 のアク
ションを予測する
Y*
= argmaxYt+1 Pq* (Yt+1
|G, A)
2013/09/08 KDD2013読み会
実験 - データセット
• データセット
– Flickr
• アクション:写真にコメント
– Gowalla
• アクション:チェックイン
– Weibo
• アクション:2012年の10個のホットトピックについてのつぶ
やき
– Co-Author
• アクション:ある分野の論文執筆
2013/09/08 KDD2013読み会
実験 - データセット
2013/09/08 KDD2013読み会
実験
• 評価手法
– Prediction Accuracy
• アクション予測
• Precision、Recall、F1値、AUC
– Scalability Performance
– Qualitative Case Study
• 比較手法
– SVM
• ユーザ属性、individual conformityを使用
– ロジスティック回帰
• ユーザ属性、individual conformityを使用
– CRF
• ユーザ属性、ソーシャル属性、individual conformity、peer
conformityを使用
2013/09/08 KDD2013読み会
実験 – Prediction Performance
• F1値トップだった(1〜17%増加)
2013/09/08 KDD2013読み会
実験 – Factor Contribution Analysis
• CF(Conformity Factor)を入れた時の伸び大きい(2
〜20%増加)
2013/09/08 KDD2013読み会
実験 – Effects of Conformity
• CF(Conformity Factor)を入れないとすごい下がる
• Group Conformityが一番効いてる
2013/09/08 KDD2013読み会
実験 – Scalability Performance
• スレーブ数増やすと、スピード上がっていく
2013/09/08 KDD2013読み会
実験 – Scalability Performance
• 比較手法よりも高速
2013/09/08 KDD2013読み会
実験 – Qualitative Case Study
• Peer Conformityの影響が
大きいアクション1を
行っているユーザの多い
グループ1は、繋がりが
疎で、対立的な意見のコ
メンが多い
• Group Conformityの影響
が大きいアクション2を
行っているユーザの多い
グループ2は、繋がりが
密で、旅グループぽい
2013/09/08 KDD2013読み会
まとめ
• 3つのConformityを定義した
• Conformity Influenceを定式化したConfluence
Modelを提案した
• アクション予測結果抜群だった
• 分散学習モデル高速だった
• ケーススタディでもモデルの有効性示せた
2013/09/08 KDD2013読み会

More Related Content

Viewers also liked

uCoz презентация (kz)
uCoz презентация (kz)uCoz презентация (kz)
uCoz презентация (kz)Blue_Meanie
 
Optimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough DataOptimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough DataKoji Yoshida
 
Toddlers programme
Toddlers programmeToddlers programme
Toddlers programmeAzreen Aj
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...Koji Yoshida
 
Kesihatan pergigian warga emas
Kesihatan pergigian warga emasKesihatan pergigian warga emas
Kesihatan pergigian warga emasAzreen Aj
 
HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장Hyejin Oh
 

Viewers also liked (11)

Formuleren
FormulerenFormuleren
Formuleren
 
uCoz презентация (kz)
uCoz презентация (kz)uCoz презентация (kz)
uCoz презентация (kz)
 
Pengertian kalimat efektif
Pengertian kalimat efektifPengertian kalimat efektif
Pengertian kalimat efektif
 
U coz.kz.2.2
U coz.kz.2.2U coz.kz.2.2
U coz.kz.2.2
 
Optimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough DataOptimizing Search Engines using Clickthrough Data
Optimizing Search Engines using Clickthrough Data
 
Stichting leerkracht
Stichting leerkrachtStichting leerkracht
Stichting leerkracht
 
Debatteren
DebatterenDebatteren
Debatteren
 
Toddlers programme
Toddlers programmeToddlers programme
Toddlers programme
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 9: Bernoulli Likelihood wit...
 
Kesihatan pergigian warga emas
Kesihatan pergigian warga emasKesihatan pergigian warga emas
Kesihatan pergigian warga emas
 
HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장HTTP 완벽 가이드 9~10장
HTTP 완벽 가이드 9~10장
 

Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

  • 1. Confluence: Conformity Influence in Large Social Networks Jie Tang, Sen Wu, Jimeng Sun KDD2013読み会 Gunosy Inc. Coffee Yoshida 2013/09/08 KDD2013読み会
  • 2. 概要 • グループや友人に同調して、意見や行動を変更 する社会的な影響があり、Comformityと呼ぶ – Comformity = 順応、従順、服従 • 3種類のConformity(individual, peer, group)の影 響を定式化したConfluenceモデルを提案する • Flickr、Gowalla、Weibo、Co-Authorのデータを使 い、Confluenceモデルでユーザのアクションを予 測する実験を行った 2013/09/08 KDD2013読み会
  • 3. イントロ • Conformityとは – 社会心理学とかで言われる、グループの規範に従うように、 態度・信念・行動を変更すること • Conformityを引き起こす原因 – 個人のステータス、個人間の影響、周りのプレッシャー、 などなど、、 • Conformityに取り組む理由 – 社会心理学とは別の視点からConformityに取り組み、その 影響を定式化することによって、ソーシャルネットワーク 上の複雑なダイナミクスを理解するのに役立つ 2013/09/08 KDD2013読み会
  • 5. イントロ • Conformityに取り組む上での課題 1.色々な要素が混ざったConformityを、どのように区別・ 定義するか? ⇒ individual, peer conformity, group conformityの3つに分けた 2.どのようにモデルを構築するか? ⇒ probabilistic factor graph modelであるConfluence Modelを提 案した 3.どのように、提案モデルが、実際のソーシャルネット ワーク上で有効であるかを示すか? ⇒ 4つのソーシャルネットワーク(Flickr、Gowalla、Weibo、 Co-Author)で実験した(アクション予測について) 2013/09/08 KDD2013読み会
  • 7. 問題定義 – 入力と出力 • 入力 – ネットワーク – アクション履歴 • 出力 – 3種類のConfirmityの内、各ユーザにとってどれが重要 か – アクションの予測 G = (V,E,C, X) A ={(a,vi,t)}a,i,t q* = argmaxq Pq (Yt |G, A) Y* = argmaxYt+1 Pq* (Yt+1 |G, A) 2013/09/08 KDD2013読み会
  • 8. 問題定義 – Individual Conformity • 3種類のConformity – Individual Conformity – 同調する相手が誰かは関係なしに、あるユーザのそもそも の同調しやすやを表す – (友人と同じアクションを、友人がアクションを行ってか ら、閾値時間 ε 以内に行った回数) / (全アクション数) – 自分のアクションの内、友人がちょっと前に同じアクショ ンを行っていた割合 2013/09/08 KDD2013読み会
  • 9. 問題定義 – Peer Conformity • 3種類のConformity – Peer Conformity – 特定の友人に対する同調しやすさ – (友人 v’ と同じアクションを、友人 v’ がアクション を行ってから、閾値時間 ε 以内に行った回数) / (あ る友人 v’ の全アクション数) – 友人のアクションの内、自分がちょっと後に同じア クションを行った割合 2013/09/08 KDD2013読み会
  • 10. 問題定義 – Group Conformity • 3種類のConformity – Group Conformity – 特定のグループに対する同調しやすさ – (グループ内のユーザと同じアクションを、そのユーザが アクションを行ってから、閾値時間 ε 以内に行った回数) / (あるグループ Ck に属するユーザの τ %以上が行った全 アクション数) – グループの τ%以上のメンバーが行ったアクションの内、 自分が他のグループメンバーのちょっと後に同じアクショ ンをした割合 2013/09/08 KDD2013読み会
  • 11. (再掲)問題定義 – 入力と出力 • 入力 – ネットワーク – アクション履歴 • 出力 – 3種類のConfirmityの内、各ユーザにとってどれが重要 か – アクションの予測 G = (V,E,C, X) A ={(a,vi,t)}a,i,t q* = argmaxq Pq (Yt |G, A) Y* = argmaxYt+1 Pq* (Yt+1 |G, A) 2013/09/08 KDD2013読み会
  • 12. Confluence Model – 図 2013/09/08 KDD2013読み会
  • 13. Confluence Model – 目的関数 • 目的関数(Hammersley-Clifford theoremを使った) q =({a},{b},{g},{m})パラメータ: 2013/09/08 KDD2013読み会
  • 14. Confluence Model – Peer Conformity Factor • Peer Conformity Factor – Conformityがあったと認める 閾値 ε を決めるのは難しい – Conformityが、アク ションの時間差に応じて小さく なっていくと考える – 実験では、 ε = 1, λ = 2 とした 2013/09/08 KDD2013読み会
  • 15. Confluence Model – Group Conformity Factor • Group Conformity Factor – τ = 0.25とした – 各グループのメンバー25%以 上が行ったアクションのみに、 Conformityを考える – 複数のグループに所属してい る場合、それぞれGroup Conformity Factorを考える – Newman法を使用して、グルー プに分けた 2013/09/08 KDD2013読み会
  • 16. Confluence Model – Individual conformity factor • Individual conformity factor 2013/09/08 KDD2013読み会
  • 17. (再掲)Confluence Model – 目的関数 • 目的関数(Hammersley-Clifford theoremを使った) q =({a},{b},{g},{m})パラメータ: 2013/09/08 KDD2013読み会
  • 18. Confluence Model – Feature Definition • Conformity要素とは別の要素も考慮した – ユーザ属性 • フレンド数、直近3タイムスタンプでの新規フレンド数、所属グ ループ数、直近3タイムスタンプでの新規グループ数 – Opinion leader • ユーザがOpinion leaderか否か(Influence Rankを使用) – Structure hole • ユーザがStructure holeか否か – Social ties • フレンド間の繋がりの強弱(コミュニケーション頻度とコモン ネイバー数) – Social balance • 4種類のトライアドがあるか否か 2013/09/08 KDD2013読み会
  • 19. Confluence Model – Feature Definition • Conformity要素とは別の要素も考慮した – ユーザ属性、Opinion leader、Structure holeは、 として目的関数に混ぜた – Social ties、Social balanceは と同じ形式で、目的関数に混ぜた f (yi, xi, j ) g(yi, y'j, pcf (vi,vj )) 2013/09/08 KDD2013読み会
  • 20. Confluence Model – Distributed Model Learning • 分散学習アルゴリズムを提案 – 実際のソーシャルネットワークは、ノード数多いの で、スケールする学習アルゴリズムが必要 1. グラフをサブグラフに分け、各サブグラフ内で、各 パラメータについての目的関数の勾配を算出(ス レーブで並列処理) 2. 全パラメータを勾配にもとづいて、最適化(マス ターで行う) 2013/09/08 KDD2013読み会
  • 21. Confluence Model –Model Inference • 学習したパラメータ θ を使用して、t + 1 のアク ションを予測する Y* = argmaxYt+1 Pq* (Yt+1 |G, A) 2013/09/08 KDD2013読み会
  • 22. 実験 - データセット • データセット – Flickr • アクション:写真にコメント – Gowalla • アクション:チェックイン – Weibo • アクション:2012年の10個のホットトピックについてのつぶ やき – Co-Author • アクション:ある分野の論文執筆 2013/09/08 KDD2013読み会
  • 24. 実験 • 評価手法 – Prediction Accuracy • アクション予測 • Precision、Recall、F1値、AUC – Scalability Performance – Qualitative Case Study • 比較手法 – SVM • ユーザ属性、individual conformityを使用 – ロジスティック回帰 • ユーザ属性、individual conformityを使用 – CRF • ユーザ属性、ソーシャル属性、individual conformity、peer conformityを使用 2013/09/08 KDD2013読み会
  • 25. 実験 – Prediction Performance • F1値トップだった(1〜17%増加) 2013/09/08 KDD2013読み会
  • 26. 実験 – Factor Contribution Analysis • CF(Conformity Factor)を入れた時の伸び大きい(2 〜20%増加) 2013/09/08 KDD2013読み会
  • 27. 実験 – Effects of Conformity • CF(Conformity Factor)を入れないとすごい下がる • Group Conformityが一番効いてる 2013/09/08 KDD2013読み会
  • 28. 実験 – Scalability Performance • スレーブ数増やすと、スピード上がっていく 2013/09/08 KDD2013読み会
  • 29. 実験 – Scalability Performance • 比較手法よりも高速 2013/09/08 KDD2013読み会
  • 30. 実験 – Qualitative Case Study • Peer Conformityの影響が 大きいアクション1を 行っているユーザの多い グループ1は、繋がりが 疎で、対立的な意見のコ メンが多い • Group Conformityの影響 が大きいアクション2を 行っているユーザの多い グループ2は、繋がりが 密で、旅グループぽい 2013/09/08 KDD2013読み会
  • 31. まとめ • 3つのConformityを定義した • Conformity Influenceを定式化したConfluence Modelを提案した • アクション予測結果抜群だった • 分散学習モデル高速だった • ケーススタディでもモデルの有効性示せた 2013/09/08 KDD2013読み会