More Related Content
More from Takanori Nakai (18)
Similarity component analysis
- 10. モデルパラメータ推定法
ー 各確率変数の整理ー
▸
zk|u,v ∼ ベルヌーイ確率
– p(z =1|u,v) = p (M , b )
k
k
k
k
–
▸
s | zk ∼ ベルヌーイ確率
– p(s=1|z =1) = 1 - θ p(s=1|z =0) = 0
k
k,
k
–
▸
p(zk=1|u,v) = 1 - pk(Mk , bk)
モデルパラメータ
Mk , bk , θk
p(s=0|zk=1) = 0, p(s=0|zk=0) = θk
s | z ∼ Noisy OR
– p(s=1|z) = 1 -
10
NIPS2013読み会
zk
- 11. モデルパラメータ推定法
ー 対数尤度の期待値よりEMアルゴリズムー
▸
計算したい量
– p(s|u,v)
s:{0,1}、u,v:対象の局所特徴ベクトル
▸
p(s|u,v) = ∫dz p(s,z|u,v)
= ∫dz p(z|u,v) * p(s|z)
= ∫dz
(∵グラフィカル表現)
p(zk|u,v) * p(s|z)
▸
I1 =
▸
I2 = s*p(s=1|z) + (1-s)*p(s=0|z)
11
{ zk*p(zk=1|u,v) + (1-zk)*p(zk=0|u,v) }
NIPS2013読み会
- 13. 評価実験
ー 人工データ編:拘束を持つ距離との比較 ー
▸
見どころ
– 不等式制約を持った類似距離との性能比較
●
●
▸
ITML : d(x,y) + 1 ≦ d(y,z)
LMNN : d(x,y) ≦ U, d(x,y) ≧ L, U,L∊R+
結果
K(局所特徴量)=6が正解
▸
不等式制約を持つ類似距離と比較し性能向上
▸
局所特徴量を増やすと性能が情報し、K=10で最大
13
NIPS2013読み会
- 15. 評価実験
ー リンク予測:複数局所特徴量を持つ場合 ー
▸
実験設定
– データ:1987~1999年に開催されたNIPSの論文
から、1カンファレンス辺りランダムに80本を選択
–
ネットワークを作成
●
●
–
ノード:論文
エッジ:類似していると判定された場合
論文の局所特徴量
●
●
Topic:各文書のトピックベクトル(LDA)
●
15
Bag of Words:頻度カットあり
Topic Words:推定した各トピックの単語ベクトル
NIPS2013読み会
- 17. 評価実験
ー リンク予測(NIPS投稿論文データセット) ー
the t-SNE algorithmによる視覚化
上手く分類
できている
▸
▸
分類が不十分
同一セッションの論文を最大で88%正しく分類出来た
LDAでは上手く分類できなかったものの、
SCAでは、1クラスタに類似した対象が分類されている
→ LDAはIndexingとして使用するほうが吉?
17
NIPS2013読み会