5. Automatic Keyphrase Extraction via
Topic Decomposition, Liu et al. (2010)
1. LDAによるトピック抽出
2. Topical PageRankによるキーフレーズ抽出
Automatic Keyphrase Extraction via Topic Decomposition, Liu et al. (2010)
6. Automatic Keyphrase Extraction via
Topic Decomposition, Liu et al. (2010)
1. LDAによるトピック抽出
2. Topical PageRankによるキーフレーズ抽出
Automatic Keyphrase Extraction via Topic Decomposition, Liu et al. (2010)
8. LDAによるトピック抽出
● LDA (Latent Dirichlet Allocation)
● 文書集合からトピックを抽出
○ トピック数Nは事前に与える
● トピックを抽出することにより、文書のトピックを推定も可能
Automatic Keyphrase Extraction via Topic Decomposition, Liu et al. (2010)
9. Automatic Keyphrase Extraction via
Topic Decomposition, Liu et al. (2010)
1. LDAによるトピック抽出
2. Topical PageRankによるキーフレーズ抽出
Automatic Keyphrase Extraction via Topic Decomposition, Liu et al. (2010)
10. Topical PageRankによるキーフレーズ抽出
1. 単語グラフの生成
2. Topical PageRankによるスコア計算
3. スコアを用いたキーフレーズ抽出
4. 文書のキーフレーズ取得
Automatic Keyphrase Extraction via Topic Decomposition, Liu et al. (2010)
11. 単語グラフの生成
● 文書中の単語の共起性を利用して構築
○ ウィンドウ幅Wの共起数
○ 有向、無向かは性能には影響しない
We construct a word graph according to word co-occurrences within the given document.
W=5の場合
We
construct
word
graph
co-ocurrences
document
Automatic Keyphrase Extraction via Topic Decomposition, Liu et al. (2010)
名詞と動詞のみで
グラフを構築した場合