Contenu connexe
Similaire à 単語・パラグラフの分散表現を用いたTwitterからの日本語評判情報抽出 (20)
Plus de 奈良先端大 情報科学研究科 (20)
単語・パラグラフの分散表現を用いたTwitterからの日本語評判情報抽出
- 2. DEIM 2016
本発表の背景
• 背景1:⽂書の分散表現をニューラルネットで学習できる
パラグラフベクトルの提案 [Le, Mikolov, 2014.]
– 英語の感情分析ベンチマークを⽤いてState-of-the-Artの精度
» 5段階の極性判定精度は50%程度
– 課題:性能改善に必要な分散表現(ベクトル)の可読性
• 背景2:単語の意味ベクトルとブートストラップ学習を提案
[芥⼦, ⿊武者 他, 1996, 1997, 1999, 2000.]
– 意味ベクトルの次元は266種類の特徴単語に対応,
基本単語約2万語については専⾨家が特徴単語を付与
– 課題:単語の意味の分散表現としての解像度
» テキストにおける単語の出現順を考慮していない
» 単語の意味ベクトルはビットベクトル
2
- 8. DEIM 2016
提案⼿法-基本単語の意味ベクトル-
• 意味ベクトル
– 階層的に266種類の概念分類を特徴単語として選択
– 約2万語の基本単語に対して,各特徴単語との意味的・連想的関係を266次元の
ベクトルで表現(基本単語が特徴単語と関係ある場合は1,関係ない場合は0)
8
特徴単語
{⼈間,悲しい,芸術,科学,興奮,…}
基本単語
パイロット:(1,0,0,1,1,…)
例
• ブートストラップ学習
– 仮説1: ⽂書の意味ベクトル
• ⼀定数以上の基本単語が含まれていれば,その基本単語の意味ベクトルの
加重和によって,適切な⽂脈情報が表現可能
– 仮説2: 単語の意味ベクトル
• 単語が含まれている⽂書の意味ベクトルの加重和によって,適切な⽂脈情報を獲得
「パイロット」は,人間,科学,興奮
などの文脈で出現することを表現
- 10. DEIM 2016
Twitterからの⽇本語評判情報抽出の
実験-⼿順-
• ⽬的:
– 商品企画や品質サポートにとって有益な個⼈の意⾒を
Twitterから抽出
• 対象:
– 2種類のスマートフォン製品ブランド(製品A, 製品B)
• ツイートへのラベル付与:
– ポジティブ:対象の製品ブランドに対して,
ポジティブな意⾒を発信しているツイート
– ネガティブ:対象の製品ブランドに対して,
ネガティブな意⾒を発信しているツイート
– ニュートラル:対象の製品ブランドに対して,
個⼈の意⾒を発信しているが,ポジティブでも
ネガティブでもないツイート
– 無関係:対象の製品ブランドに対しての
個⼈の意⾒を発信していないツイート
10
,
④
SVM)
⑤
- 12. DEIM 2016
実験⽅法
1) ベースライン(BoW)の評価実験
– 訓練セットとテストセット両⽅の語彙がBoWの次元
– 各ツイートから抽出された語彙の頻度がBoWの値
– 訓練セットのBoWに対して
4分割交差検定とグリッドサーチにより,SVMのカーネル関数と
ハイパーパラメータの値を決定
– SVMの分類器とテストセットのBoWを⽤いて評価
2) パラグラフベクトル(PVEC)の評価実験
– 最初にラベル無しツイートの単語ベクトル学習
– 上記単語ベクトルを初期値として,訓練セットのPVECを学習
– 最後にテストセットのPVECを学習(この時の単語ベクトルは凍結)
– 訓練セットのPVECに対して
4分割交差検定とグリッドサーチにより,SVMのカーネル関数と
ハイパーパラメータの値を決定
– SVMの分類器とテストセットのPVECを⽤いて評価 12
- 13. DEIM 2016
実験⽅法-提案⼿法-
3) 提案⼿法の評価実験
– PVECの評価実験に追加して,
– ラベル無しツイート中に含まれる基本単語を特徴単語に展開,
単語ベクトルをPV-DBOWで学習
– 訓練セット,テストセットを順に基本単語を特徴単語に展開し,
上記単語ベクトルを初期値として,PV-DBOWで学習
– 訓練セットのPVEC(PV-DMとPV-DBOW)と特徴単語展開を⾏って
作成したPV-DBOWを結合した特徴表現に対して,
4分割交差検定とグリッドサーチにより,SVMのカーネル関数と
ハイパーパラメータの値を決定
– SVMの分類器とテストセットの特徴表現(パラグラフベクトルの
PV-DM,PV-DBOWと提案⼿法のPV-DBOWを結合)を⽤いて評価
13
- 14. DEIM 2016
評価結果
14
4. A
BoW 57.5% 58.6% 73.9% 78.1%
PVEC 62.4% 62.3% 78.9% 80.1%
63.4% 64.7% 79.6% 81.0%
5. B
BoW 61.8% 65.1% 79.9% 80.1%
PVEC 64.7% 65.2% 81.7% 82.7%
66.3% 67.5% 82.9% 84.5%
製品Aのベンチマーク:
4,814ツイート
提案⼿法は,
・3クラス分類:2.4%(6.1%)
・2クラス分類:0.9%(2.9%)
PVEC(BoW)の精度を上回った.
製品Bのベンチマーク:
11,932ツイート
提案⼿法は,
・3クラス分類:2.3%(2.4%)
・2クラス分類:1.8%(4.4%)
PVEC(BoW)の精度を上回った.
- 17. DEIM 2016
考察
-提案⼿法の成功例,失敗例-
• 提案⼿法により分類が正解に変わったツイート数,不正解に変わったツイート数
17
不正解→正解 正解→不正解
ポジティブ 103 60
ネガティブ 54 54
ニュートラル 106 63
• 提案⼿法により分類が不正解から正解に変わったツイート例
○Positive→Negative
最悪 製品B 防⽔ だ から ⽔ に つけ たら あら ⼤変 画⾯ のなか に ⽔ が
【勢⼒・程度 劣悪 否定的 多数・多量 醜悪 特殊・希有 困難 ⽔棲⽣物 海洋 資源 素材・
材料 液体 寒冷 無⾊・透明 様⼦・様態 勢⼒・程度 価値・質 因果 否定的 困難 誤謬
通信 マスメディア ⾊彩 平⾯ 映像・画像 電⼦⼯学 コンピュータ ⽔棲⽣物 海洋 資源
素材・材料 液体 寒冷 無⾊・透明】
- 18. DEIM 2016
まとめ
• Twitterからの⽇本語評判情報抽出システムを提案
– パラグラフベクトルはベースライン(BoW)に対して,
極性判定の精度が平均2.3%向上
– 意味ベクトル辞書を⽤いることにより,パラグラフベクトルに対して,
さらに極性判定の精度が平均2.3%向上
• Twitterの⽇本語極性判定ベンチマーク作成
– 英語ではTwitterを⽤いたシェアードタスク開催,
共通ベンチマークも公開されており,
State-of-the-Artの競争激化,NLP応⽤が急速に進展
– ⽇本語の極性判定共通ベンチマーク,シェアードタスクの必要性
18