Contenu connexe Similaire à テキストからのSNSユーザ位置推定手法と活用事例紹介 (12) テキストからのSNSユーザ位置推定手法と活用事例紹介18. /39
調査結果(エリアごとの単語ランキング)
18
tweet人数 割合 単語
122 19.7% crossing
84 13.5% night
tweet人数 割合 単語
16 19.7% anime
10 13.5% superpotato
10 10.8% maidcafe
tweet人数 割合 単語
30 12.0% night
22 8.8% gyoen
- - -
14 5.6% robotrestaurant
渋谷 (来訪者:620人) 秋葉原 (来訪者:93人)
新宿 (来訪者:249人)
スクランブル交差点
レトロゲーム店, メイドカフェ
27. /3927
2. 分類問題として学習・推定を行う
性別: 男,女の2値分類
年代: 10代,20代,30代,40代の4クラス分類
職業: 「会社員」「それ以外」の2値分類,
「専業主婦」「それ以外」の2値分類…を繰り返す
位置: 47都道府県の47クラス分類,メッシュ単位で分類
次スライド以降ではこの中から位置推定に着目し,
基本的な論文を引用しながら具体的な手順について述べます
属性・位置(居住地・現在地)推定共通の
基本的流れ[機械学習ベース]
属性のクラス分割の一例
28. [Wing
&
Baldridge,
ACL
2011]
Simple
supervised
document
geoloca?on
with
geodesic
grids
28
29. /3929
✔緯度経度の間隔 (0.1 10 )
を開発データで適用
概要
地球の緯度経度で地域を分割し,位置情報付きツイートで
学習を行い,世界の英語使用者の居住地予測を行った研究
✔セルの中心点をユーザの位置
として推定
✔Bag of Wordsを素性に利用