SlideShare une entreprise Scribd logo
1  sur  13
LSTMで話題分類してみた
MLCT#3 LT
自己紹介
じょんすみす(ひらがな) これ→
@__john_smith__
どこにでもいる普通のアル中
願望
北海道帰りたい
はじめに
本日は無事失敗談となりました
RNNとLSTM
• 釈迦に説法なので省略
• 知らない方は←の本がオススメ
• お絵描きが面倒なので
• 今日は使ってみた結果が主題です
簡単に説明すると
• 対シーケンシャル(可変長)のデータ
• 中間層を使い回す
• LSTMではメモリユニットで
勾配消失しないように
Recurrent Neural Network Long Short Term Memory
http://www.amazon.co.jp/dp/4061529021/
RNNこれくしょん
• ドワンゴ人工知能研究所
• せっかくなので使ってみよう
• そんなに気にならないけど
日本語を対象にするなら
• どうせ入力はword2vecで(ry
• 他にもライブラリはある
• CURRENNTがいいらしい
• ただしGPU必須
• CNNのCaffeのような
デファクトスタンダードはない?
https://github.com/mattya/RNN-colle/
対象データ
• 凛ちゃんデータセット(自称)
• 2chから星空凛、渋谷凛、遠坂凛、松岡凛のスレ取得
• 終了したスレ2本 x 4人なので約8000件
• ネットスラングとAAの塊
• SVMでおよそ68%程度の正解率
そこにあったツラミ
• ひたすら Segmentation fault (core dumped)
• 実はそろっていないドキュメント
• 付属のデータ以外で動かす方法
• バイナリデータ読み込ませてる。。フォーマットは?
• 設定ファイルの項目も結局かなりソース読んだ
• Jsonの設定で超パラメータ設定するので探索しづらい
• 安西先生、GPUが欲しいです
• あ、私Pythonはわかりません^^
なんとか動いたけど
• 形態素解析 + 分散表現
• Error Rate : 0.469708
※学習してるっぽいが、エラーレートは0.60 – 0.45の範囲で描画している
なんとか動いたけど
• 形態素解析 + 分散表現
• Error Rate : 0.469708
※範囲を0-1にした場合
なんとか動いたけど
• 文字区切り + 分散表現
• Error Rate : 0.482933
※学習してるっぽいが、エラーレートは0.60 – 0.45の範囲で描画している
なんとか動いたけど
• 形態素解析 + 分散表現
• Error Rate : 0.469708
※範囲を0-1にした場合
なんとか動いたけど
• ひどい。。(ちなみにパラメータを変えるともっと悪くなる)
• epoch数増やすと下がっていくので学習はしてるっぽい?
• パラメータの設定でとかってレベルじゃなさそう
• 入力が間違ってた?
• MLPの層で求められてる入力と一致してるか自信がない
これは文章Aです
これは別な長さの文章Bです
ここの扱いが間違ってた?
結論
• ライブラリ内部の挙動まで確認できないなら
フルスクラッチで実装した方が早いかも?
• RNNこれくしょん、プルリク送れそうなとこ結構ありますよ
• 世の中に出たてのOSSのいいところ
• ガチ勢の方、アドバイスください
• 動かし方
• http://john-smith.hateblo.jp/entry/2015/05/02/224928

Contenu connexe

Plus de __john_smith__

Amazon SageMakerでゼロからはじめる機械学習入門
Amazon SageMakerでゼロからはじめる機械学習入門Amazon SageMakerでゼロからはじめる機械学習入門
Amazon SageMakerでゼロからはじめる機械学習入門__john_smith__
 
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ugAlteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug__john_smith__
 
Alteryx Inspire2017 新製品&新機能紹介
Alteryx Inspire2017 新製品&新機能紹介Alteryx Inspire2017 新製品&新機能紹介
Alteryx Inspire2017 新製品&新機能紹介__john_smith__
 
How to create Yarn Application #cmdevio2017
How to create Yarn Application #cmdevio2017How to create Yarn Application #cmdevio2017
How to create Yarn Application #cmdevio2017__john_smith__
 
Alteryxでkaggleに挑戦する #alteryx #alteryx_ug
Alteryxでkaggleに挑戦する #alteryx #alteryx_ugAlteryxでkaggleに挑戦する #alteryx #alteryx_ug
Alteryxでkaggleに挑戦する #alteryx #alteryx_ug__john_smith__
 
初心者向けに機械学習のハンズオンセミナーをしてわかったこと
初心者向けに機械学習のハンズオンセミナーをしてわかったこと初心者向けに機械学習のハンズオンセミナーをしてわかったこと
初心者向けに機械学習のハンズオンセミナーをしてわかったこと__john_smith__
 
この素晴らしいSQLに祝福を!
この素晴らしいSQLに祝福を!この素晴らしいSQLに祝福を!
この素晴らしいSQLに祝福を!__john_smith__
 
5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習__john_smith__
 
初心者向け「凛ちゃん」
初心者向け「凛ちゃん」初心者向け「凛ちゃん」
初心者向け「凛ちゃん」__john_smith__
 
SparkRをつかってみた(Japan.R)
SparkRをつかってみた(Japan.R)SparkRをつかってみた(Japan.R)
SparkRをつかってみた(Japan.R)__john_smith__
 

Plus de __john_smith__ (13)

Amazon SageMakerでゼロからはじめる機械学習入門
Amazon SageMakerでゼロからはじめる機械学習入門Amazon SageMakerでゼロからはじめる機械学習入門
Amazon SageMakerでゼロからはじめる機械学習入門
 
Alteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ugAlteryx UG3 LT #alteryx_ug
Alteryx UG3 LT #alteryx_ug
 
Alteryx Inspire2017 新製品&新機能紹介
Alteryx Inspire2017 新製品&新機能紹介Alteryx Inspire2017 新製品&新機能紹介
Alteryx Inspire2017 新製品&新機能紹介
 
How to create Yarn Application #cmdevio2017
How to create Yarn Application #cmdevio2017How to create Yarn Application #cmdevio2017
How to create Yarn Application #cmdevio2017
 
Alteryxでkaggleに挑戦する #alteryx #alteryx_ug
Alteryxでkaggleに挑戦する #alteryx #alteryx_ugAlteryxでkaggleに挑戦する #alteryx #alteryx_ug
Alteryxでkaggleに挑戦する #alteryx #alteryx_ug
 
初心者向けに機械学習のハンズオンセミナーをしてわかったこと
初心者向けに機械学習のハンズオンセミナーをしてわかったこと初心者向けに機械学習のハンズオンセミナーをしてわかったこと
初心者向けに機械学習のハンズオンセミナーをしてわかったこと
 
この素晴らしいSQLに祝福を!
この素晴らしいSQLに祝福を!この素晴らしいSQLに祝福を!
この素晴らしいSQLに祝福を!
 
Javado2
Javado2Javado2
Javado2
 
Jubatus hack2
Jubatus hack2Jubatus hack2
Jubatus hack2
 
5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習5分でわかる 怖くない機械学習
5分でわかる 怖くない機械学習
 
初心者向け「凛ちゃん」
初心者向け「凛ちゃん」初心者向け「凛ちゃん」
初心者向け「凛ちゃん」
 
SparkRをつかってみた(Japan.R)
SparkRをつかってみた(Japan.R)SparkRをつかってみた(Japan.R)
SparkRをつかってみた(Japan.R)
 
Jubatus Hackathon
Jubatus HackathonJubatus Hackathon
Jubatus Hackathon
 

LSTMで話題分類