SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
流行りの分散表現を用いた文書分類について
2018/10/19
Netadashi Meetup #7 in みなとみらい
Mr_Sakaue(SKUE)
1
● 阪上晃幸(@Mr_Sakaue)
● データアナリスト@渋谷のベンチャー企業
● 経歴
2012/2:インターン@渋谷のベンチャー企業
2012/3:一橋大学大学院経済学研究科 修士課程修了
2012/4〜:渋谷のベンチャー企業入社
● 趣味
料理、ブログ記事の作成
『かものはしの分析ブログ』で検索!
自己紹介
2
● 対象リスナー
・今あるデータを活用したい方々(エンジニア /データサイエンティスト)
● 話したいこと
・近年流行っている分散表現を用いた分析事例の紹介
● 話さないこと
・自社での活用事例
・最先端技術などの紹介
・細かい技術の詳細(参考文献あり。または懇親会や質問などで)
話したいこと/話さないこと
3
公開するのでメモは
不要
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
4
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
5
● one-hot表現
one-hot(ワン・ホット)は1つだけ1をとり、他は0であるような数列のこと。
単語をそのようなものにしたものをone-hot表現と呼んでいる。
分散表現入門
ある世界に存在する単語
イクラ
ウニ
マグロ
鯖
鮭
鮭 イクラ マグロ ウニ 鯖
0 1 0 0 0
イクラのone-hot表現
鯖のone-hot表現
鮭 イクラ マグロ ウニ 鯖
0 0 0 0 1
6
● one-hot表現
文をone-hot表現で扱えばBag-of-words表現になる。文書分類の特徴量としても使われ
る。
分散表現入門
ある世界に存在する 3つの文書
あのイクラの味が忘れられない
マグロよりはウニが食べたい
鮭の缶詰ばかり食べる
イクラ マグロ ウニ 缶詰 鮭 味
文書1 1 0 0 0 0 1
文書2 0 1 1 0 0 0
文書3 0 0 0 1 1 0
7
● one-hot表現
未知語を扱うことができなかったり次元数が膨大となるという欠点がある。
分散表現入門
ある世界に存在する 3つの文書
あのイクラや牡蠣や…(30万語)の
味が忘れられない
マグロよりはウニが食べたい
鮭の缶詰ばかり食べる
イクラ マグロ … 牡蠣 鮭 味
文書1 1 0 … 1 0 1
文書2 0 1 … 0 0 0
文書3 0 0 … 0 1 0
3行30万列の行列
8
● 分散表現とは
単語を高次元の実数ベクトルで表現する技術。一つの単語を10~1000次元ほどのベクト
ルで表現する。大量のテキストをもとに、主にニューラルネットワークを用いて計算され
る。(Wikipediaの全データなど)
自然言語処理における特徴量としても用いられている。
分散表現入門
ウナギ 0.01 0.03 0.01 … 0.04 0.03
アナゴ 0.02 0.05 0.01 … 0.05 0.01
タコ 0.01 0.01 0.12 … 0.01 0.09
10~1000次元
9
● Word2Vec(ワードトゥーベック)
2013年に当時GoogleにいたMikolovらによって考案された、単語の分散表現を得るた
めのアルゴリズム。
ある単語の単語ベクトルを入力として、前後の単語の単語ベクトルを予測することを目的
としている。(うまく予測できるように最適化をしている。)
単語ベクトルが類似している単語は同じコンテキストでの出現率が高くなるように計算さ
れる。
分散表現入門
10
● Word2Vec…3次元に圧縮するケース
分散表現入門
俺 の イタリアン 行っ た
1 0 0 0 0
「俺」のone-hot表現 「イタリアン」のone-hot表現
俺 の イタリアン 行っ た
0 0 1 0 0
0.1 0.9 0.1 0.01 0.01
俺 の イタリアン 行っ た
0.01 0.5 0.02 0.001 0.002
ハズレ アタリ ハズレ ハズレ ハズレ
中間層
入力層
出力層
確率
ラベル
周辺の単語、
「俺」
「イタリアン」
から
「の」を当てにいくタスク。 確率(0~1)にするための関数を適用
ここで得られる重みづけが分
散表現になる
11
● Word2Vec
先ほどの図のように入力層、中間層、出力層からなる、2層のニューラルネットワークを
元に計算され、各単語が3次元のベクトルで表現されるようになる。
分散表現入門
俺 0.1 0.2 0.1
の 0.2 0.2 0.1
イタリアン 0.3 0.1 0.2
行っ 0.5 0.8 0.3
た 0.01 0.3 0.9
※ここでの値は適当に入れている
12
● Word2Vec
もとめた分散表現自体を足し算や引き算することもできる。
非常に有名なものとして「”queen” - “woman” + “man” = “king”」があり、意味の四則演
算のようなものが実現できているものもある。
私が過去に試したものとしては、
「”ディズニーランド” - ”夢” = ”舞浜” / ”ベイシティバス”」
などがある。(※Wikipediaコーパスデータを用いた)
分散表現入門
13
● Word2Vec
コンテクストの似た単語を分散表現の類似度から求めることができる。
分散表現入門
14
↑Wikipediaのクラシック楽曲情報 3000件から推定 ↑某グルメ系口コミサイトの蒙古タンメン中本の口コミ情報 4000
件から推定
● fastText(ファストテキスト)
2016年にFacebookにいたMikolovらによって考案されたアルゴリズム。
単語ではなく、n-gramを用いているので、未知の単語に強いとされている。
単語の「表記」が類似した単語は同様の意味をもつというモデルとなっている。
分散表現入門
3-gramでの「お疲れ様です」
・お疲
・お疲れ
・疲れ様
・様です
・です
15
● 分散表現の用途
・単語の分散表現をニューラルネットワークやSVMや
 一般的な機械学習の特徴量として扱う。
 →単語や文書を固定長のベクトルに変換できると適応領域が増える。
・単語のクラスタリングに使う(コンテクストの近い単語をまとめる)
分散表現入門
16
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
17
● 活用事例1
・リクルートテクノロジーズ
 ・ユーザーのアクションログデータを入力して、分散表現を手に入れ、
  その分散表現を元に計算したアイテム間の類似度などを計算し、
  アイテムをレコメンドするというシステムで適用している。
 ・ユーザーの行動ログの分散表現から、その分散表現を足し合わせる
  ことでユーザーの志向性を捉えるために使っている。
分散表現の活用事例
18
● 活用事例2
・サイバーエージェント
 ・検索連動型広告のテキストを自動生成をする際に、Word2Vecを用いて
  類義語による単語の入替をする研究を発表している。
分散表現の活用事例
赤枠がGoogle広告の検索連動型広告。
表現次第でクリック率が違ってくるが、文言を考える
のは骨が折れる作業。
19
● 活用事例3(公式なプレスは出ていない)
・メルカリ/Gunosy
 ・2017年のテキストアナリティクスシンポジウムでの講演内容のもの。
  ・メルカリ
   ・通報商品の分類自動化などのために様々なテキスト情報をもとに
    分散表現を得て予測できるようにしている。
  ・Gunosy
   ・ニュース記事の CTR予測などで分散表現を使ったモデルが
    一番性能が出ているという発言があった。
  →Word2Vecなどでもとめた分散表現が二値分類の際の特徴量として使われるケースが出てきた。
分散表現の活用事例
20
● 自然言語の資源問題
先ほどあげたようなデータ規模が膨大な企業の場合は分散表現を得るための学習を十
分にできるが、そうでない企業はなかなか取り組むことができない。
学習済みの分散表現の紹介
21
● ファインチューニング
Wikipediaやニュース記事のテキストなどの一般的なテキストデータをもとに、学習した
ネットワークのパラメータなどを、特定の目的(何かの分類とか)のためのデータで再度
学習させ、特定の目的における精度を高めること。
言語資源の乏しい企業はファインチューニング頑張るマンになれば幸せになれる?
学習済みの分散表現の紹介
22
● 学習済み分散表現
・各研究機関や企業などが公開している学習済みの分散表現。
 ・大規模な言語資源でWord2Vecを計算しようとすると何日も要するので、
  提供してくださる機関には感謝しかない。
 ・だいたいGensimで読み込める。
  ・KeyedVectors形式…再学習ができない
  ・full model形式…再学習ができる
学習済みの分散表現の紹介
23
● 学習済み分散表現
・白ヤギコーポレーションのモデル:full model形式(Gensim)
 →Wikipedia日本語版をコーパス
・東北大学 乾・岡崎研究室のモデル:KeyedVectors形式(Gensim)
 →Wikipedia日本語版をコーパス(エンティティーなどの分散表現も推定している)
・Facebookの学習済みFastTextモデル:KeyedVectors形式(Gensim)
 →Wikipediaなどをコーパス
・NWJC から取得した単語の分散表現データ (nwjc2vec):KeyedVectors形式(Gensim)
 →国語研日本語ウェブコーパス
・NNLM embedding trained on Google News:TensorFlow
 →Googleニュースをコーパス
公開されているものはfull model形式のものが少ない。
学習済みの分散表現の紹介
24
● 1章:分散表現入門
● 2章:分散表現の活用事例、学習済みの分散表現の紹介
● 3章:実践例
25
● やりたいこと
不動産物件の設備情報のテキストから、
その物件がデザイナーズマンションかどうか当てたい。
実践例
26
● データ
・某不動産物件情報サイトをWebスクレイピング
 ・渋谷区のデザイナーズマンションに関する物件の設備情報のテキスト
 ・渋谷区の普通のマンションに関する物件の設備情報のテキスト
 →合わせて1800件程度
実践例
27
実践例
28
テキストの一例
バス トイレ 別 バルコニー エアコン フローリ
ング 浴室 乾燥機 オートロック 室内 洗濯
置 システムキッチン エレベーター 宅配ボッ
クス 入居 可 最上階 バイク 置場 CS BS
テキストの文字数ヒストグラム
● 手法など
・Scikit-learnのExtremely Randomized Treesを用いる
・特徴量は以下の3つ
 ・設備情報に含まれる単語ごとの分散表現を足し合わせたもの
 ・設備情報に含まれる単語ごとの分散表現の平均値をとったもの
 ・設備情報に含まれる単語ごとの分散表現をTF-IDFで重み付けしたもの
・評価指標はAUC(うまく分類できているかの指標で0.5~1の間の値)
・5分割クロスバリデーションの平均スコアを比較する
実践例
29
● 以下の分散表現でデザイナーズマンション分類器の学習を行う。
・1800件のテキストで分散表現を学習したもの
・各種、学習済み分散表現をそのまま使ったもの
・再学習可能なものに関しては1800件のテキストで再学習したもの
実践例
30
実践例
31
実践例
物件情報 白ヤギ 東北大学 FastText 梵天
分散表現(平均) 0.789 0.820 0.890 0.936 0.920
分散表現(合計) 0.783 0.821 0.865 0.897 0.875
分散表現(TF-IDF) 0.779 0.829 0.903 0.945 0.926
5分割クロスバリデーションの AUCの平均値
※「物件情報」は物件情報のテキストだけで学習したもの
※※「白ヤギ」は物件情報で再学習したもの
※※※それ以外は学習済み分散表現をそのまま使っています。
● 結果
1800件程度のテキストで作成した分散表現よりも、大規模な言語資源で学習された学
習済み分散表現の方が、任意の物件がデザイナーズマンションかどうかを当てるタスク
において性能が高いことがわかった。
タスクによっては学習済み分散表現を使うことで、うまくこなせるのかもしれない。
別件で、蒙古タンメン中本の口コミ評価点数を予測しようとして、全く精度が出なかったこ
ともあるので、タスクによりけりな印象がある。
実践例
32
● 分散表現の基礎をお話した。
● 企業での分散表現のビジネスにおける実活用例を紹介した。
● 学習済み分散表現を用いた分類問題の実践例を紹介した。
まとめ
33
● 堅山 耀太郎(2017)「Word Embeddingモデル再訪」
● 斎藤 康毅(2018)『ゼロから作るDeep Learning ❷――自然言語処理編』
● 新納 浩幸(2017)『Chainer v2による実践深層学習』
● @Hironsan(2017)「なぜ自然言語処理にとって単語の分散表現は重要なのか?」
● リクルートテクノロジーズ(2015)「リクルート式 自然言語処理技術の適応事例紹介」
● 馬場 et al.(2015)「検索連動型広告におけるテキスト自動生成とその評価指標の検討」
● ナード戦隊データマン(2018)「Word Embeddingだけで文書分類する」
● Gensim「Why use KeyedVectors instead of a full model?」
参考文献
34

Contenu connexe

Tendances

トピックモデルの基礎と応用
トピックモデルの基礎と応用トピックモデルの基礎と応用
トピックモデルの基礎と応用Tomonari Masada
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習Seiichi Uchida
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Modelscvpaper. challenge
 
情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜Yuya Unno
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Yuya Unno
 
トピックモデル
トピックモデルトピックモデル
トピックモデル貴之 八木
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理Preferred Networks
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法y-uti
 
Triplet Loss 徹底解説
Triplet Loss 徹底解説Triplet Loss 徹底解説
Triplet Loss 徹底解説tancoro
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度Seiichi Uchida
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE広樹 本間
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習cvpaper. challenge
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Satoshi Kato
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)Deep Learning JP
 
研究法(Claimとは)
研究法(Claimとは)研究法(Claimとは)
研究法(Claimとは)Jun Rekimoto
 
Transformerを雰囲気で理解する
Transformerを雰囲気で理解するTransformerを雰囲気で理解する
Transformerを雰囲気で理解するAtsukiYamaguchi1
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門Kawamoto_Kazuhiko
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper. challenge
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAGIRobots
 

Tendances (20)

LDA入門
LDA入門LDA入門
LDA入門
 
トピックモデルの基礎と応用
トピックモデルの基礎と応用トピックモデルの基礎と応用
トピックモデルの基礎と応用
 
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
 
【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models【メタサーベイ】基盤モデル / Foundation Models
【メタサーベイ】基盤モデル / Foundation Models
 
情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜情報抽出入門 〜非構造化データを構造化させる技術〜
情報抽出入門 〜非構造化データを構造化させる技術〜
 
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
Jubatusのリアルタイム分散レコメンデーション@TokyoNLP#9
 
トピックモデル
トピックモデルトピックモデル
トピックモデル
 
大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理大規模データ時代に求められる自然言語処理
大規模データ時代に求められる自然言語処理
 
潜在ディリクレ配分法
潜在ディリクレ配分法潜在ディリクレ配分法
潜在ディリクレ配分法
 
Triplet Loss 徹底解説
Triplet Loss 徹底解説Triplet Loss 徹底解説
Triplet Loss 徹底解説
 
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE
 
【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習【メタサーベイ】数式ドリブン教師あり学習
【メタサーベイ】数式ドリブン教師あり学習
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
 
研究法(Claimとは)
研究法(Claimとは)研究法(Claimとは)
研究法(Claimとは)
 
Transformerを雰囲気で理解する
Transformerを雰囲気で理解するTransformerを雰囲気で理解する
Transformerを雰囲気で理解する
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
cvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tipscvpaper.challenge 研究効率化 Tips
cvpaper.challenge 研究効率化 Tips
 
Attentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門までAttentionの基礎からTransformerの入門まで
Attentionの基礎からTransformerの入門まで
 

Similaire à 流行りの分散表現を用いた文書分類について Netadashi Meetup 7

深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについてMasahiro Suzuki
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]takashi ono
 
Interop2017
Interop2017Interop2017
Interop2017tak9029
 
【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼン【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼンMasayuki Shindo
 
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃんYasushi Hara
 
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」Takashi Uemura
 
エンジニアのキャリアを考える
エンジニアのキャリアを考えるエンジニアのキャリアを考える
エンジニアのキャリアを考えるMKT International Inc.
 
座談会資料 事前配布 20170225
座談会資料 事前配布 20170225座談会資料 事前配布 20170225
座談会資料 事前配布 20170225知礼 八子
 
Monadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive ProgrammingへのアプローチMonadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive ProgrammingへのアプローチTomoharu ASAMI
 
Claudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えますClaudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えますAkira Hatsune
 
Engineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるためにEngineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるためにAkira Inoue
 
明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方Jo Hattori
 
DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)masashi takehara
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010Hiroshi Tokumaru
 
セレンディピティと機械学習
セレンディピティと機械学習セレンディピティと機械学習
セレンディピティと機械学習Kei Tateno
 
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長Keiko Inagaki
 
201207 ssmjp
201207 ssmjp201207 ssmjp
201207 ssmjpth0x0472
 

Similaire à 流行りの分散表現を用いた文書分類について Netadashi Meetup 7 (20)

深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて深層生成モデルと世界モデル,深層生成モデルライブラリPixyzについて
深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
WordPress名古屋コミュニティの進化[WordBench Nagoya 2017年3月勉強会]
 
Interop2017
Interop2017Interop2017
Interop2017
 
NLP2017 NMT Tutorial
NLP2017 NMT TutorialNLP2017 NMT Tutorial
NLP2017 NMT Tutorial
 
【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼン【ビジプラ】pptとプレゼン
【ビジプラ】pptとプレゼン
 
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
 
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
20121124 学生セミナー「基礎からわかる! IT業界とプログラミング」
 
エンジニアのキャリアを考える
エンジニアのキャリアを考えるエンジニアのキャリアを考える
エンジニアのキャリアを考える
 
座談会資料 事前配布 20170225
座談会資料 事前配布 20170225座談会資料 事前配布 20170225
座談会資料 事前配布 20170225
 
Monadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive ProgrammingへのアプローチMonadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
Monadic Programmingのススメ - Functional Reactive Programmingへのアプローチ
 
Claudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えますClaudia Enqueteの作り方教えます
Claudia Enqueteの作り方教えます
 
Engineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるためにEngineers can change the world ~ "世界" で活躍するエンジニアになるために
Engineers can change the world ~ "世界" で活躍するエンジニアになるために
 
明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方明日から使えるビジネス文章の書き方
明日から使えるビジネス文章の書き方
 
DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)DevLove2012「勝手にワークシフト」(宣伝用)
DevLove2012「勝手にワークシフト」(宣伝用)
 
今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010今日こそわかる、安全なWebアプリの作り方2010
今日こそわかる、安全なWebアプリの作り方2010
 
DL-D_ver1.pdf
DL-D_ver1.pdfDL-D_ver1.pdf
DL-D_ver1.pdf
 
セレンディピティと機械学習
セレンディピティと機械学習セレンディピティと機械学習
セレンディピティと機械学習
 
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長
 
201207 ssmjp
201207 ssmjp201207 ssmjp
201207 ssmjp
 

Plus de Teruyuki Sakaue

実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022Teruyuki Sakaue
 
警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!Teruyuki Sakaue
 
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組みTeruyuki Sakaue
 
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習Teruyuki Sakaue
 
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9Teruyuki Sakaue
 
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてデータ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてTeruyuki Sakaue
 
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみるTeruyuki Sakaue
 
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3Teruyuki Sakaue
 
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理Teruyuki Sakaue
 
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2Teruyuki Sakaue
 
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16Teruyuki Sakaue
 
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選Teruyuki Sakaue
 
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1Teruyuki Sakaue
 
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックMarketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックTeruyuki Sakaue
 
機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測Teruyuki Sakaue
 

Plus de Teruyuki Sakaue (15)

実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
 
警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!
 
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
 
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習
 
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9
 
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについてデータ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
 
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
 
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3
 
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
 
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
 
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
 
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
 
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
 
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノックMarketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノック
 
機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測機械学習による積極的失業〜オウンドメディアの訪問予測
機械学習による積極的失業〜オウンドメディアの訪問予測
 

流行りの分散表現を用いた文書分類について Netadashi Meetup 7