Soumettre la recherche
Mettre en ligne
機械学習による積極的失業〜オウンドメディアの訪問予測
•
4 j'aime
•
6,769 vues
Teruyuki Sakaue
Suivre
第54回 Tokyo Web Mining 懇親会LT
Lire moins
Lire la suite
Données & analyses
Affichage du diaporama
Signaler
Partager
Affichage du diaporama
Signaler
Partager
1 sur 24
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノック
Teruyuki Sakaue
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
Teruyuki Sakaue
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
Teruyuki Sakaue
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
Teruyuki Sakaue
Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04
Masakazu Sano
Tokyo Webmining Talk1
Tokyo Webmining Talk1
Kenta Oono
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
Koichi Hamada
Recommandé
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
Marketing×Python/Rで頑張れる事例16本ノック
Marketing×Python/Rで頑張れる事例16本ノック
Teruyuki Sakaue
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
[第6回]データ分析ランチセッション - Camphrでモダンな自然言語処理
Teruyuki Sakaue
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
[第11回]データ分析ランチセッション - モダンな機械学習データパイプラインKedroを触ってみる
Teruyuki Sakaue
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
HRビジネスにおけるデータサイエンスの適用 @ BIT VALLEY -INSIDE- Vol.1
Teruyuki Sakaue
Sano tokyowebmining 201625_v04
Sano tokyowebmining 201625_v04
Masakazu Sano
Tokyo Webmining Talk1
Tokyo Webmining Talk1
Kenta Oono
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
Koichi Hamada
イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化
Osaka University
VAE-type Deep Generative Models
VAE-type Deep Generative Models
Kenta Oono
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
Shota Yasui
20161029 TVI Tokyowebmining Seminar for Share
20161029 TVI Tokyowebmining Seminar for Share
Yasushi Gunya
DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦
Koichi Hamada
アンカンファレンス @ 第50回 データマイニング+WEB @東京
アンカンファレンス @ 第50回 データマイニング+WEB @東京
Izumi Akiyama
レコメンド研究のあれこれ
レコメンド研究のあれこれ
Masahiro Sato
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
Takashi Kaneda
投資会社から見た人工知能(Ai)の事業化トレンド
投資会社から見た人工知能(Ai)の事業化トレンド
Osaka University
人工知能Xファッション最前線
人工知能Xファッション最前線
Kazuki Baba
PL/CUDA - GPU Accelerated In-Database Analytics
PL/CUDA - GPU Accelerated In-Database Analytics
Kohei KaiGai
動的最適化の今までとこれから
動的最適化の今までとこれから
Kazuki Baba
ドローン農業最前線
ドローン農業最前線
tetsuya furukawa
20170310_InDatabaseAnalytics_#1
20170310_InDatabaseAnalytics_#1
Kohei KaiGai
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
Koichi Hamada
意味表現の素性への構造主義的アプローチ入門
意味表現の素性への構造主義的アプローチ入門
kaikunir
Introduction to behavior based recommendation system
Introduction to behavior based recommendation system
Kimikazu Kato
深層学習時代の自然言語処理
深層学習時代の自然言語処理
Yuya Unno
ディープラーニング徹底活用 -画像認識編-
ディープラーニング徹底活用 -画像認識編-
Hideki
NIPS 2016 Overview and Deep Learning Topics
NIPS 2016 Overview and Deep Learning Topics
Koichi Hamada
「SEOのインハウス化(社内運用)のすすめ」 ~マーケティング戦略を素早くWebサイトへ反映する仕組みづくり~
「SEOのインハウス化(社内運用)のすすめ」 ~マーケティング戦略を素早くWebサイトへ反映する仕組みづくり~
IMJ Corporation
Fukuda 20121013
Fukuda 20121013
nextedujimu
Contenu connexe
En vedette
イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化
Osaka University
VAE-type Deep Generative Models
VAE-type Deep Generative Models
Kenta Oono
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
Shota Yasui
20161029 TVI Tokyowebmining Seminar for Share
20161029 TVI Tokyowebmining Seminar for Share
Yasushi Gunya
DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦
Koichi Hamada
アンカンファレンス @ 第50回 データマイニング+WEB @東京
アンカンファレンス @ 第50回 データマイニング+WEB @東京
Izumi Akiyama
レコメンド研究のあれこれ
レコメンド研究のあれこれ
Masahiro Sato
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
Takashi Kaneda
投資会社から見た人工知能(Ai)の事業化トレンド
投資会社から見た人工知能(Ai)の事業化トレンド
Osaka University
人工知能Xファッション最前線
人工知能Xファッション最前線
Kazuki Baba
PL/CUDA - GPU Accelerated In-Database Analytics
PL/CUDA - GPU Accelerated In-Database Analytics
Kohei KaiGai
動的最適化の今までとこれから
動的最適化の今までとこれから
Kazuki Baba
ドローン農業最前線
ドローン農業最前線
tetsuya furukawa
20170310_InDatabaseAnalytics_#1
20170310_InDatabaseAnalytics_#1
Kohei KaiGai
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
Koichi Hamada
意味表現の素性への構造主義的アプローチ入門
意味表現の素性への構造主義的アプローチ入門
kaikunir
Introduction to behavior based recommendation system
Introduction to behavior based recommendation system
Kimikazu Kato
深層学習時代の自然言語処理
深層学習時代の自然言語処理
Yuya Unno
ディープラーニング徹底活用 -画像認識編-
ディープラーニング徹底活用 -画像認識編-
Hideki
NIPS 2016 Overview and Deep Learning Topics
NIPS 2016 Overview and Deep Learning Topics
Koichi Hamada
En vedette
(20)
イノベーション創発に資する人工知能基盤技術の創出と統合化
イノベーション創発に資する人工知能基盤技術の創出と統合化
VAE-type Deep Generative Models
VAE-type Deep Generative Models
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
20161029 TVI Tokyowebmining Seminar for Share
20161029 TVI Tokyowebmining Seminar for Share
DeNAの機械学習・深層学習活用した体験提供の挑戦
DeNAの機械学習・深層学習活用した体験提供の挑戦
アンカンファレンス @ 第50回 データマイニング+WEB @東京
アンカンファレンス @ 第50回 データマイニング+WEB @東京
レコメンド研究のあれこれ
レコメンド研究のあれこれ
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
物体認識 IoT サービスを支える技術 〜クラウドアーキテクチャから組込み深層学習まで〜
投資会社から見た人工知能(Ai)の事業化トレンド
投資会社から見た人工知能(Ai)の事業化トレンド
人工知能Xファッション最前線
人工知能Xファッション最前線
PL/CUDA - GPU Accelerated In-Database Analytics
PL/CUDA - GPU Accelerated In-Database Analytics
動的最適化の今までとこれから
動的最適化の今までとこれから
ドローン農業最前線
ドローン農業最前線
20170310_InDatabaseAnalytics_#1
20170310_InDatabaseAnalytics_#1
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
意味表現の素性への構造主義的アプローチ入門
意味表現の素性への構造主義的アプローチ入門
Introduction to behavior based recommendation system
Introduction to behavior based recommendation system
深層学習時代の自然言語処理
深層学習時代の自然言語処理
ディープラーニング徹底活用 -画像認識編-
ディープラーニング徹底活用 -画像認識編-
NIPS 2016 Overview and Deep Learning Topics
NIPS 2016 Overview and Deep Learning Topics
Similaire à 機械学習による積極的失業〜オウンドメディアの訪問予測
「SEOのインハウス化(社内運用)のすすめ」 ~マーケティング戦略を素早くWebサイトへ反映する仕組みづくり~
「SEOのインハウス化(社内運用)のすすめ」 ~マーケティング戦略を素早くWebサイトへ反映する仕組みづくり~
IMJ Corporation
Fukuda 20121013
Fukuda 20121013
nextedujimu
フリーランスエンジニアを半年間やってみた
フリーランスエンジニアを半年間やってみた
Ohira Yukito
プログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのか
Haruo Sato
企業のウェブ戦略策定
企業のウェブ戦略策定
武 河野
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
The Japan DataScientist Society
スマホSEOって何すればいいの?&質問コーナー
スマホSEOって何すればいいの?&質問コーナー
ナイル株式会社
【Shared】「顧問先の経理と会計を効率化するためのポイント」:freee尾籠
【Shared】「顧問先の経理と会計を効率化するためのポイント」:freee尾籠
freee株式会社
札幌SEO・Webセミナー
札幌SEO・Webセミナー
Webコンサルタント武藤正隆
あなたにぴったりのハウスキーパーを探そう 〜1500円からの家事代行マッチングサービス〜タスカジ ( 和田幸子)
あなたにぴったりのハウスキーパーを探そう 〜1500円からの家事代行マッチングサービス〜タスカジ ( 和田幸子)
一般社団法人シェアリングエコノミー協会
【IMJ】スマートフォンSEO対策セミナー 第1部 (2015.7.8)
【IMJ】スマートフォンSEO対策セミナー 第1部 (2015.7.8)
IMJ Corporation
SEO対策に頼らないコンテンツマーケティング
SEO対策に頼らないコンテンツマーケティング
Fumito Mizuno
小さい会社のWEB対策とSEO対策はブログやソーシャルメディア活用方法
小さい会社のWEB対策とSEO対策はブログやソーシャルメディア活用方法
Webコンサルタント武藤正隆
Public info
Public info
Toshihiro Hirai
Public Info
Public Info
Toshihiro Hirai
今話題のChatGPTでウェブマーケティングを簡単かつ効果的に!
今話題のChatGPTでウェブマーケティングを簡単かつ効果的に!
Noriaki Sugimoto
就職説明会 181215 株式会社mofmof
就職説明会 181215 株式会社mofmof
DIVE INTO CODE Corp.
WCK Sessions Vol.7 / a-blog cms 2.1を活用したWeb制作のワークフロー
WCK Sessions Vol.7 / a-blog cms 2.1を活用したWeb制作のワークフロー
Kazumich YAMAMOTO
Machine Learning 15 minutes! とあるデザイン会社の中の人にとってのA.I.
Machine Learning 15 minutes! とあるデザイン会社の中の人にとってのA.I.
Yohsuke Itoh
140731 シックスアパート様セミナー(配布用)
140731 シックスアパート様セミナー(配布用)
Masaki Suzuki
Similaire à 機械学習による積極的失業〜オウンドメディアの訪問予測
(20)
「SEOのインハウス化(社内運用)のすすめ」 ~マーケティング戦略を素早くWebサイトへ反映する仕組みづくり~
「SEOのインハウス化(社内運用)のすすめ」 ~マーケティング戦略を素早くWebサイトへ反映する仕組みづくり~
Fukuda 20121013
Fukuda 20121013
フリーランスエンジニアを半年間やってみた
フリーランスエンジニアを半年間やってみた
プログラミングを学ぶと何が良いのか
プログラミングを学ぶと何が良いのか
企業のウェブ戦略策定
企業のウェブ戦略策定
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
スマホSEOって何すればいいの?&質問コーナー
スマホSEOって何すればいいの?&質問コーナー
【Shared】「顧問先の経理と会計を効率化するためのポイント」:freee尾籠
【Shared】「顧問先の経理と会計を効率化するためのポイント」:freee尾籠
札幌SEO・Webセミナー
札幌SEO・Webセミナー
あなたにぴったりのハウスキーパーを探そう 〜1500円からの家事代行マッチングサービス〜タスカジ ( 和田幸子)
あなたにぴったりのハウスキーパーを探そう 〜1500円からの家事代行マッチングサービス〜タスカジ ( 和田幸子)
【IMJ】スマートフォンSEO対策セミナー 第1部 (2015.7.8)
【IMJ】スマートフォンSEO対策セミナー 第1部 (2015.7.8)
SEO対策に頼らないコンテンツマーケティング
SEO対策に頼らないコンテンツマーケティング
小さい会社のWEB対策とSEO対策はブログやソーシャルメディア活用方法
小さい会社のWEB対策とSEO対策はブログやソーシャルメディア活用方法
Public info
Public info
Public Info
Public Info
今話題のChatGPTでウェブマーケティングを簡単かつ効果的に!
今話題のChatGPTでウェブマーケティングを簡単かつ効果的に!
就職説明会 181215 株式会社mofmof
就職説明会 181215 株式会社mofmof
WCK Sessions Vol.7 / a-blog cms 2.1を活用したWeb制作のワークフロー
WCK Sessions Vol.7 / a-blog cms 2.1を活用したWeb制作のワークフロー
Machine Learning 15 minutes! とあるデザイン会社の中の人にとってのA.I.
Machine Learning 15 minutes! とあるデザイン会社の中の人にとってのA.I.
140731 シックスアパート様セミナー(配布用)
140731 シックスアパート様セミナー(配布用)
Plus de Teruyuki Sakaue
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
Teruyuki Sakaue
警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!
Teruyuki Sakaue
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
Teruyuki Sakaue
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習
Teruyuki Sakaue
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9
Teruyuki Sakaue
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
Teruyuki Sakaue
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3
Teruyuki Sakaue
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
Teruyuki Sakaue
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
Teruyuki Sakaue
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
Teruyuki Sakaue
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
Teruyuki Sakaue
Plus de Teruyuki Sakaue
(11)
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
警察庁オープンデータで交通事故の世界にDeepDive!
警察庁オープンデータで交通事故の世界にDeepDive!
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[丸ノ内アナリティクスバンビーノ#23]データドリブン施策によるサービス品質向上の取り組み
[Music×Analytics]プロの音に近づくための研究と練習
[Music×Analytics]プロの音に近づくための研究と練習
[DSO] Machine Learning Seminar Vol.8 Chapter 9
[DSO] Machine Learning Seminar Vol.8 Chapter 9
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.2 Chapter 3
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
[DSO] Machine Learning Seminar Vol.1 Chapter 1 and 2
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
地理データを集め、可視化し分析することが簡単にできるプログラミング言語について @ BIT VALLEY -INSIDE- Vol.16
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
[第1回]データ分析ランチセッション ~ Qiita Advent Calendar2019から得た情報10選
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
流行りの分散表現を用いた文書分類について Netadashi Meetup 7
機械学習による積極的失業〜オウンドメディアの訪問予測
1.
機械学習による積極的失業〜オ ウンドメディアの訪問予測 2016/06/25 Mr_Sakaue
2.
自己紹介 Mr_Sakaue 渋谷の某ベンチャー企業のWebマーケティング(50%)と分析(50%)を兼務 大学・大学院で経済理論と計量経済学を専攻 主にR・Pythonを用いて、機械学習や自然言語処理を用いたアドホック分析から、自社 サイトの運用のアドバイスなどを行っている。 2
3.
Mr_Sakaueのオウンドメディア実績 ・検索エンジン経由の月間訪問数を1年半で5.4倍 検索エンジン経由の月間CV数を1年半で4.5倍 セオリーに従い運営していった結果、非常に成長したものの、労働集約的な働き方が 常態化している。 3
4.
自分の仕事を機械に委ね、失業したい 4 データマイニングにもっと注力していきたい!
5.
自社オウンドメディアのデータ特性 ・主に求職者が仕事を探すに際し、Googleなどで検索を行った結果、自社サイトに訪問 する。 ・ロングテールな訪問のデータで、数ヶ月に一回訪問するようなページが多い。 ・テキスト情報は十分に規格化されておらず、ページによって文字数など情報量にちら ばりがある。 5
6.
オウンドメディアの課題 毎月数百件の求人ページが掲載期間終了で Web上から削除される。( 404
Not Found化) 掲載期間が終了しても、自社サービスに関心を持ってくれるユーザーは存在する。 (捨てるなんて勿体無い) 掲載期間が過ぎても募集終了を明記して残すべき求人ページとそうでないページをふるいにかけたい。 現状はMr_Sakaueの勘と経験と度胸(KKD)で今後訪問の来そうなページ (3ヶ月間で訪問がくる)を選定 している。(精度は51%) 6
7.
分析の目的 ・私の判断基準で選定した結果の精度(51%)を上回るような、訪問の来そうな求人ペー ジ選定の識別器を作りたい。 【期待される効果】 ・私の判断にあてる時間のコストカット (このタスクに関しては積極的に失業したい。) ・精度向上によるオウンドメディアの訪問数増 7
8.
フローチャート データ 学習550件 テスト550件 前処理 特徴量作成 予測アルゴリ ズム適用 予測結果の 活用 チューニング 8
9.
特徴量の準備 9
10.
第7回テキストマイニング・シンポジウムにて 電子カルテのテキスト情報を形態 素解析して、それを特徴量とする 際に、GBDTを使ったらどれを使う べきかの判断に使えるだろうと 某研究者が発言していた。 求人情報のテキストも形態素解析 して、特徴量に使うことで予測モデ ルに使うことができるかもしれな い。 10
11.
求人ページ内における訪問数と相関しそうな単語 11訪問と相関してそうな単語はあるので、きっと予測に使えるかも!
12.
クリック予測に有効な特徴量の選び方 12 CTR予測に関してはHistorical Featureが予測パフォーマン ス向上に大きく寄与する!
13.
今回の分析で用いる特徴量 ・給与や文字数、本文内の単語を特徴量として利用(Contextual Feature) MeCabにより本文を形態素解析しTF-IDFを計算し、 Bag of
Wordsを作成して特徴量とした。 ・過去3ヶ月間の訪問数を特徴量として利用(Historical Feature) 13
14.
手法 14
15.
手法 ・XGBoost(GBDTの高性能版) ・Random Forest 15
16.
評価指標 Precisionで評価 機械学習システムによって提案された候補の内、向こう3ヶ月以内に訪問のくる求人 ページをどれだけ選択できたかを評価します。 訪問の来なさそうなページを公開することは極力避けたいので、Recallは重視しませ ん。 16
17.
様々な特徴量で予測を行う ・単価と文字数だけで予測(変数2個) ・単価と文字数と過去訪問数で予測(変数3個) ・単価と文字数と過去訪問数とテキスト情報で予測(変数は数百個) ・単価と文字数とテキスト情報で予測(変数は数百個) 17
18.
18 チューニングを行った XGBoostのパ ラメータ達 colsample_bytree min_child_weight max_depth gamma subsample alpha eta ・・・ 特徴量の数が多いと計算が相当に 厳しいことを実感した。
19.
推定結果(Precision) 19 Mr_Sakaueチョイス(51%)
20.
Historical Featureの重要度スコアが高い 20
21.
念のためにRecallも・・・ 精度だけでなく、結果として返さ れる数も十分許せるレベルで あった。(Recallは約60%) 21
22.
考察 ・私が求人を選定するよりも、分類器にかけたほうが最大で20%近く正解を当てることが できる。(失業してもいい・・・?) ・単価と文字数にHistorical Featureを加えたRomdom Forestのモデルの精度は71%と 最も高い。 ・チューニングを前提としたXGBoostならば、Contextual
Featureの追加により精度の 向上が観察されているが、Random Forestの71%には勝てない。 22
23.
今後の研究 ・形態素解析による特徴量の作成だけでなく、トピック分析などにより特徴量を作成する アプローチにも挑戦してみる。(教師付きLDAも気になる。) ・Factorization Machineによる特徴量の作成に挑戦してみる。 ・ページごとに構造化されたデータの作成を行う。 ・パラメータチューニングを行いやすい分析環境を用意する。 ・学習データ数をもっと増やしていく。 23
24.
ご清聴ありがとうございました! 24
Télécharger maintenant