SlideShare une entreprise Scribd logo
1  sur  15
Télécharger pour lire hors ligne
Efficient Mini-batch Training 
for Stochastic Optimization 
Li, M., Zhang, T., Chen, Y., & Smola, A. J. 
@ KDD2014読み会 関西会場 
京大石井研 M2 小山田創哲 
@sotetsuk
紹介する論文
SGDと最近の傾向 
ビッグデータと計算機性能の向上を背景に 
膨大なパラメータ数の識別器を,大量のデータで 
SGD(Stochastic Gradient Descent) 
によって学習する場面が目立つ 
例えば Deep learning 
[Taigman 
et 
al., 
2014] 
[Le 
et 
al., 
2012] 
[Szegedy 
et 
al., 
2014]
SGD 
Stochastic Gradient Descent 
【問題】次のコスト関数の最小化をしたい 
Ex. 
【SGD】次のように逐次的に最適化
MSGD 
Mini-batch SGD
Distributed implementation 
応用上,パラメータ数やサンプルサイズが 
膨大な場面では,分散処理が行われる. 
【問題点】更新式の実行毎にコミュニケー 
ションコストが発生する 
コミュニケーションの回数を減らして, 
たくさんのデータをみるため,batch size 
を大きくしたい
MSGDのトレードオフ 
コミュニケーションコストを減らして,たくさん 
データをみるため,batch sizeを大きくしたいが, 
batch sizeを大きくしすぎると,たくさんのデー 
タをみても,なかなか学習が進まなくなる. 
n コスト関数が凸な場合について,理論的に収束 
が遅くなることが示される [Dekel 
et 
al., 
2012]
提案手法 
Batch sizeを大きくしても学習が遅くならない 
MSGDを提案 
基本アイディア: 
Mini-batch毎の一回の更新の質を向上させる 
各mini-batchにおけるパラメータの更新を 
正則化項を含むコスト関数の最小化問題の近似 
だと捉える(次で説明)
提案手法の基本アイディア 
Mini-batch毎の一回の更新の質を向上させる 
は 
と等価.さらにこれを 
[ ]の中をwで微分 
して0とおくと… 
の一次近似とみなす.これをMini-batch毎に解く. 
Mini-batch毎の更新を正則化項を含むコスト関数の最小化問題 
(部分問題)へと発想を逆転させる
EMSO(提案手法) 
各mini-batch毎に定義される部分問題を 
また勾配法で解く 
n EMSO-GD 
n Gradient Descentで解く 
n EMSO-CD 
n Coordinate Descentで解く 
図はh"p://en.wikipedia.org/から参照
並列計算でのEMSO 
Mini-batchのデータを分割して, 
それぞれについて をEMSO-GDまたはCDで 
並列に計算し,それらの平均をとって更新する
数値実験 
n データセット 
n KDD04 
n URL 
n CTR 
n モデル 
n Logistic regressionによる2値分類 
表は論文より参照
単一ノードでの結果 
URLデータセット 
EMSO-CD 
が10倍早い 
すべて10^7サンプル学習後 Batch sizeは各手法 
毎に最適なものを使用 
図は論文より参照
複数ノードでの結果 
単一ノードの時と同じく 
EMSO-CDが10倍早い 
ノード数を変えた時 
EMSO-CDのコストが 
特定の値まで下がるまでに 
要した時間の比較 
図,表は論文より参照
総括 
【手法】 
Mini-batch毎の更新を,正則化項を含むコス 
ト関数の最適化問題で置き換え,より繊細に更新を 行うことによって,batch-sizeを大きくしても 学習が遅くならない手法を提案している 
【理論】 
凸なコスト関数を仮定した場合,bが大きい時の収 
束速度の改善が証明されている(今回触れず) 
【数値実験】 
二値分類Logistic regressionにおける数値実 験でEMSO-CDが他の手法より高い性能を示した

Contenu connexe

En vedette

パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰sleipnir002
 
JOI夏季セミ2014、集合知プログラミング_2、5
JOI夏季セミ2014、集合知プログラミング_2、5JOI夏季セミ2014、集合知プログラミング_2、5
JOI夏季セミ2014、集合知プログラミング_2、5Kai Katsumata
 
校内発表用資料スライド 女医のすすめ
校内発表用資料スライド 女医のすすめ校内発表用資料スライド 女医のすすめ
校内発表用資料スライド 女医のすすめKai Katsumata
 
JOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おう
JOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おうJOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おう
JOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おうKai Katsumata
 
Rによるウイスキー分析
Rによるウイスキー分析Rによるウイスキー分析
Rによるウイスキー分析Takashi Kitano
 
PRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデルPRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデルShohei Okada
 
20160311 基礎からのベイズ統計学輪読会第6章 公開ver
20160311 基礎からのベイズ統計学輪読会第6章 公開ver20160311 基礎からのベイズ統計学輪読会第6章 公開ver
20160311 基礎からのベイズ統計学輪読会第6章 公開verTakashi Kitano
 
Hello deeplearning!
Hello deeplearning!Hello deeplearning!
Hello deeplearning!T2C_
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングYuya Unno
 
入門パターン認識と機械学習 1章 2章
入門パターン認識と機械学習 1章 2章入門パターン認識と機械学習 1章 2章
入門パターン認識と機械学習 1章 2章hiro5585
 
機械学習の全般について 4
機械学習の全般について 4機械学習の全般について 4
機械学習の全般について 4Masato Nakai
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則koba cky
 
クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別Hiroshi Nakagawa
 
Overview of Chainer and Its Features
Overview of Chainer and Its FeaturesOverview of Chainer and Its Features
Overview of Chainer and Its FeaturesSeiya Tokui
 
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011Preferred Networks
 
クラシックな機械学習入門 1 導入
クラシックな機械学習入門 1 導入クラシックな機械学習入門 1 導入
クラシックな機械学習入門 1 導入Hiroshi Nakagawa
 

En vedette (20)

強化学習勉強会・論文紹介(第22回)
強化学習勉強会・論文紹介(第22回)強化学習勉強会・論文紹介(第22回)
強化学習勉強会・論文紹介(第22回)
 
Principal Sensitivity Analysis
Principal Sensitivity AnalysisPrincipal Sensitivity Analysis
Principal Sensitivity Analysis
 
パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰パターン認識 05 ロジスティック回帰
パターン認識 05 ロジスティック回帰
 
JOI夏季セミ2014、集合知プログラミング_2、5
JOI夏季セミ2014、集合知プログラミング_2、5JOI夏季セミ2014、集合知プログラミング_2、5
JOI夏季セミ2014、集合知プログラミング_2、5
 
校内発表用資料スライド 女医のすすめ
校内発表用資料スライド 女医のすすめ校内発表用資料スライド 女医のすすめ
校内発表用資料スライド 女医のすすめ
 
JOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おう
JOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おうJOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おう
JOISS2015 グレブナー基底発表joisinoお姉ちゃんを救おう
 
Rによるウイスキー分析
Rによるウイスキー分析Rによるウイスキー分析
Rによるウイスキー分析
 
PRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデルPRML勉強会@長岡 第4章線形識別モデル
PRML勉強会@長岡 第4章線形識別モデル
 
20160311 基礎からのベイズ統計学輪読会第6章 公開ver
20160311 基礎からのベイズ統計学輪読会第6章 公開ver20160311 基礎からのベイズ統計学輪読会第6章 公開ver
20160311 基礎からのベイズ統計学輪読会第6章 公開ver
 
匿名化の崩壊
匿名化の崩壊匿名化の崩壊
匿名化の崩壊
 
Hello deeplearning!
Hello deeplearning!Hello deeplearning!
Hello deeplearning!
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
 
強化学習勉強会・論文紹介(Kulkarni et al., 2016)
強化学習勉強会・論文紹介(Kulkarni et al., 2016)強化学習勉強会・論文紹介(Kulkarni et al., 2016)
強化学習勉強会・論文紹介(Kulkarni et al., 2016)
 
入門パターン認識と機械学習 1章 2章
入門パターン認識と機械学習 1章 2章入門パターン認識と機械学習 1章 2章
入門パターン認識と機械学習 1章 2章
 
機械学習の全般について 4
機械学習の全般について 4機械学習の全般について 4
機械学習の全般について 4
 
20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則20130716 はじパタ3章前半 ベイズの識別規則
20130716 はじパタ3章前半 ベイズの識別規則
 
クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別クラシックな機械学習の入門 3. 線形回帰および識別
クラシックな機械学習の入門 3. 線形回帰および識別
 
Overview of Chainer and Its Features
Overview of Chainer and Its FeaturesOverview of Chainer and Its Features
Overview of Chainer and Its Features
 
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
オンライン凸最適化と線形識別モデル学習の最前線_IBIS2011
 
クラシックな機械学習入門 1 導入
クラシックな機械学習入門 1 導入クラシックな機械学習入門 1 導入
クラシックな機械学習入門 1 導入
 

Similaire à KDD2014勉強会 発表資料

ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-
ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-
ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-Hironori Washizaki
 
TensorFlow DevSummitを概観する
TensorFlow DevSummitを概観するTensorFlow DevSummitを概観する
TensorFlow DevSummitを概観するY OCHI
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップDaiyu Hatakeyama
 
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみたディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみたknjcode
 
(株)インサイト15年間の技術と経験の蓄積に基づいたサービス
(株)インサイト15年間の技術と経験の蓄積に基づいたサービス(株)インサイト15年間の技術と経験の蓄積に基づいたサービス
(株)インサイト15年間の技術と経験の蓄積に基づいたサービスAkio Miyoshi
 
20180117_ICON技術セミナー4_常盤
20180117_ICON技術セミナー4_常盤20180117_ICON技術セミナー4_常盤
20180117_ICON技術セミナー4_常盤ICT_CONNECT_21
 
早稲田・鷲崎-ゴール指向の測定によるソフトウェア 品質評価と改善の実践的取組み (三つのコツ、三つの事例)-2015年2月19日
早稲田・鷲崎-ゴール指向の測定によるソフトウェア品質評価と改善の実践的取組み(三つのコツ、三つの事例)-2015年2月19日早稲田・鷲崎-ゴール指向の測定によるソフトウェア品質評価と改善の実践的取組み(三つのコツ、三つの事例)-2015年2月19日
早稲田・鷲崎-ゴール指向の測定によるソフトウェア 品質評価と改善の実践的取組み (三つのコツ、三つの事例)-2015年2月19日Hironori Washizaki
 

Similaire à KDD2014勉強会 発表資料 (9)

ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-
ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-
ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-
 
TensorFlow DevSummitを概観する
TensorFlow DevSummitを概観するTensorFlow DevSummitを概観する
TensorFlow DevSummitを概観する
 
機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ機械学習 - MNIST の次のステップ
機械学習 - MNIST の次のステップ
 
ディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみたディープラーニングでラーメン二郎(全店舗)を識別してみた
ディープラーニングでラーメン二郎(全店舗)を識別してみた
 
JasstTokyo2017
JasstTokyo2017JasstTokyo2017
JasstTokyo2017
 
(株)インサイト15年間の技術と経験の蓄積に基づいたサービス
(株)インサイト15年間の技術と経験の蓄積に基づいたサービス(株)インサイト15年間の技術と経験の蓄積に基づいたサービス
(株)インサイト15年間の技術と経験の蓄積に基づいたサービス
 
20180117_ICON技術セミナー4_常盤
20180117_ICON技術セミナー4_常盤20180117_ICON技術セミナー4_常盤
20180117_ICON技術セミナー4_常盤
 
RAPIDS 概要
RAPIDS 概要RAPIDS 概要
RAPIDS 概要
 
早稲田・鷲崎-ゴール指向の測定によるソフトウェア 品質評価と改善の実践的取組み (三つのコツ、三つの事例)-2015年2月19日
早稲田・鷲崎-ゴール指向の測定によるソフトウェア品質評価と改善の実践的取組み(三つのコツ、三つの事例)-2015年2月19日早稲田・鷲崎-ゴール指向の測定によるソフトウェア品質評価と改善の実践的取組み(三つのコツ、三つの事例)-2015年2月19日
早稲田・鷲崎-ゴール指向の測定によるソフトウェア 品質評価と改善の実践的取組み (三つのコツ、三つの事例)-2015年2月19日
 

KDD2014勉強会 発表資料