More Related Content
Similar to Jubatus workshop - 分散処理の仕組み
Similar to Jubatus workshop - 分散処理の仕組み (20)
More from JubatusOfficial
More from JubatusOfficial (20)
Jubatus workshop - 分散処理の仕組み
- 1. Copyright(c)2011 NTT CORPORATION. All Rights
Reserved.
分散処理の仕組み
NTT 情報流通プラットフォーム研究所
上西康太
2011/11/7
© 2011 NTT Information Sharing Platform Laboratories
- 2. いろいろ
• Pythonクライアント refined by repeatedly
• https://github.com/jubatus/jubatus-python-client
• Google Groupsつくりました
• http://groups.google.com/group/jubatus
2 © 2011 NTT Information Sharing Platform Laboratories
- 4. プロセス構成と通信
RPC JubaClassifier
クライアント JubaKeeper
mix
RPC
死活監視
4 © 2011 NTT Information Sharing Platform Laboratories
- 5. 学習・推論時のクライアントのシーケンス
JubaClassifier
クライアント JubaKeeper
5 © 2011 NTT Information Sharing Platform Laboratories
- 6. それぞれの計算の擬似コード
typedef String Label
train:: Model-> {Label, Datum} -> Model
classify :: Model-> Datum -> [{Label, Double}]
mix :: [Model] -> [Model]
mix models =
let mixees = map (fun Model ->Mixee) models
let mixee = fold_left(lambda Mixee->Mixee->Mixee) 0 mixees
let apply = (lambda Mixee-> Model-> Model) mixee
map apply models
6 © 2011 NTT Information Sharing Platform Laboratories
- 7. MIX
JubaClassifier
クライアント JubaKeeper
1.学習がたまるor
一定時間経過
2.ZooKeeperで
ロックをとる
3.全員から
get_diff
4.XXを計算
5.全員にput_diff
7 © 2011 NTT Information Sharing Platform Laboratories
- 8. Mixのシーケンス(今のところ)
get_diff
ZK lock
みっくす
put_diff
ZK unlock
8 © 2011 NTT Information Sharing Platform Laboratories
- 10. 将来のはなし
• Distributed RPC
• Horizontal Scalability
• Complex Event Processing DSL
10 © 2011 NTT Information Sharing Platform Laboratories
- 11. Thank you
11 © 2011 NTT Information Sharing Platform Laboratories