SlideShare une entreprise Scribd logo
1  sur  33
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
DeNAでのVertica運⽤用	
  
March	
  25,	
  2015	
  
Shota	
  Suzuki	
  
Analy;cs	
  Solu;on	
  Gr.	
  
Analy;cs	
  Infra	
  Dept.	
  
DeNA	
  Co.,	
  Ltd.	
  	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
⾃自⼰己紹介	
  
!  鈴鈴⽊木	
  翔太	
  
⁃  所属	
  
•  システム本部分析基盤部分析ソリューションGr	
  
!  経歴	
  
⁃  2013年年に新卒でDeNAに⼊入社	
  (新卒2年年⽬目)	
  	
  
⁃  ⼊入社以来Vertica関連の調査、運⽤用、ツール開発	
  
2	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
アジェンダ	
  
!  Vertica導⼊入の経緯	
  
!  利利⽤用の仕⽅方	
  
!  導⼊入初期にはまったこと	
  
!  利利⽤用拡⼤大に伴い⽣生じた問題	
  
3	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
4	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Before	
  Ver>ca	
  分析環境	
  
!  ログをHadoopへ格納	
  
!  Hadoop上のデータに対しPig、
Hiveで分析を⾏行行う	
  
5	
  
4PBのHadoop	
  
クラスタ	
  
・⼩小さな集計でも時間がかかる	
  
・短いサイクルで仮説検証を繰り返すことが
難しい	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Ver>caの導⼊入	
  
!  SQLで⾼高速な集計が可能	
  
!  Facebook,	
  Zynga,	
  Twitter等	
  競合他社での⼤大規
模導⼊入実績	
  
!  低容量量(1Tera	
  Byte)であれば無料料で使える	
  
6	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Ver>caを導⼊入したところ	
  
!  アドホックな分析⼯工数の削減	
  
⁃  数秒から数分で結果を得られる	
  
!  内製BIツールの作成	
  
⁃  Verticaの⾼高速性を最⼤大限活かすためにBIツールの内
製	
  
!  利利⽤用者の拡⼤大	
  
⁃  アナリストだけでなくエンジニア、企画も利利⽤用	
  
7	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Ver>caの利利⽤用推移	
  
8	
  
容量量	
  
台数	
  
2013/08	
   2013/12	
   2014/04	
   2014/10	
   2015/01	
  
評価版	
   1TB×4	
  
5台	
   3台×4	
  
11TB	
   18TB	
   25TB	
  
9台	
   14台	
  
性能の基礎
評価	
  
新規サービ
スに導⼊入	
  
新規サービスで
の利利⽤用拡⼤大	
  
既存サービス
での利利⽤用	
  
2015/03	
  
サーバスペック	
  :	
  	
  CPU	
  16コア、memory	
  128GByte、network	
  1Gbpsx2(bonding)	
  
          4TB	
  7.2K	
  rpm	
  x12	
  (RAID	
  10)	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Ver>caとHadoopの使い分け	
  
9	
  
・新規サービス中⼼心	
  
・単純なSQLでの集計	
  
・データの⼤大きな    
既存サービス	
  
・複雑な機械学習	
  
それぞれ適した場⾯面で使⽤用	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Ver>caへのデータ格納経路路	
  
10	
  
Event	
  
log	
  
DB	
  
(MySQL)	
  
Log	
  
Collector	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
11	
  
導⼊入初期にはまったこと	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
公式ドキュメント以外ほぼ情報がない	
  
!  当時国内にほとんど情報はなかった…	
  
⁃  BigQueryやRedshiftについてはググれば情報はか
なりでてくるのに	
  
⁃  海外ではカンファレンスも開催されている	
  
!  最初はCommunity	
  Editionで保守もなくひたす
らドキュメントを読み検証してました	
  
!  はまりどころ多数	
  
12	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
データの投⼊入時に注意すること	
  
!  ⼤大量量のデータ投⼊入でINSERTは遅いのでCOPYか
INSERT	
  SELECTを使う	
  
!  データ投⼊入時に⽋欠損が⽣生じることがある	
  
⁃  型が⼀一致していないレコードは捨てられてしまう	
  
⁃  ABORT	
  ON	
  ERRORをオプションとしてつけるこ
とによりエラーの検知	
  
⁃  COPY	
  REJECTED	
  DATA	
  and	
  EXCEPTIONSなど
をつかいデバッグを⾏行行う	
  
13	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
テーブル定義変更更時の注意事項	
  
!  カラムをテーブルに追加したい	
  
⁃  末尾にしか追加できません	
  
!  型の変更更を⾏行行いたい	
  
⁃  分散キー(segment	
  key)に⼊入ってるカラムの型は
変更更ができない	
  
•  プロジェクションを作り直すことにより分散キーから外してALTERを⾏行行う	
  
•  新しくテーブルを作り直しSELECT	
  INSERTでデータを⼊入れ直すときにキ
ャストを⾏行行う	
  	
  
14	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
利利⽤用者の拡⼤大に伴い様々な問題発⽣生	
  
!  増え続けていくデータ	
  
!  リソースが⾜足りずクエリが実⾏行行できない	
  
!  メタデータへのアクセスが異異常に遅い	
  
!  サービスの成⻑⾧長につれて遅くなるクエリ	
  
15	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
16	
  
各⽉月でのスキーマ毎のデータ量量	
  
増え続けていくデータ	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
なぜ使⽤用容量量が増え続けるのか	
  
!  アナリストが⾃自主的に容量量に気を配ってくれない	
  
⁃  データの取り込みをしている⼈人と利利⽤用者が違って
いるのであまり容量量を意識識しない	
  
⁃  本来の分析に集中したい	
  
⁃  データ整備に時間をなるべく割きたくない	
  
!  Hadoopとは絶対的な容量量が違う	
  
⁃  Hadoopのように全てを⼊入れておけるわけではない	
  
⁃  保持期限の設定、必要データの選択が必要	
  
17	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
スキーマ、テーブル単位で容量量の⾒見見える化	
  
18	
  
ユーザにどの程度度使ってい
るのか意識識してもらう	
  
・急激にデータが増える
ことは減った	
  
・どのデータをどの程度度
持つのか利利⽤用ユーザが考
えるようになった	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
ある⽇日から突然JOBが
実⾏行行できなくなったん
ですけど・・・	
  
19	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
リソースが⾜足りずクエリが実⾏行行できない	
  
!  導⼊入からしばらくはリソースの管理理をあまり⾏行行
っていなかった	
  
!  あるクエリが⻑⾧長時間リソースの占拠をしており
、他のクエリはキューに⼊入ったままで実⾏行行でき
なくなっていた	
  
!  ⼀一⼈人が無茶茶なクエリを実⾏行行すると全体に迷惑が
かかる	
  
20	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
リソースの制御により暴暴⾛走を防ぐ	
  
!  Resource	
  Poolによる制限	
  
⁃  メモリ、並列列度度、実⾏行行時間、優先度度等を管理理できる	
  
⁃  独⾃自に定義してどのユーザに割り当てるのか設定可
能	
  
⁃  設定を⾏行行わないとdefault	
  poolが使⽤用される	
  
!  ユーザ単位でもメモリの量量や実⾏行行時間は別途制
御することができる	
  
21	
  
Resource	
  Poolを適切切に設計することで多
くのユーザに安全に使ってもらえる	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Resource	
  Pool設計の考えかた	
  
!  Resource	
  Poolの数が増えすぎるとリソースの管
理理が難しくなるのであまり増やしすぎない	
  
!  メモリの最⼤大使⽤用量量、キューへのたまり具合を
⾒見見ながらチューニングを⾏行行う	
  
!  重要なクエリについてはリソースをあらかじめ
わけて確保することにより実⾏行行を保証する	
  
22	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
dnやdtでスキーマ、
テーブル⼀一覧を出すの
が異異常に遅い	
  
23	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
メタデータへのアクセスが遅かった原因	
  
!  Community	
  Edition時にパフォーマンス向上を
期待してパラメータの変更更を⾏行行っていた	
  
⁃  MaxROSPerStratum、SortWorkerThreads	
  
!  これが原因で平常時でもCPUが使われておりパ
フォーマンスの劣劣化に	
  
!  デフォルトの設定に戻したところ平常時のCPU
使⽤用率率率は下がりメタデータへのアクセス速度度改善	
  
!  Change_̲under_̲support_̲guidanceを変える場
合は悪影響のおそれがあるので相談した⽅方が良良い	
  
24	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
徐々に遅くなっていくクエリ	
  
!  サービスリリース当初はデータも⼩小さく⾼高速に集
計が⾏行行えていた	
  
!  リリース後ユーザ数の増加、蓄積されたデータ量量
の増加により徐々に定常クエリが遅くなっていく	
  
!  アドホックな分析をするにもデータがでかく即座
に結果をえられない	
  
25	
  
データが⼤大きくなってくると	
  
何も考えず作ったテーブルでは限界に	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
プロジェクション	
  
!  Verticaではクエリを⾼高速化するためにプロジェ
クションを理理解しておくことが重要	
  
!  並び順、分散キー、圧縮の⽅方法を指定すること
が可能	
  
!  ⼀一つのテーブルに対して複数のプロジェクショ
ンが作成できる	
  
!  特定のクエリに特化したプロジェクションを作
成することでクエリの⾼高速化が⾏行行える	
  
26	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
プロジェクションの改善	
  
!  テーブル数が多くすべてを⾒見見るのはつらいので、
遅いクエリに対してプロジェクションの作成を⾏行行う	
  
!  Explainの結果を⾒見見ながらプロジェクションを考え
る	
  
⁃  SORT,	
  SEGMENT,	
  ENCODINGの指定	
  
⁃  ⼩小さなマスターテーブルはJOINを考え全ノードに分
散させずにおく	
  
⁃  ENCODINGは絞り込みに使うカラムをRLEに	
  
27	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
Database	
  Designer	
  
!  データの特性、実⾏行行されるクエリから良良さそう
なプロジェクションを⾃自動で作成できる	
  
!  全てを⼿手作業で作成するのは難しいし、時間が
かかりすぎるのでDatabase	
  Designerの利利⽤用	
  
!  作成された物についておかしな物がないか⼀一度度
確認してから本番にデプロイする	
  
28	
  
Database	
  Designerの利利⽤用によって	
  
プロジェクションの作成が簡単に	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
監視の重要性	
  
!  利利⽤用者も管理理者もまだなれていないシステム	
  
!  バッドノウハウ的な物がまだあまりないのでど
こで問題が起きるかわからない	
  
!  問題発⽣生時にすぐ調査できるように様々な⾓角度度
から情報を集めておいたほうがよい	
  
29	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
DataCollectorによる情報の収集	
  
!  Vertica⾃自⾝身で様々な情報の取得を取得している	
  
!  システムテーブルの中⾝身はDataCollectorで取得
した情報を参照している物が多い	
  
!  保存期間が短いので適宜のばす	
  
⁃  SET_̲DATA_̲COLLECTOR_̲POLICY	
  
!  システムテーブルは内部ではファイルアクセス
をしており遅いので⼯工夫が必要	
  
⁃  別途テーブルにコピーして⾼高速にアクセス	
  
30	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
その他の監視	
  
!  スロークエリの⼀一覧を出し常に改善を⾏行行う	
  
!  ベンチマーククエリを定期実⾏行行してクラスタに
負荷がかかっていないか調べる	
  
!  CPU,	
  memory,	
  IO,	
  network	
  
⁃  Sarでデータの取得	
  
⁃  負荷調査	
  
31	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
まとめ	
  
!  データが必要以上に増えすぎないような⼯工夫	
  
⁃  どのサービスでどのくらいの量量を使っているか⾒見見え
る化を⾏行行い、利利⽤用ユーザにも注意を払ってもらうこ
とが必要	
  
!  リソースを制御することで安全に多くの⼈人が使える	
  
⁃  Resource	
  Poolを適切切に設計することでいけてない
クエリの与える影響範囲を限定的に	
  
!  パラメータ変更更による悪影響の恐れ	
  
⁃  Change_̲under_̲support_̲guidanceを変更更するとき
には事前に相談をした⽅方がよい	
  
32	
  
Copyright	
  (C)	
  DeNA	
  Co.,Ltd.	
  All	
  Rights	
  Reserved.	
  
まとめ	
  
!  プロジェクション作成によるクエリの⾼高速化	
  
⁃  遅いクエリにはプロジェクションを作成してくク
エリを⾼高速化できる	
  
⁃  Database	
  Designerを使⽤用すると⼿手軽にプロジェ
クション作成ができ便便利利	
  
!  問題発⽣生時に調査しやすいようデータはいろい
ろな⾓角度度から集めておく	
  
33	
  

Contenu connexe

Tendances

[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...Insight Technology, Inc.
 
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...NTT DATA Technology & Innovation
 
[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...
[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...
[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...Insight Technology, Inc.
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~NTT DATA OSS Professional Services
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力NTT DATA OSS Professional Services
 
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...
[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...
[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...Insight Technology, Inc.
 
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11MapR Technologies Japan
 
JJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組みJJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組みRecruit Technologies
 
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...Insight Technology, Inc.
 
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)NTT DATA Technology & Innovation
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)Atsushi Kurumada
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...NTT DATA Technology & Innovation
 
Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)
Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)
Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)NTT DATA Technology & Innovation
 
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理NTT DATA Technology & Innovation
 

Tendances (20)

[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
 
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
 
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
[db tech showcase Tokyo 2015] B24:最高峰の可用性 ~NonStop SQLが止まらない理由~ by 日本ヒューレット・パ...
 
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
Spark 3.0が目指す、よりインテリジェントなUnified Analytics Platform(db tech showcase 2019 Tok...
 
[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...
[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...
[db tech showcase Tokyo 2015] C32:「データ一貫性にこだわる日立のインメモリ分散KVS~こだわりの理由と実現方法とは~」 ...
 
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
 
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力Global Top 5 を目指す NTT DATA の確かで意外な技術力
Global Top 5 を目指す NTT DATA の確かで意外な技術力
 
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
 
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
[db tech showcase Tokyo 2015] B15:最新PostgreSQLはパフォーマンスが飛躍的に向上する!? - PostgreSQ...
 
[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...
[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...
[db tech showcase Tokyo 2016] E33: こんな方法あり!? 何でもありです! インフラストラクチャレベルインメモリコンピュー...
 
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
 
JJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組みJJUG CCC リクルートの Java に対する取り組み
JJUG CCC リクルートの Java に対する取り組み
 
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
 
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
Spark + AI Summit 2020セッションのハイライト(Spark Meetup Tokyo #3 Online発表資料)
 
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
まだプログラム手で書いて消耗してるの?~入出力例からプログラムを自動生成する技術~(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019...
 
Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)
Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)
Spark+AI Summit Europe 2019 セッションハイライト(Spark Meetup Tokyo #2 講演資料)
 
Apache spark 2.3 and beyond
Apache spark 2.3 and beyondApache spark 2.3 and beyond
Apache spark 2.3 and beyond
 
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
 

En vedette

変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤Recruit Technologies
 
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)Developers Summit
 
DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤Kenshin Yamada
 
B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...
B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...
B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...Insight Technology, Inc.
 
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Satoru Ishikawa
 
企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘
企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘
企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘Akira Kitauchi
 
Hadoopの紹介
Hadoopの紹介Hadoopの紹介
Hadoopの紹介bigt23
 
サービスを成長させる為の開発について
サービスを成長させる為の開発についてサービスを成長させる為の開発について
サービスを成長させる為の開発についてtatsuya mazaki
 
20131209_buildinsidermeetup
20131209_buildinsidermeetup20131209_buildinsidermeetup
20131209_buildinsidermeetupkumake
 
いままで使ってきた携帯電話
いままで使ってきた携帯電話いままで使ってきた携帯電話
いままで使ってきた携帯電話Ippei Ogiwara
 
CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作
CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作
CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作Nobutaka Takushima
 
New Objective-C Features for Swift 2.0
New Objective-C Features for Swift 2.0New Objective-C Features for Swift 2.0
New Objective-C Features for Swift 2.0Goichi Hirakawa
 
2014.11.12 ibm bluemix pdf
2014.11.12 ibm bluemix pdf2014.11.12 ibm bluemix pdf
2014.11.12 ibm bluemix pdfYuichiro Maki
 
Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合
Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合
Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合Ryuichi Kubuki
 
【登壇資料】人類総インターネット時代に20代を無駄にしないために
【登壇資料】人類総インターネット時代に20代を無駄にしないために【登壇資料】人類総インターネット時代に20代を無駄にしないために
【登壇資料】人類総インターネット時代に20代を無駄にしないためにJunichi Akagawa
 
みんなのウェディングのデータ分析基盤の作り方。
みんなのウェディングのデータ分析基盤の作り方。 みんなのウェディングのデータ分析基盤の作り方。
みんなのウェディングのデータ分析基盤の作り方。 Sunao Komuro
 

En vedette (20)

変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
 
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
【14-B-2】グリーを支えるデータ分析基盤の過去と現在(橋本泰一〔グリー〕)
 
DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤DeNAの分析を支える分析基盤
DeNAの分析を支える分析基盤
 
B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...
B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...
B23,B31 sap sybase iq ~全部話します。IQのカラムストア方式、ビットワイズインデックス、DQP、カラム圧縮、等々 by Toshih...
 
Riakを利用したパーソナライズ事例
Riakを利用したパーソナライズ事例Riakを利用したパーソナライズ事例
Riakを利用したパーソナライズ事例
 
Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114Classmethod awsstudy ec2rds20160114
Classmethod awsstudy ec2rds20160114
 
企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘
企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘
企業・業界データサービスSPEEDAの開発における複雑怪奇なデータとの格闘
 
Hadoopの紹介
Hadoopの紹介Hadoopの紹介
Hadoopの紹介
 
Javaone報告会
Javaone報告会Javaone報告会
Javaone報告会
 
サービスを成長させる為の開発について
サービスを成長させる為の開発についてサービスを成長させる為の開発について
サービスを成長させる為の開発について
 
20131209_buildinsidermeetup
20131209_buildinsidermeetup20131209_buildinsidermeetup
20131209_buildinsidermeetup
 
いままで使ってきた携帯電話
いままで使ってきた携帯電話いままで使ってきた携帯電話
いままで使ってきた携帯電話
 
CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作
CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作
CEDEC 2013 - 徹底的にチューンしたハイブリッドアプリ「D.O.T. Defender of Texel」の制作
 
New Objective-C Features for Swift 2.0
New Objective-C Features for Swift 2.0New Objective-C Features for Swift 2.0
New Objective-C Features for Swift 2.0
 
2014.11.12 ibm bluemix pdf
2014.11.12 ibm bluemix pdf2014.11.12 ibm bluemix pdf
2014.11.12 ibm bluemix pdf
 
Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合
Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合
Cocos2d-xの深層〜Cocos2d-x組み込みによるピュアAndroid/iOSアプリの外科手術的統合
 
【登壇資料】人類総インターネット時代に20代を無駄にしないために
【登壇資料】人類総インターネット時代に20代を無駄にしないために【登壇資料】人類総インターネット時代に20代を無駄にしないために
【登壇資料】人類総インターネット時代に20代を無駄にしないために
 
みんなのウェディングのデータ分析基盤の作り方。
みんなのウェディングのデータ分析基盤の作り方。 みんなのウェディングのデータ分析基盤の作り方。
みんなのウェディングのデータ分析基盤の作り方。
 
Cross2013_DeNA
Cross2013_DeNACross2013_DeNA
Cross2013_DeNA
 
PHP at Yahoo! JAPAN
PHP at Yahoo! JAPANPHP at Yahoo! JAPAN
PHP at Yahoo! JAPAN
 

Similaire à DeNAでのVertica運用

DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -Tomoya Kabe
 
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめPostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめOhyama Masanori
 
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野livedoor
 
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~Dai Iwai
 
DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)
DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)
DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)Toshiharu Sugiyama
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...Insight Technology, Inc.
 
Beginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopBeginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopDataWorks Summit
 
Cloudera Impalaをサービスに組み込むときに苦労した話
Cloudera Impalaをサービスに組み込むときに苦労した話Cloudera Impalaをサービスに組み込むときに苦労した話
Cloudera Impalaをサービスに組み込むときに苦労した話Yukinori Suda
 
Automation with SoftLayer and Zabbix
Automation with SoftLayer and ZabbixAutomation with SoftLayer and Zabbix
Automation with SoftLayer and Zabbixsoftlayerjp
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
 
2013年度下期パートナー会 開発本部
2013年度下期パートナー会 開発本部2013年度下期パートナー会 開発本部
2013年度下期パートナー会 開発本部NTTDATA INTRAMART
 
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)NTT DATA OSS Professional Services
 
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...Insight Technology, Inc.
 
実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方Fujishiro Takuya
 
FINAL FANTASY Record Keeperのマスターデータを支える技術
FINAL FANTASY Record Keeperのマスターデータを支える技術FINAL FANTASY Record Keeperのマスターデータを支える技術
FINAL FANTASY Record Keeperのマスターデータを支える技術dena_study
 

Similaire à DeNAでのVertica運用 (20)

DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -DeNAインフラの今とこれから - 今編 -
DeNAインフラの今とこれから - 今編 -
 
NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦NTT DATA と PostgreSQL が挑んだ総力戦
NTT DATA と PostgreSQL が挑んだ総力戦
 
Tech deepdive#2 datastore_180317_share
Tech deepdive#2 datastore_180317_shareTech deepdive#2 datastore_180317_share
Tech deepdive#2 datastore_180317_share
 
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめPostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
 
NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野NHNグループ合同勉強会 ライブドア片野
NHNグループ合同勉強会 ライブドア片野
 
20180319 ccon sync kintone
20180319 ccon sync kintone20180319 ccon sync kintone
20180319 ccon sync kintone
 
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
10/2勉強会資料 ~IaaSを知る前にサーバを知ろう~
 
DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)
DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)
DeNAtechcon_DeNAのセキュリティの取り組みと、スマートフォンセキュリティ(same-origin policy)
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
 
Beginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning HadoopBeginner must-see! A future that can be opened by learning Hadoop
Beginner must-see! A future that can be opened by learning Hadoop
 
Cloudera Impalaをサービスに組み込むときに苦労した話
Cloudera Impalaをサービスに組み込むときに苦労した話Cloudera Impalaをサービスに組み込むときに苦労した話
Cloudera Impalaをサービスに組み込むときに苦労した話
 
Accel series 2016_spring
Accel series 2016_springAccel series 2016_spring
Accel series 2016_spring
 
Automation with SoftLayer and Zabbix
Automation with SoftLayer and ZabbixAutomation with SoftLayer and Zabbix
Automation with SoftLayer and Zabbix
 
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
 
2013年度下期パートナー会 開発本部
2013年度下期パートナー会 開発本部2013年度下期パートナー会 開発本部
2013年度下期パートナー会 開発本部
 
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
 
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
[db tech showcase Tokyo 2015] D16:マイケルストーンブレーカー発の超高速データベースで実現する分析基盤の簡単構築・運用ステ...
 
実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方
 
FINAL FANTASY Record Keeperのマスターデータを支える技術
FINAL FANTASY Record Keeperのマスターデータを支える技術FINAL FANTASY Record Keeperのマスターデータを支える技術
FINAL FANTASY Record Keeperのマスターデータを支える技術
 
YJTC18 A-1 データセンタネットワークの取り組み
YJTC18 A-1 データセンタネットワークの取り組みYJTC18 A-1 データセンタネットワークの取り組み
YJTC18 A-1 データセンタネットワークの取り組み
 

DeNAでのVertica運用

  • 1. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   DeNAでのVertica運⽤用   March  25,  2015   Shota  Suzuki   Analy;cs  Solu;on  Gr.   Analy;cs  Infra  Dept.   DeNA  Co.,  Ltd.    
  • 2. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   ⾃自⼰己紹介   !  鈴鈴⽊木  翔太   ⁃  所属   •  システム本部分析基盤部分析ソリューションGr   !  経歴   ⁃  2013年年に新卒でDeNAに⼊入社  (新卒2年年⽬目)     ⁃  ⼊入社以来Vertica関連の調査、運⽤用、ツール開発   2  
  • 3. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   アジェンダ   !  Vertica導⼊入の経緯   !  利利⽤用の仕⽅方   !  導⼊入初期にはまったこと   !  利利⽤用拡⼤大に伴い⽣生じた問題   3  
  • 4. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   4  
  • 5. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Before  Ver>ca  分析環境   !  ログをHadoopへ格納   !  Hadoop上のデータに対しPig、 Hiveで分析を⾏行行う   5   4PBのHadoop   クラスタ   ・⼩小さな集計でも時間がかかる   ・短いサイクルで仮説検証を繰り返すことが 難しい  
  • 6. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Ver>caの導⼊入   !  SQLで⾼高速な集計が可能   !  Facebook,  Zynga,  Twitter等  競合他社での⼤大規 模導⼊入実績   !  低容量量(1Tera  Byte)であれば無料料で使える   6  
  • 7. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Ver>caを導⼊入したところ   !  アドホックな分析⼯工数の削減   ⁃  数秒から数分で結果を得られる   !  内製BIツールの作成   ⁃  Verticaの⾼高速性を最⼤大限活かすためにBIツールの内 製   !  利利⽤用者の拡⼤大   ⁃  アナリストだけでなくエンジニア、企画も利利⽤用   7  
  • 8. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Ver>caの利利⽤用推移   8   容量量   台数   2013/08   2013/12   2014/04   2014/10   2015/01   評価版   1TB×4   5台   3台×4   11TB   18TB   25TB   9台   14台   性能の基礎 評価   新規サービ スに導⼊入   新規サービスで の利利⽤用拡⼤大   既存サービス での利利⽤用   2015/03   サーバスペック  :    CPU  16コア、memory  128GByte、network  1Gbpsx2(bonding)             4TB  7.2K  rpm  x12  (RAID  10)  
  • 9. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Ver>caとHadoopの使い分け   9   ・新規サービス中⼼心   ・単純なSQLでの集計   ・データの⼤大きな     既存サービス   ・複雑な機械学習   それぞれ適した場⾯面で使⽤用  
  • 10. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Ver>caへのデータ格納経路路   10   Event   log   DB   (MySQL)   Log   Collector  
  • 11. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   11   導⼊入初期にはまったこと  
  • 12. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   公式ドキュメント以外ほぼ情報がない   !  当時国内にほとんど情報はなかった…   ⁃  BigQueryやRedshiftについてはググれば情報はか なりでてくるのに   ⁃  海外ではカンファレンスも開催されている   !  最初はCommunity  Editionで保守もなくひたす らドキュメントを読み検証してました   !  はまりどころ多数   12  
  • 13. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   データの投⼊入時に注意すること   !  ⼤大量量のデータ投⼊入でINSERTは遅いのでCOPYか INSERT  SELECTを使う   !  データ投⼊入時に⽋欠損が⽣生じることがある   ⁃  型が⼀一致していないレコードは捨てられてしまう   ⁃  ABORT  ON  ERRORをオプションとしてつけるこ とによりエラーの検知   ⁃  COPY  REJECTED  DATA  and  EXCEPTIONSなど をつかいデバッグを⾏行行う   13  
  • 14. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   テーブル定義変更更時の注意事項   !  カラムをテーブルに追加したい   ⁃  末尾にしか追加できません   !  型の変更更を⾏行行いたい   ⁃  分散キー(segment  key)に⼊入ってるカラムの型は 変更更ができない   •  プロジェクションを作り直すことにより分散キーから外してALTERを⾏行行う   •  新しくテーブルを作り直しSELECT  INSERTでデータを⼊入れ直すときにキ ャストを⾏行行う     14  
  • 15. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   利利⽤用者の拡⼤大に伴い様々な問題発⽣生   !  増え続けていくデータ   !  リソースが⾜足りずクエリが実⾏行行できない   !  メタデータへのアクセスが異異常に遅い   !  サービスの成⻑⾧長につれて遅くなるクエリ   15  
  • 16. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   16   各⽉月でのスキーマ毎のデータ量量   増え続けていくデータ  
  • 17. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   なぜ使⽤用容量量が増え続けるのか   !  アナリストが⾃自主的に容量量に気を配ってくれない   ⁃  データの取り込みをしている⼈人と利利⽤用者が違って いるのであまり容量量を意識識しない   ⁃  本来の分析に集中したい   ⁃  データ整備に時間をなるべく割きたくない   !  Hadoopとは絶対的な容量量が違う   ⁃  Hadoopのように全てを⼊入れておけるわけではない   ⁃  保持期限の設定、必要データの選択が必要   17  
  • 18. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   スキーマ、テーブル単位で容量量の⾒見見える化   18   ユーザにどの程度度使ってい るのか意識識してもらう   ・急激にデータが増える ことは減った   ・どのデータをどの程度度 持つのか利利⽤用ユーザが考 えるようになった  
  • 19. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   ある⽇日から突然JOBが 実⾏行行できなくなったん ですけど・・・   19  
  • 20. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   リソースが⾜足りずクエリが実⾏行行できない   !  導⼊入からしばらくはリソースの管理理をあまり⾏行行 っていなかった   !  あるクエリが⻑⾧長時間リソースの占拠をしており 、他のクエリはキューに⼊入ったままで実⾏行行でき なくなっていた   !  ⼀一⼈人が無茶茶なクエリを実⾏行行すると全体に迷惑が かかる   20  
  • 21. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   リソースの制御により暴暴⾛走を防ぐ   !  Resource  Poolによる制限   ⁃  メモリ、並列列度度、実⾏行行時間、優先度度等を管理理できる   ⁃  独⾃自に定義してどのユーザに割り当てるのか設定可 能   ⁃  設定を⾏行行わないとdefault  poolが使⽤用される   !  ユーザ単位でもメモリの量量や実⾏行行時間は別途制 御することができる   21   Resource  Poolを適切切に設計することで多 くのユーザに安全に使ってもらえる  
  • 22. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Resource  Pool設計の考えかた   !  Resource  Poolの数が増えすぎるとリソースの管 理理が難しくなるのであまり増やしすぎない   !  メモリの最⼤大使⽤用量量、キューへのたまり具合を ⾒見見ながらチューニングを⾏行行う   !  重要なクエリについてはリソースをあらかじめ わけて確保することにより実⾏行行を保証する   22  
  • 23. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   dnやdtでスキーマ、 テーブル⼀一覧を出すの が異異常に遅い   23  
  • 24. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   メタデータへのアクセスが遅かった原因   !  Community  Edition時にパフォーマンス向上を 期待してパラメータの変更更を⾏行行っていた   ⁃  MaxROSPerStratum、SortWorkerThreads   !  これが原因で平常時でもCPUが使われておりパ フォーマンスの劣劣化に   !  デフォルトの設定に戻したところ平常時のCPU 使⽤用率率率は下がりメタデータへのアクセス速度度改善   !  Change_̲under_̲support_̲guidanceを変える場 合は悪影響のおそれがあるので相談した⽅方が良良い   24  
  • 25. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   徐々に遅くなっていくクエリ   !  サービスリリース当初はデータも⼩小さく⾼高速に集 計が⾏行行えていた   !  リリース後ユーザ数の増加、蓄積されたデータ量量 の増加により徐々に定常クエリが遅くなっていく   !  アドホックな分析をするにもデータがでかく即座 に結果をえられない   25   データが⼤大きくなってくると   何も考えず作ったテーブルでは限界に  
  • 26. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   プロジェクション   !  Verticaではクエリを⾼高速化するためにプロジェ クションを理理解しておくことが重要   !  並び順、分散キー、圧縮の⽅方法を指定すること が可能   !  ⼀一つのテーブルに対して複数のプロジェクショ ンが作成できる   !  特定のクエリに特化したプロジェクションを作 成することでクエリの⾼高速化が⾏行行える   26  
  • 27. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   プロジェクションの改善   !  テーブル数が多くすべてを⾒見見るのはつらいので、 遅いクエリに対してプロジェクションの作成を⾏行行う   !  Explainの結果を⾒見見ながらプロジェクションを考え る   ⁃  SORT,  SEGMENT,  ENCODINGの指定   ⁃  ⼩小さなマスターテーブルはJOINを考え全ノードに分 散させずにおく   ⁃  ENCODINGは絞り込みに使うカラムをRLEに   27  
  • 28. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   Database  Designer   !  データの特性、実⾏行行されるクエリから良良さそう なプロジェクションを⾃自動で作成できる   !  全てを⼿手作業で作成するのは難しいし、時間が かかりすぎるのでDatabase  Designerの利利⽤用   !  作成された物についておかしな物がないか⼀一度度 確認してから本番にデプロイする   28   Database  Designerの利利⽤用によって   プロジェクションの作成が簡単に  
  • 29. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   監視の重要性   !  利利⽤用者も管理理者もまだなれていないシステム   !  バッドノウハウ的な物がまだあまりないのでど こで問題が起きるかわからない   !  問題発⽣生時にすぐ調査できるように様々な⾓角度度 から情報を集めておいたほうがよい   29  
  • 30. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   DataCollectorによる情報の収集   !  Vertica⾃自⾝身で様々な情報の取得を取得している   !  システムテーブルの中⾝身はDataCollectorで取得 した情報を参照している物が多い   !  保存期間が短いので適宜のばす   ⁃  SET_̲DATA_̲COLLECTOR_̲POLICY   !  システムテーブルは内部ではファイルアクセス をしており遅いので⼯工夫が必要   ⁃  別途テーブルにコピーして⾼高速にアクセス   30  
  • 31. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   その他の監視   !  スロークエリの⼀一覧を出し常に改善を⾏行行う   !  ベンチマーククエリを定期実⾏行行してクラスタに 負荷がかかっていないか調べる   !  CPU,  memory,  IO,  network   ⁃  Sarでデータの取得   ⁃  負荷調査   31  
  • 32. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   まとめ   !  データが必要以上に増えすぎないような⼯工夫   ⁃  どのサービスでどのくらいの量量を使っているか⾒見見え る化を⾏行行い、利利⽤用ユーザにも注意を払ってもらうこ とが必要   !  リソースを制御することで安全に多くの⼈人が使える   ⁃  Resource  Poolを適切切に設計することでいけてない クエリの与える影響範囲を限定的に   !  パラメータ変更更による悪影響の恐れ   ⁃  Change_̲under_̲support_̲guidanceを変更更するとき には事前に相談をした⽅方がよい   32  
  • 33. Copyright  (C)  DeNA  Co.,Ltd.  All  Rights  Reserved.   まとめ   !  プロジェクション作成によるクエリの⾼高速化   ⁃  遅いクエリにはプロジェクションを作成してくク エリを⾼高速化できる   ⁃  Database  Designerを使⽤用すると⼿手軽にプロジェ クション作成ができ便便利利   !  問題発⽣生時に調査しやすいようデータはいろい ろな⾓角度度から集めておく   33