SlideShare a Scribd company logo
1 of 39
Download to read offline
Zabbixによる
Hadoop/HBaseの監視
    Hadoop/HBaseの運用におけるZabbixの活用事例




日本ヒューレット・パッカード株式会社
テクノロジーコンサルティング統括本部
データセンターソリューション第一本部
コアテクノロジー部
石田精一郎


1    © Copyright 2012 Hewlett-Packard Development Company, L.P.
                 2011
本日のお題

•   お話ししたい内容
•   Hadoop/HBase概要
•   Hadoop/HBaseの監視と運用
•   Hadoop監視プラグインの中身
•   Hadoop監視を効率化するZabbixの機能
•   まとめ
•   Appendix
    – インフラエンジニアなら監視しておきたいHadoopメトリクス

    – HP     サービス紹介




2   © Copyright 2012 Hewlett-Packard Development Company, L.P.
お話ししたい内容

•   HPのZabbix活用事例
    – なぜ、ZabbixをHadoop監視のプラットフォームに採用したのか

    – Zabbixを監視に利用することでのメリット



•   インフラの観点からのHadoop
    – MapReduceを使ったアプリケーションの組み方や活用事例の情報に対し、Hadoop運用面で
      のノウハウはあまり公開されていない?
    – Hadoop運用の一例としてZabbixを使った監視方法をご紹介



    – HBaseのアーキテクチャについては、今回はほとんどお話ししないので、それを知りたい方は
      OSCでの発表資料をご参照ください。
       •   今話題のHadoop HBaseの性能検証結果とZabbixによる性能監視のご紹介
       •   http://www.ospn.jp/osc2012-spring/modules/xfsection/article.php?articleid=6



    ※今回の資料はZabbix 1.8、CDH3u1以降を対象にしています。ご了承ください。
3   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop/HBase概要




4   © Copyright 2012 Hewlett-Packard Development Company, L.P.
                2011
Hadoopシステム構成
                                                                  クライアント/データソース




                                                                     Hadoop
Name Node/JobTracker                                                  クラスタ
役割:メタデータの保持、DataNodeの状態管理
   MapReduceジョブの管理

Map/Reduce :複数のサーバで分散処理することで高性能を実現
HDFS( Hadoop Distributed File System)
ファイルを分割して複数のサーバに複製して保持することで冗長性を担保




                                  Data Node/TaskTracker
                                  データの保持と分散処理を、スケールアウト構成で実現

 5   © Copyright 2012 Hewlett-Packard Development Company, L.P.
HBaseとは

「HDFS上に構築された列指向データベース」
    冗長化、永続性、データ一貫性、スケールアウト、複雑なデータの操作を実
          現したBigData用の高機能KVS(Key Value Store)


– 特徴
         – データをHadoop 分散ファイルシステム上に保存することで冗長化と永
           続性を実現
         – ノードを追加することでリニアにスケールアウト
         – 行単位のロック操作でデータ一貫性を保証
         – 複雑なデータを柔軟に操作するために、カラム・ファミリーを採用


6
6   © Copyright 2012 Hewlett-Packard Development Company, L.P.
HBaseの基本構成例
HBaseの基本構成例
                                                                                                •    Hadoopの基本構成にHBase
                                                                                                     関連のサービスを追加する。
                                                                                                •    HBase Masterは2台のAct-Act
       NN                                                                                            で冗長化。
    Zookeeper
                          NN(Stb)                                                               •    ZookeeperはHBaseクラスタ管
                                                            JT, SNN(Stb)         SNN, JT(Stb)
                        HBase Master                                              Zookeeper          理を行うサービス。クウォーラ
                                                            HBase Master
                         Zookeeper                                                                   ムを確保するため、ノードは3
                                                                                                     台以上の奇数で構成。
                                                                                                •    HBaseのデータを保存する
       DN, TT                             DN, TT                      DN, TT
     Regionserver                       Regionserver                Regionserver                     Regionserverは、Datanodeと
                                                                                                     同居させる。
                DN, TT                             DN, TT                    DN, TT             •    スレーブノードは最低3台から。
              Regionserver                       Regionserver              Regionserver
                                                                                                    【略記・凡例】
                                                                                                    Namenode: NN
                                                                                                    Secondary Namenode: SNN
                                                                                                    Jobtracker: JT
                                                                                                    Datanode: DN
                                                                                                    Tasktracker: TT
                                                                                                    ※赤字がHBase関連サービス
7
7    © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop/HBaseの監視と運用




8   © Copyright 2012 Hewlett-Packard Development Company, L.P.
                2011
Hadoop導入に立ちはだかる運用の課題
Hadoopの運用はどうしたらよいのか?

•   Hadoopを企業が本格導入するにあたっての課題は「運用」
    – Hadoopの運用のノウハウの不足

    – 大量のサーバが協調動作するシステムをどのように監視するのか

    – 一般的に見ても、分散処理基盤の運用は難しい



                                                                              JVM

                                                                        メモリ
                                                                                            JVM
                                                                                HDD
                                                                                      メモリ
                                                                       JVM
                                                                                              HDD
                                                                 メモリ


                                                                        HDD


9   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoopが持っている管理機能
Hadoopは豊富な管理機能を備えたミドルウェア

•    Hadoopには、管理用のWeb UIが付属
     – Web        UIにアクセスすることで各サービスの統計情報が取得可能
     – Hadoop特有の性能監視、障害監視に必要な情報はWeb                                  UIを通じて外部に提供されている

                                                                             TaskTrackerの状態と
                                                                             MapReduceジョブの
                                                                             進行状況を表示




                                        HDFSの使用状況と
                                        Datanodeの状態を表示

                                                                  JobTracker Web UI
                   Namenode Web UI
10   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop統計情報(メトリクス)の取得
Hadoopの統計情報は外部からJSON形式で取得可能

•    Hadoopが保持している統計情報は管理ポートから取得可能
     – メトリクス情報収集機能を有効化
        •   /etc/hadoop/conf/hadoop-metrics.propertiesに以下を設定
               –   org.apache.hadoop.metrics.spi.NoEmitMetricsContext
               –   org.apache.hadoop.metrics.ganglia.GangliaContext31           HBaseの場合は、キャッシュ
     – 管理ポートにアクセスして、JSON形式で情報を取得                                                容量、キャッシュヒット率など、
        $ curl http://<host>:<port>/metrics?format=json
                                                                                約160項目のメトリクスが取
                                                                                得できる
        ⇒JSON形式でメトリクス情報が返される。


        <port>
               Namenode: 50070
               Datanode: 50075
                                                                    {"hbase":{"info":[],"regionserver":[[{"Regio
                                                                    nServer":"regionserver60020","hostName"
               Secondary Namenode: 50090
                                                                    :"hbase01.hadoop.local"},{"blockCacheCo
               JobTracker: 50030                                    unt":0,"blockCacheEvictedCount":0,"block
               TaskTracker: 50060                                   CacheFree":7793333312,"blockCacheHitC
               HBase Master: 60010                                  achingRatio":0…
               HBase Regionserver: 60030


11   © Copyright 2012 Hewlett-Packard Development Company, L.P.
既存のHadoop監視ソリューション
Ganglia/Nagiosがデファクトスタンダードだが、課題も多い

•    Hadoop監視ではGangliaとNagiosの組み合わせがデファクトスタンダード
     – しかし、実運用を考えた際にいくつかの難点あり

•    GangliaとNagiosの組み合わせの課題
     – Gangliaは、クラスタ全体の傾向を把握することが得意だが、小回りが利きにくい
        •   監視の粒度
        •   画面のカスタマイズ

     – Nagiosによる監視とGangliaが収集した情報と連動していない
        •   Ganglia/Nagiosの組み合わせでは、監視や情報収集ができない部分が存在する
        •   監視設定の追加には、それぞれ別に作りこみが必要

     – 日本国内のエンタープライズ環境では、Ganglia/Nagiosが使われる局面が少ない
        •   一般的な情報、サポート体制等に課題
        •   HadoopだけのためにGanglia/Nagiosを入れる???




12   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Zabbix向けHadoopプラグイン開発
•    Zabbixの選択理由
     •      日本国内で人気があり、コミュニティが活発なOSS統合監視ソフト
     •      性能監視と障害通知が1つのソフトで可能。
     •      カスタマイズが容易。集めた情報をグルーピングして一覧表示可能
•    ⇒まず社内検証で使用し、検証時のフィードバックを通じてブラッシュアップ




13       © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop監視プラグインの中身




14   © Copyright 2012 Hewlett-Packard Development Company, L.P.
                 2011
Hadoop監視プラグイン概要
                                                                                            HPにて開発した
                                                 ③収集した情報をZabbix                         HP Hadoop監視プラグイン
                                                 のキーに変換してZabbix
                                                 に登録
                                                                                    Hadoop
                                                                                    マスター
                Zabbixサーバ

                 Hadoop                                                    Hadoop            Hadoop
               監視テンプレート                                                    スレーブ              スレーブ

                                                                                             Hadoop
                                 Hadoop                                    Hadoop
                                                                                             スレーブ
                               ステータスモニタ                                    スレーブ

                        監視サーバ                                                  Hadoopクラスタ
①Zabbixサーバが
Hadoopステータス
モニタを実行                                                            ②Hadoopの管理
                                                                  ポートからメトリクス
                                                                  情報を収集
15   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop監視プラグイン動作内容詳細
Zabbixの一般的な監視項目追加の手法を踏襲して実装

•    「外部チェック」(ExternalScript)機能で、情報取得スクリプトを起動
     – 設定例)
        •    get_hadoop_metrics.pl[{HOST.DNS} {$TASKTRACKERPORT}]
            →管理ポートにアクセスして情報取得するスクリプトを登録

     – 情報取得スクリプトがHadoopデーモンから情報を取得し、Zabbix                          Senderで一括登録
        •   監視対象のデーモンへのアクセスは1回のみ
        •   一括登録のため、アイテム数が多くなってもZabbixサーバの負荷が相対的に少ない



•    一部のアイテムは、管理ポートではなく“hadoop”コマンド等から取得
     – メトリクスのみからでは取得が難しい一部の項目はHadoopの管理コマンドから情報取得




16   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop監視を効率化する
Zabbixの機能




17   © Copyright 2012 Hewlett-Packard Development Company, L.P.
                 2011
Hadoop監視を効率化するZabbixの機能
Hadoop監視プラグインで収集した情報を生かすZabbixの機能

•    「グラフ」(複数アイテムのグラフ描画)
•    「Zabbixアグリゲート」(ホストグループ単位の集計機能)
•    「スクリーン」(運用画面作成機能)
•    「ディスカバリ」、「自動登録」(自動ホスト追加)
•    「トリガー」、「アクション」(障害通知)




18   © Copyright 2012 Hewlett-Packard Development Company, L.P.
「グラフ」(複数アイテムのグラフ描画)
関連する監視項目を一つのグラフに                                                                          ドラッグ&ドロップ
                                                            グラフは各アイテ                      で表示範囲を指定
                                                            ム単位。表示期間
                                                            は固定値から選択




                                                                       Zabbix 1.8.9 + Hadoop プラグインでの表示例
                    Ganglia 3.1.7 での表示例

        • Zabbixの「グラフ」機能を用いることで関連するメトリクスを一つのグラ
        フに集約表示
        • グラフの中から見たい期間をドラッグ&ドロップで指定できるため、ジョ
        ブ実行結果や障害時の解析の労力を大幅削減

19   © Copyright 2012 Hewlett-Packard Development Company, L.P.
「Zabbixアグリゲート」(ホストグループ単位の集計機能)
スレーブサーバの負荷の概要を把握
                                                                  平均に加えて最小、最大
                                                                  を表示することでj負荷の
                                                                  偏りを把握




              Hadoop スレーブサーバの
                                                                   クラスタ中のHBase Regionserverにおける
              CPU Load 平均のグラフ                                      Region数の平均値、最大値、最小値のグラフ


 • 「Zabbixアグリゲート」の機能を使うことで任意の単位で平均値、最大値、
   最小値を計算し、グラフ化。クラスタ全体の傾向を一目で把握
            • 「Zabbixアグリゲート」設定例
                • grpavg["Hadoop Slaves","system.cpu.load[,avg1]“
                • grpmax["Hadoop Slaves","hbase.regionserver.regions"


20   © Copyright 2012 Hewlett-Packard Development Company, L.P.
「スクリーン」(運用画面作成機能)
                                                                  グラフ
Zabbix上でのHBaseメトリクス表示例




     • 作成したグラフは、Zabbixの「スクリーン」機能で一度に表示可能
     • 必要な情報だけをまとめて一画面で確認可能
     • 「グラフ」同様、過去の任意の期間にさかのぼることもできる
21   © Copyright 2012 Hewlett-Packard Development Company, L.P.
「スクリーン」(運用画面作成機能)
クラスタ全体リソース使用状況とイベント通知の統合



                                                                          グラフ




                                                    図をいれるエリア
                                                 この枠線は削除してください。
                                          できるだけこの外枠からはみ出さないように配置してください。   シンプル
                                                                          テキスト



                                                                          イベント




22   © Copyright 2012 Hewlett-Packard Development Company, L.P.
「スクリーン」(運用画面作成機能)
社内試験の際にはMRジョブの状況とサーバ負荷状況を一画面で確認

                                                                  Hadoop JobTracker
                                                                  Web UIを呼び出して
                                                                  一画面に統合




                                                                  スレーブサーバのリ
                                                                  ソース使用量の平均
                                                                  値を表示




                                                                  カスタマイズが容易な
                                                                  ので、必要に応じて運
                                                                  用画面を作成できる
23   © Copyright 2012 Hewlett-Packard Development Company, L.P.
「ディスカバリ」、「自動登録」(自動ホスト追加)
ディスカバリ機能、自動登録機能を用いてスレーブサーバを自動登録


     •      Zabbixでは、「ディスカバリ」(サーバからの探索)と「自動登録」(エージェン
            トからの通知)という2つの方式で監視対象の自動追加が可能
     •      これらの設定をしておくことにより、Hadoopスレーブサーバを追加した際の
            監視対象自動追加を実現




24       © Copyright 2012 Hewlett-Packard Development Company, L.P.
「トリガー」、「アクション」(障害通知)
収集した情報に対し、さまざまな条件を設定して通知を行うことができる

•    収集したすべての情報に対して、しきい値を設定(「トリガー」)し、それにひ
     もづく「アクション」を設定可能
     – メール通知

     – コマンド実行                      など

•    追加で監視したい項目があった場合は、GUIから随時追加可能
•    「トリガー」には単純なしきい値に加え、計算式も使用可能
•    メンテナンス時には障害通知の抑制ができる(「メンテナンス」)
•    上位の監視サーバへのメッセージ転送も可能




25   © Copyright 2012 Hewlett-Packard Development Company, L.P.
まとめ
Zabbixで監視することで、Hadoopをインフラエンジニアに身近なものに

•    Zabbixの優れた機能を活用することでHadoop統合監視を実現
     – 拡張性の高さを生かしたプラグイン開発

     – グラフ、スクリーン等の優れたUIの活用

     – ホストの自動登録によるノード追加時の負荷軽減

•    Hadoopが持っている豊富な管理機能を活用
     – 管理に必要な情報は取得可能

     – それを有効活用するノウハウの蓄積が重要

•    Zabbixを使用することで、Hadoopも従来のサーバ群と同様に管理可能に
     – 同様の手法を用いることで、そのほかのミドルウェア、サービスも監視可能




26   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Appendix
インフラエンジニアなら
監視しておきたいHadoopメトリクス




27   © Copyright 2012 Hewlett-Packard Development Company, L.P.
                 2011
監視しておきたいメトリクス
Namenode編

•    HDFSの容量に関するメトリクス
     – dfs.FSNamesystem.CapacityRemainingGB

     – dfs.FSNamesystem.CapacityTotalGB

     – dfs.FSNamesystem.CapacityUsedGB
     ※”hadoop dfsadmin –report”コマンドからも取得可能



•    HDFSのヘルスチェックに関するメトリクス
     – dfs.FSNamesystem.CorruptBlocks

     – dfs.FSNamesystem.ExcessBlocks

     – dfs.FSNamesystem.MissingBlocks
     ※”hadoop fsck”コマンドからも取得可能




28   © Copyright 2012 Hewlett-Packard Development Company, L.P.
監視しておきたいメトリクス
Datanode編

•    HDFS IOの統計情報取得                                               •   HDFS IOの障害検知
     – dfs.datanode.blocks_read                                       – dfs.datanode.volumeFailures

     – dfs.datanode.blocks_removed                                    – dfs.datanode.block_verification_failures

     – dfs.datanode.blocks_replicated
                                                                  •   HDFS IOにかかった時間の取得
     – dfs.datanode.blocks_verified
                                                                      – dfs.datanode.readBlockOp_avg_time
     – dfs.datanode.blocks_written
                                                                      – dfs.datanode.copyBlockOp_avg_time
     – dfs.datanode.bytes_read
                                                                      – dfs.datanode.replaceBlockOp_avg_time
     – dfs.datanode.bytes_written
                                                                      – dfs.datanode.writeBlockOp_avg_time
     – dfs.datanode.reads_from_local_client

     – dfs.datanode.reads_from_remote_client

     – dfs.datanode.writes_from_local_client

     – dfs.datanode.writes_from_remote_client




29   © Copyright 2012 Hewlett-Packard Development Company, L.P.
監視しておきたいメトリクス
JobTracker編①

•    MapReduce Jobのキャパシティに関するメトリクス
     – mapred.jobtracker.trackers

     – mapred.jobtracker.trackers_blacklisted

     – mapred.jobtracker.trackers_decommissioned

     – mapred.jobtracker.map_slots

     – mapred.jobtracker.reduce_slots

     – mapred.jobtracker.reserved_map_slots

     – mapred.jobtracker.reserved_reduce_slots

     – mapred.jobtracker.occupied_map_slots

     – mapred.jobtracker.occupied_reduce_slots




30   © Copyright 2012 Hewlett-Packard Development Company, L.P.
監視しておきたいメトリクス
JobTracker編②

•    MapReduce Jobの実行状況に関するメトリクス
     – Job全体                                                      – Reduceタスク
        •   mapred.jobtracker.jobs_submitted                       •   mapred.jobtracker.waiting_reduces

        •   mapred.jobtracker.jobs_preparing                       •   mapred.jobtracker.reduces_launched
        •   mapred.jobtracker.jobs_running                         •   mapred.jobtracker.running_reduces
        •   mapred.jobtracker.jobs_completed                       •   mapred.jobtracker.reduces_completed

        •   mapred.jobtracker.jobs_failed                          •   mapred.jobtracker.reduces_failed
        •   mapred.jobtracker.jobs_killed                          •   mapred.jobtracker.reduces_killed
                                                                   •   mapred.jobtracker.blacklisted_reduces
     – Mapタスク
        •   mapred.jobtracker.waiting_maps
        •   mapred.jobtracker.maps_launched
        •   mapred.jobtracker.running_maps
        •   mapred.jobtracker.maps_completed
        •   mapred.jobtracker.maps_failed
        •   mapred.jobtracker.maps_killed
        •   mapred.jobtracker.blacklisted_maps




31   © Copyright 2012 Hewlett-Packard Development Company, L.P.
監視しておきたいメトリクス
TaskTracker編

•    各ノードのMapReduce Jobのキャパシティに関するメトリクス
     –   mapred.tasktracker.mapTaskSlots
     –   mapred.tasktracker.reduceTaskSlots

•    各ノードMapReduce Jobの実行状況に関するメトリクス
     –   mapred.tasktracker.maps_running
     –   mapred.tasktracker.reduces_running
     –   mapred.tasktracker.tasks_completed
     –   mapred.tasktracker.tasks_failed_ping
     –   mapred.tasktracker.tasks_failed_timeout

•    TasklTrackerがハンドルしているMapperのShuffle出力
     –   mapred.shuffleOutput.shuffle_failed_outputs
     –   mapred.shuffleOutput.shuffle_handler_busy_percent
     –   mapred.shuffleOutput.shuffle_output_bytes
     –   mapred.shuffleOutput.shuffle_success_outputs


32   © Copyright 2012 Hewlett-Packard Development Company, L.P.
監視しておきたいメトリクス
全Hadoopサービス共通編

•    各JVMのヒープメモリ使用状況に関するメトリクス
     – jvm.<ProcessName>.metrics.maxMemoryM

     – jvm.<ProcessName>.metrics.memHeapCommittedM

     – jvm.<ProcessName>.metrics.memHeapUsedM

•    各JVMのGCに関するメトリクス
     – jvm.<ProcessName>.metrics.gcCount

     – jvm.<ProcessName>.metrics.gcTimeMillis

•    Hadoopデーモンが出力したログの行数のメトリクス
     – jvm.<ProcessName>.metrics.logInfo

     – jvm.<ProcessName>.metrics.logWarn

     – jvm.<ProcessName>.metrics.logError

     – jvm.<ProcessName>.metrics.logFatal




33   © Copyright 2012 Hewlett-Packard Development Company, L.P.
そのほかのHadoopメトリクス関連Tips

•    HBase固有のメトリクス
     – HBase固有のメトリクスは、以下のサイトにまとめられています。
        •   HBase Book, Chapter 13. HBase Operational Management
               –   13.4. HBase Metrics
               –   http://hbase.apache.org/book/hbase_metrics.html

     – HBaseは非常に多くのメトリクスがあり、運用やベンチマークに有用な情報が取得できます。

•    rpc.metricsとrpc.detailed-metrics
     – rpc.metricsとrpc.detailed-metrics                           は、全サービスに共通するメトリクス項目です。
     – Hadoopのrpc.metricsの詳細は以下に掲載されています。
        •   https://issues.apache.org/jira/browse/HADOOP-6599

     – rpc.detailed-metricsは、該当のメソッド実行時に以下の通りにカウンタが作られます。
        •   rpc.detailed-metrics.<メソッド名>_num_ops: 該当RPCメソッド実行回数
        •   rpc.detailed-metrics.<メソッド名>_avg_time: 該当PRCメソッド実行にかかった時間(ms)




34   © Copyright 2012 Hewlett-Packard Development Company, L.P.
Hadoop HBase サービス概要
     • 大規模分散処理プラットフォーム「Hadoop」をベースとして、ビッグデータ活用に最
       適化したITインフラを構築するソリューション
     • サーバー、データベース、運用ツールとあわせて、導入コンサルティングサービス
       も提供し、お客様のビッグデータ活用をワンストップで支援

                                           Hadoop HBase コンサルティングサービス
                                           •適用領域、既存システムの連携についてのヒアリングを実施
                                           •必要に応じて、導入前検証をHPソリューションセンターで実施


                                           Hadoop HBase導入支援サービス
                                           •ヒアリング内容に基づくサーバ構成の検討・設計
                                           •Hadoopに対応した全体アーキテクチャの設計・構築
                                           •性能測定・チューニング

                                           Hadoop HBase運用支援サービス
                                           •HP CMUおよびZabbix/Gangliaを使ったクラスタ運用基盤の構築
                                           •Hadoopクラスタ運用支援

3
35   © Copyright 2012 Hewlett-Packard Development Company, L.P.

5
HP ビッグデータ分析
コンサルティングサービス
                                               1. ディスカバリーワークショップ
                                               •お客様の業務、システム改善を目的に、最新製品およびテクノロジーの紹介
                                               •統計分析によるテキスト/ログなどの事例紹介及びデモの実施


                                               2. 分析支援コンサルティングサービス
                                               •お客様の業務やシステムの全体像の把握、PDCAを回す全体設計
                                               •今後の対応策、予算規模、スケジュールなど上申書のもととなる情報を作成
                                               •システムの将来像とロードマップの策定及び、全体の参考価格も算出

                                               3. 分析システム導入支援サービス
                                               •策定したシステムの将来像に向けて、システム全体の要件定義、システム設計、
                                                システム構築サービスを提供
                                               •事前検証を実施

                                               4. 分析システム運用支援サービス
                                               •システム運用時の支援を実施



3
36   © Copyright 2012 Hewlett-Packard Development Company, L.P.

6
HP ビッグデータバッチ処理高速化
コンサルティングサービス
                                           1. バッチ処理高速化コンサルティングサービス
                                           •お客様にもアセスメントに参加して頂き、既存システムの問題点を的確に把握



                                           2. バッチ処理高速化システム導入支援サービス
                                           • アーキテクチャ、運用、監視などのシステム設計を実施
                                           • 機能テストや、性能テスト、負荷テスト、耐久テストなどを実施
                                           • 顧客毎のシステム要件にしたがいプログラミングを日本HPで行う

                                           3. バッチ処理高速化システム運用支援サービス
                                           • システム運用時の支援を実施



        成果物:                        既存システム問題解析結果報告書               システム監視手順書
                                    システム設計書                       テスト結果報告書
                                    システム運用手順書                     システム支援報告書

3
37   © Copyright 2012 Hewlett-Packard Development Company, L.P.

7
Hadoopだけでなく、関連するオープンソースソフトウェアを含めた
トータルサポート
                                                                    Web
Java AP                                                                                      Management
                                                                        Apache http server
             Tomcat, JBoss
            JVM (OpenJDK)                                                                          Nagios, ZABBIX

                                                  BigData

                                                                     Hadoop
 HA                                                                                           OS

                                                                                                FreeBSD, CentOS
      DRBD, Heart Beat
                                                                   DB                            Debian, Ubuntu


                                                                   MySQL, Postgre SQL



338              ワンストップで、トータルサポートを提供
      © Copyright 2012 Hewlett-Packard Development Company, L.P.
Thank you




39   © Copyright 2012 Hewlett-Packard Development Company, L.P.

More Related Content

What's hot

CDH4.1オーバービュー
CDH4.1オーバービューCDH4.1オーバービュー
CDH4.1オーバービューCloudera Japan
 
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera Japan
 
Java EE7 䛸㻌JCache 
Java EE7 䛸㻌JCache Java EE7 䛸㻌JCache 
Java EE7 䛸㻌JCache maruyama097
 
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」(株)TAM
 
シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~
シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~
シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~Kimihiko Kitase
 
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」(株)TAM
 
OSC2011 Tokyo/Spring Hadoop入門
OSC2011 Tokyo/Spring Hadoop入門OSC2011 Tokyo/Spring Hadoop入門
OSC2011 Tokyo/Spring Hadoop入門Shinichi YAMASHITA
 
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)Akira Shimosako
 
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」(株)TAM
 
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12MapR Technologies Japan
 
Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析shuichi iida
 
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-Yuki Gonda
 
AspectJを用いた大規模分散システムHadoopの監視とプロファイリング
AspectJを用いた大規模分散システムHadoopの監視とプロファイリングAspectJを用いた大規模分散システムHadoopの監視とプロファイリング
AspectJを用いた大規模分散システムHadoopの監視とプロファイリングYusuke Shimizu
 
Hadoop Hack Night Vol. 2
Hadoop Hack Night Vol. 2Hadoop Hack Night Vol. 2
Hadoop Hack Night Vol. 2Yoji Kiyota
 
Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理Yoji Kiyota
 
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジLINE Corporation
 
Cloudera Impala Seminar Jan. 8 2013
Cloudera Impala Seminar Jan. 8 2013Cloudera Impala Seminar Jan. 8 2013
Cloudera Impala Seminar Jan. 8 2013Cloudera Japan
 
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13wスケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13wCloudera Japan
 

What's hot (20)

CDH4.1オーバービュー
CDH4.1オーバービューCDH4.1オーバービュー
CDH4.1オーバービュー
 
Dsas周りのお話
Dsas周りのお話Dsas周りのお話
Dsas周りのお話
 
Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219Cloudera大阪セミナー 20130219
Cloudera大阪セミナー 20130219
 
Java EE7 䛸㻌JCache 
Java EE7 䛸㻌JCache Java EE7 䛸㻌JCache 
Java EE7 䛸㻌JCache 
 
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
 
シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~
シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~
シトリックスのクラウドソリューションで実現するオープンなクラウドサービス ~ CloudStack徹底活用法~
 
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
 
OSC2011 Tokyo/Spring Hadoop入門
OSC2011 Tokyo/Spring Hadoop入門OSC2011 Tokyo/Spring Hadoop入門
OSC2011 Tokyo/Spring Hadoop入門
 
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
 
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
 
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
 
Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析Hadoopを用いた大規模ログ解析
Hadoopを用いた大規模ログ解析
 
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-
 
AspectJを用いた大規模分散システムHadoopの監視とプロファイリング
AspectJを用いた大規模分散システムHadoopの監視とプロファイリングAspectJを用いた大規模分散システムHadoopの監視とプロファイリング
AspectJを用いた大規模分散システムHadoopの監視とプロファイリング
 
OSC2012 OSC.DB Hadoop
OSC2012 OSC.DB HadoopOSC2012 OSC.DB Hadoop
OSC2012 OSC.DB Hadoop
 
Hadoop Hack Night Vol. 2
Hadoop Hack Night Vol. 2Hadoop Hack Night Vol. 2
Hadoop Hack Night Vol. 2
 
Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理
 
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
100億超メッセージ/日のサービスを 支えるHBase運用におけるチャレンジ
 
Cloudera Impala Seminar Jan. 8 2013
Cloudera Impala Seminar Jan. 8 2013Cloudera Impala Seminar Jan. 8 2013
Cloudera Impala Seminar Jan. 8 2013
 
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13wスケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
スケーラブルなシステムのためのHBaseスキーマ設計 #hcj13w
 

Viewers also liked

全自動Zabbix2.2&2.4
全自動Zabbix2.2&2.4全自動Zabbix2.2&2.4
全自動Zabbix2.2&2.4真乙 九龍
 
ZabbixでDockerも監視
ZabbixでDockerも監視 ZabbixでDockerも監視
ZabbixでDockerも監視 Atsushi Tanaka
 
全自動Zabbix ver2
全自動Zabbix ver2全自動Zabbix ver2
全自動Zabbix ver2真乙 九龍
 
なぜApache HBaseを選ぶのか? #cwt2013
なぜApache HBaseを選ぶのか? #cwt2013なぜApache HBaseを選ぶのか? #cwt2013
なぜApache HBaseを選ぶのか? #cwt2013Cloudera Japan
 
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化真乙 九龍
 
新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi
新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi
新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumiItsuki Kuroda
 

Viewers also liked (8)

Zabbix概論
Zabbix概論Zabbix概論
Zabbix概論
 
全自動Zabbix2.2&2.4
全自動Zabbix2.2&2.4全自動Zabbix2.2&2.4
全自動Zabbix2.2&2.4
 
全自動Zabbix
全自動Zabbix全自動Zabbix
全自動Zabbix
 
ZabbixでDockerも監視
ZabbixでDockerも監視 ZabbixでDockerも監視
ZabbixでDockerも監視
 
全自動Zabbix ver2
全自動Zabbix ver2全自動Zabbix ver2
全自動Zabbix ver2
 
なぜApache HBaseを選ぶのか? #cwt2013
なぜApache HBaseを選ぶのか? #cwt2013なぜApache HBaseを選ぶのか? #cwt2013
なぜApache HBaseを選ぶのか? #cwt2013
 
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
Zabbixによるオートスケーリングクラスタ監視とオペレーション自動化
 
新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi
新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi
新規事業が対峙する現実からエンジニアリングを俯瞰する #devsumiB #devsumi
 

Similar to Zabbix jp勉強会 Hadoop-HBaseの監視_20120512

NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTT DATA OSS Professional Services
 
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practiceマルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best PracticeHadoop / Spark Conference Japan
 
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~Developers Summit
 
Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料Cloudera Japan
 
Hadoop operation chaper 4
Hadoop operation chaper 4Hadoop operation chaper 4
Hadoop operation chaper 4Yukinori Suda
 
20110517 okuyama ソーシャルメディアが育てた技術勉強会
20110517 okuyama ソーシャルメディアが育てた技術勉強会20110517 okuyama ソーシャルメディアが育てた技術勉強会
20110517 okuyama ソーシャルメディアが育てた技術勉強会Takahiro Iwase
 
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...MapR Technologies Japan
 
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)NTT DATA OSS Professional Services
 
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebminingImpala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebminingSho Shimauchi
 
Hadoop -ResourceManager HAの仕組み-
Hadoop -ResourceManager HAの仕組み-Hadoop -ResourceManager HAの仕組み-
Hadoop -ResourceManager HAの仕組み-Yuki Gonda
 
Hadoopとその周辺の紹介
Hadoopとその周辺の紹介Hadoopとその周辺の紹介
Hadoopとその周辺の紹介Shinya Okano
 
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料) 40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料) hamaken
 
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)NTT DATA OSS Professional Services
 

Similar to Zabbix jp勉強会 Hadoop-HBaseの監視_20120512 (20)

NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
 
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practiceマルチテナント Hadoop クラスタのためのモニタリング Best Practice
マルチテナント Hadoop クラスタのためのモニタリング Best Practice
 
Hadoop, NoSQL, GlusterFSの概要
Hadoop, NoSQL, GlusterFSの概要Hadoop, NoSQL, GlusterFSの概要
Hadoop, NoSQL, GlusterFSの概要
 
Distributed data stores in Hadoop ecosystem
Distributed data stores in Hadoop ecosystemDistributed data stores in Hadoop ecosystem
Distributed data stores in Hadoop ecosystem
 
日々進化するHadoopの 「いま」
日々進化するHadoopの 「いま」日々進化するHadoopの 「いま」
日々進化するHadoopの 「いま」
 
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
 
Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料Cloudera Manager4.0とNameNode-HAセミナー資料
Cloudera Manager4.0とNameNode-HAセミナー資料
 
Hadoop - OSC2010 Tokyo/Spring
Hadoop - OSC2010 Tokyo/SpringHadoop - OSC2010 Tokyo/Spring
Hadoop - OSC2010 Tokyo/Spring
 
Hadoop operation chaper 4
Hadoop operation chaper 4Hadoop operation chaper 4
Hadoop operation chaper 4
 
20110517 okuyama ソーシャルメディアが育てた技術勉強会
20110517 okuyama ソーシャルメディアが育てた技術勉強会20110517 okuyama ソーシャルメディアが育てた技術勉強会
20110517 okuyama ソーシャルメディアが育てた技術勉強会
 
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
 
Hadoop loves H2
Hadoop loves H2Hadoop loves H2
Hadoop loves H2
 
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
 
20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public20111130 10 aws-meister-emr_long-public
20111130 10 aws-meister-emr_long-public
 
Hadoop事始め
Hadoop事始めHadoop事始め
Hadoop事始め
 
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebminingImpala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
Impala データサイエンティストのための 高速大規模分散基盤 #tokyowebmining
 
Hadoop -ResourceManager HAの仕組み-
Hadoop -ResourceManager HAの仕組み-Hadoop -ResourceManager HAの仕組み-
Hadoop -ResourceManager HAの仕組み-
 
Hadoopとその周辺の紹介
Hadoopとその周辺の紹介Hadoopとその周辺の紹介
Hadoopとその周辺の紹介
 
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料) 40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
 
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
 

More from Seiichiro Ishida

CEO 3Dモデルお披露目兼会社説明会
CEO 3Dモデルお披露目兼会社説明会CEO 3Dモデルお披露目兼会社説明会
CEO 3Dモデルお披露目兼会社説明会Seiichiro Ishida
 
Infrastructure as code LT AWS + Ansibleのお悩み相談
Infrastructure as code LT AWS + Ansibleのお悩み相談Infrastructure as code LT AWS + Ansibleのお悩み相談
Infrastructure as code LT AWS + Ansibleのお悩み相談Seiichiro Ishida
 
Qpstudy201404 インフラ設計の勘所
Qpstudy201404 インフラ設計の勘所Qpstudy201404 インフラ設計の勘所
Qpstudy201404 インフラ設計の勘所Seiichiro Ishida
 
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」Seiichiro Ishida
 
Note difference between sysstat on cent os 5 & 6
Note  difference between sysstat on cent os 5 & 6Note  difference between sysstat on cent os 5 & 6
Note difference between sysstat on cent os 5 & 6Seiichiro Ishida
 
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウドOsc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウドSeiichiro Ishida
 
かるた工場作業一日目
かるた工場作業一日目かるた工場作業一日目
かるた工場作業一日目Seiichiro Ishida
 
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~Seiichiro Ishida
 
【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?Seiichiro Ishida
 
【Zabbix jp】明日から職場で使えるざびたん
【Zabbix jp】明日から職場で使えるざびたん【Zabbix jp】明日から職場で使えるざびたん
【Zabbix jp】明日から職場で使えるざびたんSeiichiro Ishida
 
【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022Seiichiro Ishida
 
サーバ擬人化ユーザ会Lt資料 qpstudy lite
サーバ擬人化ユーザ会Lt資料 qpstudy liteサーバ擬人化ユーザ会Lt資料 qpstudy lite
サーバ擬人化ユーザ会Lt資料 qpstudy liteSeiichiro Ishida
 
サーバ擬人化ユーザ会キックオフ資料 Slideshare ver
サーバ擬人化ユーザ会キックオフ資料 Slideshare verサーバ擬人化ユーザ会キックオフ資料 Slideshare ver
サーバ擬人化ユーザ会キックオフ資料 Slideshare verSeiichiro Ishida
 
俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり) 俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり) Seiichiro Ishida
 
俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがない俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがないSeiichiro Ishida
 
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理Seiichiro Ishida
 

More from Seiichiro Ishida (16)

CEO 3Dモデルお披露目兼会社説明会
CEO 3Dモデルお披露目兼会社説明会CEO 3Dモデルお披露目兼会社説明会
CEO 3Dモデルお披露目兼会社説明会
 
Infrastructure as code LT AWS + Ansibleのお悩み相談
Infrastructure as code LT AWS + Ansibleのお悩み相談Infrastructure as code LT AWS + Ansibleのお悩み相談
Infrastructure as code LT AWS + Ansibleのお悩み相談
 
Qpstudy201404 インフラ設計の勘所
Qpstudy201404 インフラ設計の勘所Qpstudy201404 インフラ設計の勘所
Qpstudy201404 インフラ設計の勘所
 
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
 
Note difference between sysstat on cent os 5 & 6
Note  difference between sysstat on cent os 5 & 6Note  difference between sysstat on cent os 5 & 6
Note difference between sysstat on cent os 5 & 6
 
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウドOsc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
 
かるた工場作業一日目
かるた工場作業一日目かるた工場作業一日目
かるた工場作業一日目
 
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
 
【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?【Hpcstudy】みんな、ベンチマークどうやってるの?
【Hpcstudy】みんな、ベンチマークどうやってるの?
 
【Zabbix jp】明日から職場で使えるざびたん
【Zabbix jp】明日から職場で使えるざびたん【Zabbix jp】明日から職場で使えるざびたん
【Zabbix jp】明日から職場で使えるざびたん
 
【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022【Qp08】ざびたん2リリース報告lt 20111022
【Qp08】ざびたん2リリース報告lt 20111022
 
サーバ擬人化ユーザ会Lt資料 qpstudy lite
サーバ擬人化ユーザ会Lt資料 qpstudy liteサーバ擬人化ユーザ会Lt資料 qpstudy lite
サーバ擬人化ユーザ会Lt資料 qpstudy lite
 
サーバ擬人化ユーザ会キックオフ資料 Slideshare ver
サーバ擬人化ユーザ会キックオフ資料 Slideshare verサーバ擬人化ユーザ会キックオフ資料 Slideshare ver
サーバ擬人化ユーザ会キックオフ資料 Slideshare ver
 
俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり) 俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない(おかわり)
 
俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがない俺のZabbixがこんなに可愛いわけがない
俺のZabbixがこんなに可愛いわけがない
 
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理
 

Recently uploaded

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 

Recently uploaded (9)

論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 

Zabbix jp勉強会 Hadoop-HBaseの監視_20120512

  • 1. Zabbixによる Hadoop/HBaseの監視 Hadoop/HBaseの運用におけるZabbixの活用事例 日本ヒューレット・パッカード株式会社 テクノロジーコンサルティング統括本部 データセンターソリューション第一本部 コアテクノロジー部 石田精一郎 1 © Copyright 2012 Hewlett-Packard Development Company, L.P. 2011
  • 2. 本日のお題 • お話ししたい内容 • Hadoop/HBase概要 • Hadoop/HBaseの監視と運用 • Hadoop監視プラグインの中身 • Hadoop監視を効率化するZabbixの機能 • まとめ • Appendix – インフラエンジニアなら監視しておきたいHadoopメトリクス – HP サービス紹介 2 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 3. お話ししたい内容 • HPのZabbix活用事例 – なぜ、ZabbixをHadoop監視のプラットフォームに採用したのか – Zabbixを監視に利用することでのメリット • インフラの観点からのHadoop – MapReduceを使ったアプリケーションの組み方や活用事例の情報に対し、Hadoop運用面で のノウハウはあまり公開されていない? – Hadoop運用の一例としてZabbixを使った監視方法をご紹介 – HBaseのアーキテクチャについては、今回はほとんどお話ししないので、それを知りたい方は OSCでの発表資料をご参照ください。 • 今話題のHadoop HBaseの性能検証結果とZabbixによる性能監視のご紹介 • http://www.ospn.jp/osc2012-spring/modules/xfsection/article.php?articleid=6 ※今回の資料はZabbix 1.8、CDH3u1以降を対象にしています。ご了承ください。 3 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 4. Hadoop/HBase概要 4 © Copyright 2012 Hewlett-Packard Development Company, L.P. 2011
  • 5. Hadoopシステム構成 クライアント/データソース Hadoop Name Node/JobTracker クラスタ 役割:メタデータの保持、DataNodeの状態管理 MapReduceジョブの管理 Map/Reduce :複数のサーバで分散処理することで高性能を実現 HDFS( Hadoop Distributed File System) ファイルを分割して複数のサーバに複製して保持することで冗長性を担保 Data Node/TaskTracker データの保持と分散処理を、スケールアウト構成で実現 5 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 6. HBaseとは 「HDFS上に構築された列指向データベース」 冗長化、永続性、データ一貫性、スケールアウト、複雑なデータの操作を実 現したBigData用の高機能KVS(Key Value Store) – 特徴 – データをHadoop 分散ファイルシステム上に保存することで冗長化と永 続性を実現 – ノードを追加することでリニアにスケールアウト – 行単位のロック操作でデータ一貫性を保証 – 複雑なデータを柔軟に操作するために、カラム・ファミリーを採用 6 6 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 7. HBaseの基本構成例 HBaseの基本構成例 • Hadoopの基本構成にHBase 関連のサービスを追加する。 • HBase Masterは2台のAct-Act NN で冗長化。 Zookeeper NN(Stb) • ZookeeperはHBaseクラスタ管 JT, SNN(Stb) SNN, JT(Stb) HBase Master Zookeeper 理を行うサービス。クウォーラ HBase Master Zookeeper ムを確保するため、ノードは3 台以上の奇数で構成。 • HBaseのデータを保存する DN, TT DN, TT DN, TT Regionserver Regionserver Regionserver Regionserverは、Datanodeと 同居させる。 DN, TT DN, TT DN, TT • スレーブノードは最低3台から。 Regionserver Regionserver Regionserver 【略記・凡例】 Namenode: NN Secondary Namenode: SNN Jobtracker: JT Datanode: DN Tasktracker: TT ※赤字がHBase関連サービス 7 7 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 8. Hadoop/HBaseの監視と運用 8 © Copyright 2012 Hewlett-Packard Development Company, L.P. 2011
  • 9. Hadoop導入に立ちはだかる運用の課題 Hadoopの運用はどうしたらよいのか? • Hadoopを企業が本格導入するにあたっての課題は「運用」 – Hadoopの運用のノウハウの不足 – 大量のサーバが協調動作するシステムをどのように監視するのか – 一般的に見ても、分散処理基盤の運用は難しい JVM メモリ JVM HDD メモリ JVM HDD メモリ HDD 9 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 10. Hadoopが持っている管理機能 Hadoopは豊富な管理機能を備えたミドルウェア • Hadoopには、管理用のWeb UIが付属 – Web UIにアクセスすることで各サービスの統計情報が取得可能 – Hadoop特有の性能監視、障害監視に必要な情報はWeb UIを通じて外部に提供されている TaskTrackerの状態と MapReduceジョブの 進行状況を表示 HDFSの使用状況と Datanodeの状態を表示 JobTracker Web UI Namenode Web UI 10 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 11. Hadoop統計情報(メトリクス)の取得 Hadoopの統計情報は外部からJSON形式で取得可能 • Hadoopが保持している統計情報は管理ポートから取得可能 – メトリクス情報収集機能を有効化 • /etc/hadoop/conf/hadoop-metrics.propertiesに以下を設定 – org.apache.hadoop.metrics.spi.NoEmitMetricsContext – org.apache.hadoop.metrics.ganglia.GangliaContext31 HBaseの場合は、キャッシュ – 管理ポートにアクセスして、JSON形式で情報を取得 容量、キャッシュヒット率など、 $ curl http://<host>:<port>/metrics?format=json 約160項目のメトリクスが取 得できる ⇒JSON形式でメトリクス情報が返される。 <port> Namenode: 50070 Datanode: 50075 {"hbase":{"info":[],"regionserver":[[{"Regio nServer":"regionserver60020","hostName" Secondary Namenode: 50090 :"hbase01.hadoop.local"},{"blockCacheCo JobTracker: 50030 unt":0,"blockCacheEvictedCount":0,"block TaskTracker: 50060 CacheFree":7793333312,"blockCacheHitC HBase Master: 60010 achingRatio":0… HBase Regionserver: 60030 11 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 12. 既存のHadoop監視ソリューション Ganglia/Nagiosがデファクトスタンダードだが、課題も多い • Hadoop監視ではGangliaとNagiosの組み合わせがデファクトスタンダード – しかし、実運用を考えた際にいくつかの難点あり • GangliaとNagiosの組み合わせの課題 – Gangliaは、クラスタ全体の傾向を把握することが得意だが、小回りが利きにくい • 監視の粒度 • 画面のカスタマイズ – Nagiosによる監視とGangliaが収集した情報と連動していない • Ganglia/Nagiosの組み合わせでは、監視や情報収集ができない部分が存在する • 監視設定の追加には、それぞれ別に作りこみが必要 – 日本国内のエンタープライズ環境では、Ganglia/Nagiosが使われる局面が少ない • 一般的な情報、サポート体制等に課題 • HadoopだけのためにGanglia/Nagiosを入れる??? 12 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 13. Zabbix向けHadoopプラグイン開発 • Zabbixの選択理由 • 日本国内で人気があり、コミュニティが活発なOSS統合監視ソフト • 性能監視と障害通知が1つのソフトで可能。 • カスタマイズが容易。集めた情報をグルーピングして一覧表示可能 • ⇒まず社内検証で使用し、検証時のフィードバックを通じてブラッシュアップ 13 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 14. Hadoop監視プラグインの中身 14 © Copyright 2012 Hewlett-Packard Development Company, L.P. 2011
  • 15. Hadoop監視プラグイン概要 HPにて開発した ③収集した情報をZabbix HP Hadoop監視プラグイン のキーに変換してZabbix に登録 Hadoop マスター Zabbixサーバ Hadoop Hadoop Hadoop 監視テンプレート スレーブ スレーブ Hadoop Hadoop Hadoop スレーブ ステータスモニタ スレーブ 監視サーバ Hadoopクラスタ ①Zabbixサーバが Hadoopステータス モニタを実行 ②Hadoopの管理 ポートからメトリクス 情報を収集 15 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 16. Hadoop監視プラグイン動作内容詳細 Zabbixの一般的な監視項目追加の手法を踏襲して実装 • 「外部チェック」(ExternalScript)機能で、情報取得スクリプトを起動 – 設定例) • get_hadoop_metrics.pl[{HOST.DNS} {$TASKTRACKERPORT}] →管理ポートにアクセスして情報取得するスクリプトを登録 – 情報取得スクリプトがHadoopデーモンから情報を取得し、Zabbix Senderで一括登録 • 監視対象のデーモンへのアクセスは1回のみ • 一括登録のため、アイテム数が多くなってもZabbixサーバの負荷が相対的に少ない • 一部のアイテムは、管理ポートではなく“hadoop”コマンド等から取得 – メトリクスのみからでは取得が難しい一部の項目はHadoopの管理コマンドから情報取得 16 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 17. Hadoop監視を効率化する Zabbixの機能 17 © Copyright 2012 Hewlett-Packard Development Company, L.P. 2011
  • 18. Hadoop監視を効率化するZabbixの機能 Hadoop監視プラグインで収集した情報を生かすZabbixの機能 • 「グラフ」(複数アイテムのグラフ描画) • 「Zabbixアグリゲート」(ホストグループ単位の集計機能) • 「スクリーン」(運用画面作成機能) • 「ディスカバリ」、「自動登録」(自動ホスト追加) • 「トリガー」、「アクション」(障害通知) 18 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 19. 「グラフ」(複数アイテムのグラフ描画) 関連する監視項目を一つのグラフに ドラッグ&ドロップ グラフは各アイテ で表示範囲を指定 ム単位。表示期間 は固定値から選択 Zabbix 1.8.9 + Hadoop プラグインでの表示例 Ganglia 3.1.7 での表示例 • Zabbixの「グラフ」機能を用いることで関連するメトリクスを一つのグラ フに集約表示 • グラフの中から見たい期間をドラッグ&ドロップで指定できるため、ジョ ブ実行結果や障害時の解析の労力を大幅削減 19 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 20. 「Zabbixアグリゲート」(ホストグループ単位の集計機能) スレーブサーバの負荷の概要を把握 平均に加えて最小、最大 を表示することでj負荷の 偏りを把握 Hadoop スレーブサーバの クラスタ中のHBase Regionserverにおける CPU Load 平均のグラフ Region数の平均値、最大値、最小値のグラフ • 「Zabbixアグリゲート」の機能を使うことで任意の単位で平均値、最大値、 最小値を計算し、グラフ化。クラスタ全体の傾向を一目で把握 • 「Zabbixアグリゲート」設定例 • grpavg["Hadoop Slaves","system.cpu.load[,avg1]“ • grpmax["Hadoop Slaves","hbase.regionserver.regions" 20 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 21. 「スクリーン」(運用画面作成機能) グラフ Zabbix上でのHBaseメトリクス表示例 • 作成したグラフは、Zabbixの「スクリーン」機能で一度に表示可能 • 必要な情報だけをまとめて一画面で確認可能 • 「グラフ」同様、過去の任意の期間にさかのぼることもできる 21 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 22. 「スクリーン」(運用画面作成機能) クラスタ全体リソース使用状況とイベント通知の統合 グラフ 図をいれるエリア この枠線は削除してください。 できるだけこの外枠からはみ出さないように配置してください。 シンプル テキスト イベント 22 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 23. 「スクリーン」(運用画面作成機能) 社内試験の際にはMRジョブの状況とサーバ負荷状況を一画面で確認 Hadoop JobTracker Web UIを呼び出して 一画面に統合 スレーブサーバのリ ソース使用量の平均 値を表示 カスタマイズが容易な ので、必要に応じて運 用画面を作成できる 23 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 24. 「ディスカバリ」、「自動登録」(自動ホスト追加) ディスカバリ機能、自動登録機能を用いてスレーブサーバを自動登録 • Zabbixでは、「ディスカバリ」(サーバからの探索)と「自動登録」(エージェン トからの通知)という2つの方式で監視対象の自動追加が可能 • これらの設定をしておくことにより、Hadoopスレーブサーバを追加した際の 監視対象自動追加を実現 24 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 25. 「トリガー」、「アクション」(障害通知) 収集した情報に対し、さまざまな条件を設定して通知を行うことができる • 収集したすべての情報に対して、しきい値を設定(「トリガー」)し、それにひ もづく「アクション」を設定可能 – メール通知 – コマンド実行 など • 追加で監視したい項目があった場合は、GUIから随時追加可能 • 「トリガー」には単純なしきい値に加え、計算式も使用可能 • メンテナンス時には障害通知の抑制ができる(「メンテナンス」) • 上位の監視サーバへのメッセージ転送も可能 25 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 26. まとめ Zabbixで監視することで、Hadoopをインフラエンジニアに身近なものに • Zabbixの優れた機能を活用することでHadoop統合監視を実現 – 拡張性の高さを生かしたプラグイン開発 – グラフ、スクリーン等の優れたUIの活用 – ホストの自動登録によるノード追加時の負荷軽減 • Hadoopが持っている豊富な管理機能を活用 – 管理に必要な情報は取得可能 – それを有効活用するノウハウの蓄積が重要 • Zabbixを使用することで、Hadoopも従来のサーバ群と同様に管理可能に – 同様の手法を用いることで、そのほかのミドルウェア、サービスも監視可能 26 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 27. Appendix インフラエンジニアなら 監視しておきたいHadoopメトリクス 27 © Copyright 2012 Hewlett-Packard Development Company, L.P. 2011
  • 28. 監視しておきたいメトリクス Namenode編 • HDFSの容量に関するメトリクス – dfs.FSNamesystem.CapacityRemainingGB – dfs.FSNamesystem.CapacityTotalGB – dfs.FSNamesystem.CapacityUsedGB ※”hadoop dfsadmin –report”コマンドからも取得可能 • HDFSのヘルスチェックに関するメトリクス – dfs.FSNamesystem.CorruptBlocks – dfs.FSNamesystem.ExcessBlocks – dfs.FSNamesystem.MissingBlocks ※”hadoop fsck”コマンドからも取得可能 28 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 29. 監視しておきたいメトリクス Datanode編 • HDFS IOの統計情報取得 • HDFS IOの障害検知 – dfs.datanode.blocks_read – dfs.datanode.volumeFailures – dfs.datanode.blocks_removed – dfs.datanode.block_verification_failures – dfs.datanode.blocks_replicated • HDFS IOにかかった時間の取得 – dfs.datanode.blocks_verified – dfs.datanode.readBlockOp_avg_time – dfs.datanode.blocks_written – dfs.datanode.copyBlockOp_avg_time – dfs.datanode.bytes_read – dfs.datanode.replaceBlockOp_avg_time – dfs.datanode.bytes_written – dfs.datanode.writeBlockOp_avg_time – dfs.datanode.reads_from_local_client – dfs.datanode.reads_from_remote_client – dfs.datanode.writes_from_local_client – dfs.datanode.writes_from_remote_client 29 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 30. 監視しておきたいメトリクス JobTracker編① • MapReduce Jobのキャパシティに関するメトリクス – mapred.jobtracker.trackers – mapred.jobtracker.trackers_blacklisted – mapred.jobtracker.trackers_decommissioned – mapred.jobtracker.map_slots – mapred.jobtracker.reduce_slots – mapred.jobtracker.reserved_map_slots – mapred.jobtracker.reserved_reduce_slots – mapred.jobtracker.occupied_map_slots – mapred.jobtracker.occupied_reduce_slots 30 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 31. 監視しておきたいメトリクス JobTracker編② • MapReduce Jobの実行状況に関するメトリクス – Job全体 – Reduceタスク • mapred.jobtracker.jobs_submitted • mapred.jobtracker.waiting_reduces • mapred.jobtracker.jobs_preparing • mapred.jobtracker.reduces_launched • mapred.jobtracker.jobs_running • mapred.jobtracker.running_reduces • mapred.jobtracker.jobs_completed • mapred.jobtracker.reduces_completed • mapred.jobtracker.jobs_failed • mapred.jobtracker.reduces_failed • mapred.jobtracker.jobs_killed • mapred.jobtracker.reduces_killed • mapred.jobtracker.blacklisted_reduces – Mapタスク • mapred.jobtracker.waiting_maps • mapred.jobtracker.maps_launched • mapred.jobtracker.running_maps • mapred.jobtracker.maps_completed • mapred.jobtracker.maps_failed • mapred.jobtracker.maps_killed • mapred.jobtracker.blacklisted_maps 31 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 32. 監視しておきたいメトリクス TaskTracker編 • 各ノードのMapReduce Jobのキャパシティに関するメトリクス – mapred.tasktracker.mapTaskSlots – mapred.tasktracker.reduceTaskSlots • 各ノードMapReduce Jobの実行状況に関するメトリクス – mapred.tasktracker.maps_running – mapred.tasktracker.reduces_running – mapred.tasktracker.tasks_completed – mapred.tasktracker.tasks_failed_ping – mapred.tasktracker.tasks_failed_timeout • TasklTrackerがハンドルしているMapperのShuffle出力 – mapred.shuffleOutput.shuffle_failed_outputs – mapred.shuffleOutput.shuffle_handler_busy_percent – mapred.shuffleOutput.shuffle_output_bytes – mapred.shuffleOutput.shuffle_success_outputs 32 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 33. 監視しておきたいメトリクス 全Hadoopサービス共通編 • 各JVMのヒープメモリ使用状況に関するメトリクス – jvm.<ProcessName>.metrics.maxMemoryM – jvm.<ProcessName>.metrics.memHeapCommittedM – jvm.<ProcessName>.metrics.memHeapUsedM • 各JVMのGCに関するメトリクス – jvm.<ProcessName>.metrics.gcCount – jvm.<ProcessName>.metrics.gcTimeMillis • Hadoopデーモンが出力したログの行数のメトリクス – jvm.<ProcessName>.metrics.logInfo – jvm.<ProcessName>.metrics.logWarn – jvm.<ProcessName>.metrics.logError – jvm.<ProcessName>.metrics.logFatal 33 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 34. そのほかのHadoopメトリクス関連Tips • HBase固有のメトリクス – HBase固有のメトリクスは、以下のサイトにまとめられています。 • HBase Book, Chapter 13. HBase Operational Management – 13.4. HBase Metrics – http://hbase.apache.org/book/hbase_metrics.html – HBaseは非常に多くのメトリクスがあり、運用やベンチマークに有用な情報が取得できます。 • rpc.metricsとrpc.detailed-metrics – rpc.metricsとrpc.detailed-metrics は、全サービスに共通するメトリクス項目です。 – Hadoopのrpc.metricsの詳細は以下に掲載されています。 • https://issues.apache.org/jira/browse/HADOOP-6599 – rpc.detailed-metricsは、該当のメソッド実行時に以下の通りにカウンタが作られます。 • rpc.detailed-metrics.<メソッド名>_num_ops: 該当RPCメソッド実行回数 • rpc.detailed-metrics.<メソッド名>_avg_time: 該当PRCメソッド実行にかかった時間(ms) 34 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 35. Hadoop HBase サービス概要 • 大規模分散処理プラットフォーム「Hadoop」をベースとして、ビッグデータ活用に最 適化したITインフラを構築するソリューション • サーバー、データベース、運用ツールとあわせて、導入コンサルティングサービス も提供し、お客様のビッグデータ活用をワンストップで支援 Hadoop HBase コンサルティングサービス •適用領域、既存システムの連携についてのヒアリングを実施 •必要に応じて、導入前検証をHPソリューションセンターで実施 Hadoop HBase導入支援サービス •ヒアリング内容に基づくサーバ構成の検討・設計 •Hadoopに対応した全体アーキテクチャの設計・構築 •性能測定・チューニング Hadoop HBase運用支援サービス •HP CMUおよびZabbix/Gangliaを使ったクラスタ運用基盤の構築 •Hadoopクラスタ運用支援 3 35 © Copyright 2012 Hewlett-Packard Development Company, L.P. 5
  • 36. HP ビッグデータ分析 コンサルティングサービス 1. ディスカバリーワークショップ •お客様の業務、システム改善を目的に、最新製品およびテクノロジーの紹介 •統計分析によるテキスト/ログなどの事例紹介及びデモの実施 2. 分析支援コンサルティングサービス •お客様の業務やシステムの全体像の把握、PDCAを回す全体設計 •今後の対応策、予算規模、スケジュールなど上申書のもととなる情報を作成 •システムの将来像とロードマップの策定及び、全体の参考価格も算出 3. 分析システム導入支援サービス •策定したシステムの将来像に向けて、システム全体の要件定義、システム設計、 システム構築サービスを提供 •事前検証を実施 4. 分析システム運用支援サービス •システム運用時の支援を実施 3 36 © Copyright 2012 Hewlett-Packard Development Company, L.P. 6
  • 37. HP ビッグデータバッチ処理高速化 コンサルティングサービス 1. バッチ処理高速化コンサルティングサービス •お客様にもアセスメントに参加して頂き、既存システムの問題点を的確に把握 2. バッチ処理高速化システム導入支援サービス • アーキテクチャ、運用、監視などのシステム設計を実施 • 機能テストや、性能テスト、負荷テスト、耐久テストなどを実施 • 顧客毎のシステム要件にしたがいプログラミングを日本HPで行う 3. バッチ処理高速化システム運用支援サービス • システム運用時の支援を実施 成果物:  既存システム問題解析結果報告書  システム監視手順書  システム設計書  テスト結果報告書  システム運用手順書  システム支援報告書 3 37 © Copyright 2012 Hewlett-Packard Development Company, L.P. 7
  • 38. Hadoopだけでなく、関連するオープンソースソフトウェアを含めた トータルサポート Web Java AP Management Apache http server Tomcat, JBoss JVM (OpenJDK) Nagios, ZABBIX BigData Hadoop HA OS FreeBSD, CentOS DRBD, Heart Beat DB Debian, Ubuntu MySQL, Postgre SQL 338 ワンストップで、トータルサポートを提供 © Copyright 2012 Hewlett-Packard Development Company, L.P.
  • 39. Thank you 39 © Copyright 2012 Hewlett-Packard Development Company, L.P.