[B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka

エンタプライズ
エンタープライズ NoSQL/Hbase
プラットフォーム

MapR
M R M7 エディシン
エディション

MapR Technologies 株式会社
ソリューション・アーキテクト
岡昌孝
©MapR Technologies ‐ Confidential

1

MapR M7エディションは
企業利⽤を前提とした、Apache HBase
完全互換のNoSQL プラットフォームです
プラットフォムです。

信頼性


⾼速性

2

運⽤性

たとえば… ⾼速性
他の Hadoop
YCSB Benchmark        MapR 3.0.1
YCSB Benchmark
3.0.1
ディストリビューション M7 Advantage
デ
トリビ
シ
d
(M7エディション)
(ops/sec/node)
(HBase)

50% read, 50% update
50% read 50% update

7965

2918

2.7x
2 7x

95% read,  5% update

3850

1541

2.5x

Random Read

5934

865

6.9x

Range Scan (50 rows)
Range Scan (50
)

838

274

3.1x
3 1x

Hardware Configuration


CPU : Intel® Xeon® CPU E5645  2.40GHz  12 cores x2
RAM : 48 GB
Data Disk : 12x 3TB  (7200 rpm)
Size – record size = 1k, data size = 2TB
OS : CentOS Release 6.2 (Final)

3

10‐Node Cluster

アジェンダ


Apache Hb
A
h Hbase のアキテクチと課題
のアーキテクチャと課題



MapR とは？／MapRの優位点



MapR M7 エディション



まとめ


4

Apache HBase のアーキテクチャ
Name Node

HBaseMaster

ZooKeeper

ZooKeeper

ZooKeeper

JVM

JVM

JVM

JVM

JVM

マスタノード

RegionServer

RegionServer

RegionServer

RegionServer

JVM

JVM

JVM

JVM

・・・・・・・・・・・
Data Node

Data Node
Data Node

Data Node
Data Node

Data Node
Data Node

JVM

JVM

JVM

JVM

スレーブノード
スレブノド

5

Apache HBase のアーキテクチャ
RegionServer

RegionServer

RegionServer

RegionServer

JVM

JVM

JVM

JVM

・・・・・・・・・・・
Data Node

Data Node

Data Node

Data Node

JVM

JVM

JVM

JVM

キレンジ
キーレンジ１
リージョン１

キ
キーレンジ２
ンジ
リージョン２

キ
キーレンジ３
ンジ
リージョン３

HDFS

6

・・・・・・・・・・・

キ
キーレンジｎ
ジ
リージョンｎ

Apache HBase ユーザーが抱える課題
ネームノードに単⼀障害点がある

信頼性

パフォーマンスが安定（⼀定）しない
ハードウェア障害のデータ損失は防ぐことがで
きても操作ミスの復旧の⼿⽴てがない

⾼速性

コンパクションに時間がかかる
複数ユーザーでクラスタを共⽤するときに個別
複数ユザでクラスタを共⽤するときに個別
の権限や運⽤ポリシーの設定が難しい
ノドを増やしても実際にはリニアにスケル
ノードを増やしても実際にはリニアにスケール
しない
運⽤には経験値の⾼い⼈員が常に不可⽋

7

運⽤性

Apache Hadoop に起因する課題
ネームノードに単⼀障害点がある

信頼性

パフォーマンスが安定（⼀定）しない
ハードウェア障害のデータ損失は防ぐことがで
きても操作ミスの復旧の⼿⽴てがない

⾼速性

コンパクションに時間がかかる
複数ユーザーでクラスタを共⽤するときに個別
複数ユザでクラスタを共⽤するときに個別
の権限や運⽤ポリシーの設定が難しい
ノドを増やしても実際にはリニアにスケル
ノードを増やしても実際にはリニアにスケール
しない
運⽤には経験値の⾼い⼈員が常に不可⽋

8

運⽤性



Apache HB
A
h HBase のアキテクチと課題



MapR とは？／MapR の優位点






まとめ


9

MapR = Apache Hadoop + Innovation
Apache HBase Table
JVM
HDFS

File
File
File

JVM
Linux ファイルシステム
Ext3/Ext4
ディスクデバイス

Apache HBase Table
JVM
File

File
MapR‐FS File


Table

File

File
MapR‐FS File


その他のHadoop
ディストリビューション

MapR-FS: ランダムアクセスとNFSマウントが可能なファイルシステム

10

アーキテクチャ設計と再実装による性能向上
Apahce Hadoop
Java API

MapR

100%互換

Java API

MapReduce
HDFS
MB/s

様々な追加機能

MapReduce
再設計
C/C++実装

MapR-FS

DFSIO性能

• J bT k HA
JobTracker
• Direct Shuffle
•
•
•
•
•
•

ランダムアクセス
分散NameNode
NFSアクセス
ボリューム
ミラーリング
スナップショット

ハードウェアの限界性能を引き出すため
のアーキテクチャ設計・再実装

MapR
•
•
•
•
10ノード, 2xクアッドコア, 24GBメモリ, 11x7200rpm SATA


11

ビルトイン圧縮によるI/O削減
分散NameNode
RPC経由のShuffle転送
Java GCの影響の排除

MapRの⾼い信頼性
単⼀障害点の完全な排除
分散NameNode
Apache Hadoop

JobTracker HA
アクティブなJobTracker

MapR

Name
Node

Data
Node

Hadoop
Node NN

Data
Node

Data
Node

Hadoop
Node NN

Data
Node

Hadoop
Node NN

Hadoop
Node NN

Data
Node

Data
Node

Hadoop
Node NN

Hadoop
Node NN

ノード2

ノード3

ノード4

ノード5

Hadoop
Node NN

Data
Node

ノード1

Hadoop
Node NN

JobTracker サービス

TaskTracker サービス
FileServer サビス
サービス
NFS サービス

NameNode機能の分散配置による
耐障害性、スケーラビリティの向上
耐障害性
ビ
向上


JobTracker稼働ノードの障害でも
中断されるJob/Taskはない
中断

12

システム管理機能の充実によるコスト削減
NFS経由の効率的なデータ⼊出⼒
Web サーバ

処理結果
MapR FS

NFSマウント

マウントポイント: xx
容量上限: xx
レプリケーション数: x
管理権限: xx

アプリケーショ
プ
ン

MapReduce

ログ出⼒

ボリューム活⽤によるマルチテナント運⽤

ボリュムC ミラ設定
ボリュームC ミラー設定

NFSマウント

xxx

「ボリューム」単位でファイルシステムを論理分割し、異
なるポリシーを設定して運⽤管理を分離

スナップショットによるデータ喪失への備え

差分更新

xxx

ボリュームB

ログの出⼒を直接Hadoopファイルシステムにして中
間ファイルサーバやデータ移動の⼿順を削減

⽉曜⽇の
スナップショッ
ト

ボリュームA

クラスタ稼働状況の瞬時の把握と集中管理

ボリューム
⽕曜⽇の
ト

差分更新

使いやすい
Web管理画⾯と
“Heat Map”
表⽰、アラーム

⽔曜⽇の
ト

差分更新

最新版

スナップショットはHadoop
ファイルシステム内に作られ、差分のみを格納


13

MapR のミラーリング（バックアップ）
容易なバックアップ、災害対応
容易なバックアップ災害対応

開発環境

本番環境

効率的なバックアップ



データセンター1

WAN

データセンター2

差分のみの更新
圧縮、およびチェックサムの上転送

管理、運⽤の容易性
管理運⽤の容易性




WAN

クラウド環
境

14

LAN/WAN経由、



本番環境

設定により定期的、またはオンデマ
ンドでバックアップ可能
バックアップ時点でのデータの⼀貫
性

ボリューム

クラスタを構成するノードを論理的に束ねることで、ボリュームを構成
することができます。
•各ボリュームはROOTボリュームを頂点とするファイルシステムの単⼀ネームス
各ボリュムはROOTボリュムを頂点とするファイルシステムの単ネムス

ペースにマウントされます。
ラック#1

ラック#2

ラック#3

ラック#4

/ (ROOT)
/ (ROOT)

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

user/

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

HDD

SSD

SSD

SSD

SSD

SSD

SSD

SSD

SSD

SSD

SSD

SSD

SSD

vol_1/
fast/

/user/vol_1/
/user/vol 1/
/fast/

•ボリューム機能の利点
•ボリューム毎にレプリケーション数、ユーザーアクセスコントロール、クォータ、スナップショット、ミ

ラーリングの設定ができる。→マルチテナンシー

•特定のデータを間接的に特定のノードに配置できる。→アクセススピードが求められるデータをSSDノー

ドに格納する。

•使⽤状況に応じてボリューム毎にノードの拡張、縮退がオンラインのまま可能。


15

ファイル/チャンク/コンテナ
•MapRクラスタに格納するファイルは256MB(デフォルト)の“チャンク”に分解されます。
•各チャンクは16GB(デフォルト)の“データコンテナ”に格納されます（各コンテナは複数のファ
各チャンクは16GB(デフォルト)のデータコンテナに格納されます（各コンテナは複数のファ

イルのチャンクを格納します）。

•各コンテナはボリューム内で複数のノードにレプリケートされます。

ファイル：

チャンク

チャンク

チャンク

256MB 256MB 256MB ・・・・・・・・・・・・・・・・・・・・・・・・・・・・

コンテナ：

・・・・・・・・・・・・・・・・・・・・・

ノード

ノード

ノード

ボリューム：


16

ノード

CLDB (Container Location Database)
CLDBはコンテナの位置情報を提供します。

•CLDBプロセスは複数のノードに常駐し、冗⻑構成します。これらのノードの⼀つにCLDBコン

テナが作成され、他のCLDBプロセスノードにレプリケートされます。

•CLDBコンテナにはクラスタ内のすべてのコンテナのノード情報が記録されます。CLDBプロセ

スはCLDBコンテナの内容をメモリにロードします。

•各ボリュームにはネームコンテナが配置されます。ネームコンテナはボリューム内のファイルの

位置情報が記録されます。
位置情報が記録されます

CLDBコンテナ

ネームコンテナ

ボリューム名→ネームコンテナID
•ノード#1
コンテナID → •ノード#2
•ノード#3

ファイルパス
ァ
↓
マウント先ボリューム名/
データコンテナID

例：/user/vol_1/test.data のデータコンテナ解決
“/(ROOT)”ボリューム→ CLDB
→“user/”ボリューム→
“
/”ボリ
ム
“vol_1/”ボリューム→
CLDB

CLDB
CLDB

→ネームコンテナID/ノード/”/user/vol_1/test.data”→
→ネームコンテナID/ノード/”vol_1/test.data”→
ネムンテナID/ノド/” l 1/t t d t ”

→ネームコンテナID/ノード/”test.data”→

ROOT:ネームコンテナ

user:ネームコンテナ
ネ
ナ

Vol_1:ネームコンテナ

→データコンテナID→

→ノード/データコンテナID/”test.data”→ データコンテナ

•クライアントはCLDB/ネームコンテナの検索結果を常にキャッシュします。


17

→

ネームノード vs. CLDB
CLDB
CLDB
CLDB

MapR

Apache Hadoop

CLDB
コンテナ

NameNode

ネムコンテナ

DataNode

DataNode

ネムコンテナ

DataNode

データコンテナ

データコンテナデータコンテナ

ボリューム


ネムコンテナ

18

データコンテナデータコンテナ

ボリューム

データコンテナ

ボリューム

ネームノード・ボトルネックの解消
他ディ
リ
他のディストリ
ビューション

Advantage

Rate (creates/s)

14‐16K

335‐360

40x

Scale (files)

6B

1.3M

4615x

ファイ
イル生成/秒

MapR

18000
MapR

16000

400
350
300
250
200
150
100
50
0

他のディストリビュション
他のディストリビューション

0

0.5

1

1.5

百万ファイル

フ
ファイル生成
成/秒

14000
12000
10000
8000
6000
4000
2000

Benchmark: File creates (100B)
Hardware: 10 nodes, 2 x 4 cores, 24 GB
RAM, 12 x 1 TB 7200 RPM

他のディストリビューション

0
00 100 200 400 600 800 1000
1000
2000
3000
4000
5000
6000

百万ファイル

19



Apache HB
A









まとめ

Table

File

MapR‐FS File
MapR FS File



20

HBaseテーブルとファイルシステムの融合
$ mount maprnode:/mapr /mapr
$ cd /mapr/default/user/dave
$ pwd
/mapr/default/user/dave

NFS マウント

$ ls
file1  file2  table1  table2
file1 file2 table1 table2
$ hbase shell
hbase(main):003:0> create '/user/dave/table3', 'cf1', 'cf2', 'cf3'
0 row(s) in 0.1570 seconds
$ ls
file1  file2  table1  table2  table3
file1 file2 table1 table2 table3
$ hadoop fs ‐ls /user/dave
Found 5 items
‐rw‐r‐‐r‐‐
3 mapr mapr
‐rw‐r‐‐r‐‐
3 mapr mapr
trwxr‐xr‐x   3 mapr mapr
trwxr xr x   3 mapr mapr
trwxr‐xr‐x
3 mapr
trwxr‐xr‐x   3 mapr mapr

Hadoop API
16 2012‐09‐28 08:34 /user/dave/file1
22 2012‐09‐28 08:34 /user/dave/file2
2 2012‐09‐28 08:32 /user/dave/table1
2 2012 09 28 08:33 /user/dave/table2
2 2012‐09‐28 08:33 /user/dave/table2
2 2012‐09‐28 08:38 /user/dave/table3
21

MapR プラットフォームの拡張
Hive

M
MapR%
Control%
System% S)
(MC

Pig
Cascading

Oozie

Mahout

Flume

MapR%
Distribu‐ on%
for
Apache%
Hadoop

HCatalog

Sqoop

Whirr

Apache%
HBase

MapReduce

HBase&
API
MapR%
Data%
Pla*orm%
(MDP)

NFS%
interface
HDFS%
API

HMaster、RegionServer は存在しない。
、 g
は存在しな。

22

複雑すぎるコンポーネント連携
Apache HBase のリージョン割り当て手順


23

Apache HBase HFile の構造
それぞれのセルはキー・バリューペア（レコードではない）
- カラムの数だけキーを繰り返す

昇順にソート
昇順にソト
されたキー・
バリューペア

64Kバイトのブ
ロック単位で圧縮

圧縮ブロックへのインデッ
クスが付加される


24

HBase リージョンオペレーション


各HFileの典型的サイズは数GB~数⼗GB



リージョンサーバはデータをメモリ上に保持しますが、
上限に達した時点で新しいHFileとしてディスクに書き
出します
新

旧
当該リージョンのキーレンジ


25

HBase で増⼤するリードオペレーション


get/scanオペレションでレコドを取得するには全て
get/scanオペレーションでレコードを取得するには全て
のHFileを読み込む必要がある
–

スキーマレスなのでどこに必要なカラムがあるのかわからない

新

旧


26

HFile のコンパクション


データ読み込み時間を短縮するためにHBaseは定期的に
複数のHFileをひとつのHFileに統合します

デフォルトではHFileが⼀定数に達した時点で⾃動的に実⾏され
る
– コンパクション中はディスクI/Oストームが発⽣し、パフォー
マンスが著しく低下する
– 週末に⼿動実⾏？
–

コンパクションはすべてのHFileを読込んでひ
とつのファイルに書き出します。


27

なぜコンパクションが必要なのか？


HDFS

Map/Reduce バッチ処理を想定したファイルシステム
– ⼤きなファイルに順次アクセスする
–ク
クローズ済みのファイルに書き込むことはできない
ズ済みフイルに書き込むとはきな
–



MapR-FS

ランダムアクセスが可能
– ファイルサイズを問わない
– クローズ済みのファイルに編集・追記が可能
–


28



Apache HB
A









まとめ


29

企業ユーザが求めるクオリティの実現

信頼性
⾼速性
運⽤性

30

企業ユーザが求めるクオリティの実現
分散ネームノード(CLDB)

信頼性

ランダムアクセス可能なMapR-FS
NFSアクセス
コンパクションの排除

⾼速性

スナップショット・ミラーリング
HMaster、RegionServerの排除

運⽤性

ボリューム定義/管理
真のスケラビリティ
真のスケーラビリティ


31

Apache HBase との⽐較
MapR M7

Apache HBase
Apache HBase

ファイル/テーブル・ネームス
ペースの統合

〇

Ｘ

クォータ制御
ク
タ制御

〇

Ｘ

データ配置制御

〇

Ｘ

ネットワクトラフィックの圧縮
ネットワークトラフィックの圧縮

〇

Ｘ

特定ストレージの割当

〇

Ｘ

SSDノードへの明示的な割当

スナップショット
スナプシト

〇

Ｘ

ミラーリング

〇

Ｘ

コンパクションの排除

〇

Ｘ

オンラインアップグレード

〇

Ｘ


32

Apache HBase の制限事項の排除
MapR M7

Apache HBase
Apache HBase

テーブル数

数十億

100

ノード数

10,000

数百

64

3

カラムファミリ数


33

M7 vs. CDH: 50-50 load (read latency)
CDH

MapR
p


35

M7 vs. CDH: 50-50 Mix (Reads)

MapR：スループット
CDH：レイテンシ

CDH：スループット

MapR：レイテンシ
イテシ


36

M7 vs. CDH: 50‐50 Mix (Updates)

MapR：スループット

CDH：レイテンシ
CDH：スループット

MapR：レイテンシ


37

ベンチマク結果
ベンチマーク結果


38

ベンチマーク結果


39

Apache Drill


Drill 概要
–
–
–



オープンソース
–
–
–
–
–



⾼速かつインタラクティブなクエリーの実⾏
⾼速かつインタラクティブなクエリの実⾏
標準ANSI SQLのサポート
Google Dremelをベースの開発

⽶国、ヨーロッパから数百⼈が開発に参加
コミュニティーの中で開発する機能、APIについて確認済み
⼀部のコンポーネントは既に開発済み
Simba Technologies – ODBC 開発元がDrill⽤のODBCドライバーを開発
OpenDremel チームがコードをApache Drillに統合

スケジュール(予定)
スケジュル(予定)
–
–

2013年9⽉
2013年12⽉


α版リリース
β

40

MapR: Apache Hadoop ディストリビューション


Ecoシステムも含めたHadoop完全パッケージ



EcoシステムについてもMapR内で検証の上、製品パッケジとして提供
EcoシステムについてもMapR内で検証の上、製品パッケージとして提供



EcoシステムのパッチもMapRから提供



100%標準Hadoopインターフェイス



エンタープライズ向け⾼信頼性



柔軟なファイルシステム



⾼パフォーマンス
⾼パフォマンス


41

ご静聴ありがとうございました。

お問い合わせは
sales‐jp@maprtech.com
までお願い致します。

42

[B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (7)

En vedette

En vedette (6)

Similaire à [B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka

Similaire à [B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka (20)

Plus de Insight Technology, Inc.

Plus de Insight Technology, Inc. (20)

[B27] エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション by Masataka Oka