Contenu connexe
Plus de Insight Technology, Inc.
Plus de Insight Technology, Inc. (20)
[D35] 今ミッション・クリティカル環境で求められるデータベース・クラスタリング技術とは? by Kousuke Osaka
- 9. DB2 HA構成 アクティブ-スタンバイ構成
アプリケーション
IP address
HAクラスター・ソフトウェア
(構成情報)
HAクラスター・ソフトウェア
(構成情報)
•DB2インスタンスホームディレクトリー
•データベースディレクトリー
•表スペース
•ログ
9
LOG
Database
crash
recovery
© 2013 IBM Corporation
- 13. 一般的なデータベース・クラスタ技術
適用エリア
中~大規模 OLTP/DWH
中規模OLTP/DWH
大規模DWH
構成
DB2 HADR
DB2 HA構成
DB2 Database Partitioning
アーキテク
チャー
シンプルな構成。高い可用性とパ
フォーマンスを確保。ログ転送のみによ
る二重化のためパフォーマンス劣化が
少ない
シンプルな基本構成。
概要
耐障害性
○テークオーバー中は全体停止。
復旧時間目標は数十秒から1分程度
△テークオーバー中は全体停止。
復旧時間目標は1分以上
○N-1/Nのデータに連続アクセス可。
障害サーバーの復旧時間目標は1
分前後
24365対応
◎片系ずつのメンテナンスが可能。
テークオーバー処理が高速
○片系ずつのメンテナンスが可能だ
が、テークオーバーの考慮が必要
○片系ずつのメンテナンスが可能だ
が、テークオーバーの考慮が必要
スケーラビリ
ティ
○スケールアップ
○スケールアップ
◎スケールアウト・スケールアップ
パフォーマン
ス
13
DBログ転送による物理レプリケーション
アクティブ-準アクティブ型
◎シンプルにパフォーマンスを向上
◎シンプルにパフォーマンスを向上
○ノード間通信削減を考慮した設
計が必要
通常アクティブ-スタンバイ型
シェアード・ナッシングでの
アクティブ-アクティブ型
大量データの分析処理やロード処
理に対して極めて高いパフォーマンス
を提供
© 2013 IBM Corporation
- 15. pureScale開発背景 pureScaleは何をモデルに?
DB2 for z/OSデータシェア 他社の尊敬を集めるアーキテクチャーがモデル
• スケーラビリティと高可用性におけるゴールド・スタンダードとして、
だれもがDB2 for z/OS を認めています。
Oracle社のCEO ラリー・エリソン
理由
「わたしは、いろいろなデータベースをけなしている。ただし、メインフ
レーム版のDB2を除いて。
メインフレーム版のDB2は、第一級の技術だ。」
– z/OS全体でカップリング・ファシリティ(CF)を使用
• ロックとキャッシュの集中管理により、優れたスケーラビリティと可用性を実現
pureScaleはソフトウェア・テクノロジーでCFを実装
15
© 2013 IBM Corporation
- 17. 高い拡張性の理由 CFによるロックとキャッシュの一元管理
他DBクラスターの場
合
課題:各サーバーでロックとキャッシュ
を分散管理
pureScaleの場合
解決策:CFでロックとキャッシュを一元
管理
– データは各サーバーに論理分割され、
各データのマスターサーバーがロック
とキャッシュを分散管理
– データを各サーバーに論理分割せず、
CFがロックとキャッシュを一元管理
– マスターでないデータへのアクセスに
は、サーバー間通信量が増えボトル
ネックとなりやすい
– 全てのデータが全てのサーバーから等
しくアクセス可能で、サーバー間通信
量が少なくボトルネックとなりにくい
– パーティショニングを行い、通信量を
低減
– パーティショニングの必要なし
サーバー 1
サーバー 2
サーバー 3
サーバー 1
サーバー 2
サーバー 3
CF
サーバー 1
にマスターさ
れるデータ
17
サーバー 2
にマスターさ
れるデータ
サーバー 3
にマスターさ
れるデータ
© 2013 IBM Corporation
- 23. 一般的なデータベース・クラスタ技術
適用エリア
大規模OLTP
中~大規模 OLTP/DWH
中規模OLTP/DWH
大規模DWH
構成
DB2 pureScale
DB2 HADR
DB2 HA構成
DB2 Database Partitioning
シェアード・ディスク型
アクティブ-アクティブ型
DBログ転送による物理レプリケーション
アクティブ-準アクティブ型
極めて高い可用性と拡張性を提
供。メインフレームのCFのアーキテク
チャーをSWの機能で実現
シンプルな構成。高い可用性とパ
フォーマンスを確保。ログ転送のみによ
る二重化のためパフォーマンス劣化が
少ない
耐障害性
◎更新中のページ以外のデータに
連続アクセス可。
全体の復旧時間目標は数十秒
○テークオーバー中は全体停止。
復旧時間目標は数十秒から1分程
度
△テークオーバー中は全体停止。
復旧時間目標は1分以上
○N-1/Nのデータに連続アクセス可。
障害サーバーの復旧時間目標は1
分前後
24365t対応
◎片系ずつのメンテナンスと連続ア
クセスが可能
◎片系ずつのメンテナンスが可能。
テークオーバー処理が高速
○片系ずつのメンテナンスが可能だ
が、テークオーバーの考慮が必要
○片系ずつのメンテナンスが可能だ
が、テークオーバーの考慮が必要
スケーラビリ
ティ
◎スケールアウト・スケールアップ
○スケールアップ
○スケールアップ
◎スケールアウト・スケールアップ
パフォーマンス
○複数メンバーによる更新を考慮
した設計が必要
◎シンプルにパフォーマンスを向上
◎シンプルにパフォーマンスを向上
○ノード間通信削減を考慮した設
計が必要
アーキテク
チャー
概要
23
通常アクティブ-スタンバイ型
シンプルな構成。高いパフォーマンス
を確保。
シェアード・ナッシング型
アクティブ-アクティブ型
大量データの分析処理やロード処
理に対して極めて高いパフォーマンス
を提供
© 2013 IBM Corporation
- 25. PureData for Transactions(TX) の特徴
PureData for TX は、以下を集約した
データベース・プラットフォームです。
①PureFlexテクノロジー
②DB2 pureScale テクノロジー
③エキスパートの知見
統合
100のデータベースをシングルシステムに統合し、リ
ソースを共有しながら性能とコストを最適化
最適化
HWとSWの設計、構成を事例と知見を元に最適化
迅速化
DB構築までを1時間以内に迅速化し、サービス提供
までの時間を削減
+ + ➙
25
© 2013 IBM Corporation
- 28. PureData for TXの3つのモデルとキャパシティ
PureData for TXには3つのモデル(Small, Medium, Large)があり、段階拡張が可能です。
Upgrade
構成
Upgrade
Small
Medium
Large
(¼ Rack)
(½ Rack)
(Full Rack)
ブレード(計算ノード)の数
(16core / ノード)
6
12
24
CPU Cores
96
192
384
1.5 TB
3.1 TB
6.1 TB
1
2
4
1
2
4
18.6 TB
37.2 TB
74.4 TB
4.8 TB
32.0 TB
9.6 TB
64.0 TB
19.2 TB
128.0 TB
1
(10)
3
(30)
6
(60)
Memory
V7000 Storage Unit
(each unit has: 18 x 900GB HDD, 6 x 400
GB SSD)
V7000 Storage Expansion
(each unit has: 18 x 900GB HDD, 6 x 400
GB SSD)
ストレージキャパシティ
Raw SSD Storage
Raw HDD Storage
最大インスタンス数
(DB数)
※1インスタンス4ノード以上とする場合
28
** IBM Internal Use Only **
© 2013 IBM Corporation
- 29. PureData for TX 構築作業の流れ
見積り、サイジング
HWの搬入、結線
OSの設計、導入
ストレージの設計、構築
HA構成(DB2 pureScale)
インスタンスの作成
データベースの作成
計算ノード数以外の構成は決定済みのため、キーとなる要素(インスタンス数、
DB数、CPU 、データ量)を充足するサイズを選択するのみ
設計、構成済みで変更の余地無し
最小限の設計ドキュメント
インスタンスとデータベースはコンソール画面の
操作で作成
パラメータはOLTPワークロードに最適化済みだ
が、変更も可能
PDTXが提供する運用機能の、お客様運用への適合性について評
価が必要
アプライアンスとして機能が検証済みのため、障害テストなどデータ
ベース・サーバとしての単体テストは大幅に軽減される。システム全
体として実施する結合テスト以降はこれまでと同様
パラメータの設計、変更
運用設計、構築
表スペースの作成
データベース・オブジェクトの作成
以降は通常のDB2と同様に実施
する
表、索引の作成
テスト
権限の設定
PDTXでは不要な作業項目
PDTXで軽減される作業項目
データの投入
29
PDTXでも変わらない作業項目
© 2013 IBM Corporation