10. メタデータの管理方法
多くの分散ファイルシステムでは・・・
データの場所 = メタデータとして管理
Data servers
メタデータサーバ
各ファイルのデータがどこにあるか管理
する
ファイルを要求するユーザに要求ファイル
の場所を教えてあげる
Metadata server 10
11. レプリケーション
複数のサーバが同一ファイルのコンテンツを持つ(レ
プリカ)
File B
File A File C
Replica of
File A
Access Access
Access
ファイルへのアクセス競合を
避けることができる
11
12. ストライピング
1つのファイルを複数のブロックに分割し、別々のスト
レージに保存
– 並列アクセスによりI/Oスループットの向上が期待される
1/3 of A 2/3 of A 3/3 of A
File A
Access Access
12
13. 本日のお題 – 最新研究トピックス
今回は主に分散ファイルシステム内でのデータの
最適配置関係のものを Pick Up
他にも色々
1. 分散ファイルシステムにおける効果的な 盛んに研究が
データ配置 行われている
A Cost-intelligent Application-specific
Data Layout Scheme for Parallel File Systems [H.
Song et al. HPDC’11]
2. 分散アプリケーションと分散ファイルシステムの連携
A Workflow-Aware Storage System: An
Opportunity Study [E. Vairavanathan et al.
CCGrid’12]
13
14. 本日のお題 – 最新研究トピックス
分散ファイルシステムにおける効果的なデータ
配置
– A Cost-intelligent Application-specific Data
Layout Scheme for Parallel File Systems [H.
Song et al. HPDC’11] とその周辺
分散アプリケーションと分散ファイルシステムの
連携
– A Workflow-Aware Storage System: An
Opportunity Study [E. Vairavanathan et al.
CCGrid’12] とその周辺
14
15. 分散ファイルシステムでの効率的な
データ配置とは?
レプリケーションやストライピングによりI/O
スループットを向上させることができる
それでは、結果的にどのようなデータ配置が
効率的?
答え:
アプリケーション
に依存する
Which is
better?
15
16. 一般的な3つのデータ配置方針
1-DV Layout 2-D Layout
1-DH Layout
File A 一般的な分散
File B ファイルシステム
File C では大抵実装
されている
File D
16
21. 本日のお題 – 最新研究トピックス
分散ファイルシステムにおける効果的なデータ
配置
– A Cost-intelligent Application-specific Data
Layout Scheme for Parallel File Systems [H.
Song et al. HPDC’11] とその周辺
分散アプリケーションと分散ファイルシステムの
連携
– A Workflow-Aware Storage System: An
Opportunity Study [E. Vairavanathan et al.
CCGrid’12] とその周辺
21