SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
分散ファイルシステムと
分散アプリケーションの研究
   最新トピックス



    東大大学院 情報理工学系研究科
    修士2年 堀内美希 ( @nukamu )
Agenda
   イントロダクション
    – 少し自己紹介とか
    – 分散コンピューティングでの分散ファイルシステム
      の使用背景
 分散ファイルシステムの基礎技術紹介
 最新研究紹介
    – 分散ファイルシステムにおける効果的なデータ配置
    – 分散アプリケーションとの分散ファイルシステムの
      連携
   まとめ
                                2
少し自己紹介
 名前: @nukamu
 所属:東京大学大学院
  田浦研究室
 学年:修士2年
 研究分野:分散コンピュー
  ティング(特に分散ストレー
  ジまわり)
 プログラミング:C, pythonが特に好き
 趣味:バンド、音楽系


                           3
分散ファイルシステム周りのwork
   DDDFS (Dynamically-Duplicate Distributed
    File System)
    – 数週間前に行われたICTプログラムコンテストに応募
      し賞を受賞
    – Github - https://github.com/nukamu/dddfs
   Mogami
    – 研究で作ってる
      分散ファイル
      システム
    – 近日公開予定


                                                 4
分散ファイルシステムとは?



            分散ファイルシステム



                  複数のストレージを束ねて使う
                  並列ファイルアクセスを可能にする

                   有名な分散ファイルシステム:
                   PVFS, GPFS, Lustre, HDFS,
                          Gluster etc.
processes
                                               5
分散ファイルシステムを使うことの
    利点
– アクセスの並列化が可能なため高スループットが期待できる
– 複数のプロセス(同一マシン上に限定しない)から同一ファイルが
  参照可


            File B
   File A                  File D
              File C




    ファイル共有ができる
                       高スループットを
                       得ることができる

                                    6
分散アプリケーションでの
       分散ファイルシステムの使われ方
   ex.) ワークフローアプリケーション




                                                  分散ファイルシステム
                                        create
      – 依存関係のあるジョブの集合体        job
      – MapReduceもワークフローの     A
        一種といえる
                                            use
        job                       job
                    BとCは同時          B
         A
                    実行が可能

job           job
B             C
                       各ジョブ間での情報伝達をファイルを
                        介して行う→ファイル共有の必要性
        job            図中ファイルはジョブAのoutputであり
        D               かつジョブBのinput

    依存関係グラフ                                                    7
ワークフロー実行エンジン
   Swift[Zhao et al. 2007], Pegasus[Deelman et al.
    2005], GXPMake[Taura et al. 2010] etc..
    – マスターノードがジョブの依存関係に気を配りつつ、ワーカーノー
      ドにジョブをディスパッチ
    – ワーカー間ではファイルの共有が必要

                      分散ファイルシステム


ワーカー
ノード

                                 ジョブをディスパッチ
                   マスター
                   ノード
                                                      8
分散ファイルシステムの基礎技術
 メタデータ管理
 レプリケーション
 ストライピング




                      9
メタデータの管理方法
   多くの分散ファイルシステムでは・・・
                                 データの場所 = メタデータとして管理




                          Data servers


                     メタデータサーバ
                         各ファイルのデータがどこにあるか管理
                          する
                         ファイルを要求するユーザに要求ファイル
                          の場所を教えてあげる
Metadata server                                    10
レプリケーション
   複数のサーバが同一ファイルのコンテンツを持つ(レ
    プリカ)

                               File B
         File A                             File C

                              Replica of
                                File A




Access               Access
                  Access
                                     ファイルへのアクセス競合を
                                       避けることができる
                                                     11
ストライピング
     1つのファイルを複数のブロックに分割し、別々のスト
      レージに保存
      – 並列アクセスによりI/Oスループットの向上が期待される



         1/3 of A            2/3 of A            3/3 of A


File A


                    Access              Access



                                                            12
本日のお題 – 最新研究トピックス
 今回は主に分散ファイルシステム内でのデータの
  最適配置関係のものを Pick Up
                       他にも色々
1. 分散ファイルシステムにおける効果的な 盛んに研究が
   データ配置              行われている
      A Cost-intelligent Application-specific
       Data Layout Scheme for Parallel File Systems [H.
       Song et al. HPDC’11]
2.   分散アプリケーションと分散ファイルシステムの連携
      A Workflow-Aware Storage System: An
       Opportunity Study [E. Vairavanathan et al.
       CCGrid’12]


                                                          13
本日のお題 – 最新研究トピックス
   分散ファイルシステムにおける効果的なデータ
    配置
    – A Cost-intelligent Application-specific Data
      Layout Scheme for Parallel File Systems [H.
      Song et al. HPDC’11] とその周辺
   分散アプリケーションと分散ファイルシステムの
    連携
    – A Workflow-Aware Storage System: An
      Opportunity Study [E. Vairavanathan et al.
      CCGrid’12] とその周辺


                                                     14
分散ファイルシステムでの効率的な
    データ配置とは?
 レプリケーションやストライピングによりI/O
  スループットを向上させることができる
 それでは、結果的にどのようなデータ配置が
  効率的?


                     答え:
                  アプリケーション
                   に依存する
       Which is
       better?

                             15
一般的な3つのデータ配置方針
    1-DV Layout                 2-D Layout




                  1-DH Layout
File A                                 一般的な分散
File B                                ファイルシステム
File C                                 では大抵実装
                                        されている
File D


                                                 16
アクセスコスト推定モデル
    I/Oアクセスコスト推定モデルを先程                  e: 一つのネットワーク接続確立に
                                         要するコスト
     の3種類のレイアウトタイプに関して                   v: ある単位のデータを転送するた
     構築                                  めのコスト
            n: データサーバ数                   α: 各I/Oのスタートアップコスト
                                         β: ある単位のデータを
                                         read/writeするのにかかるコスト

                                         Network
                                                               me
                                         Establish Cost

                                         Network
                                                           mv×(request
                                         Transmission
                                                              size)
                                         Cost
p: クライアントプロセス数
                    m: 一つのクライアント内        Storage Startup
                    のプロセス数                                   (p/n)α
                                         Cost
Process   Process    Process   Process                       (p/n)β×
                        2         3      Storage I/O
   0         1                                               (request
                                         Cost
     Client 0            Client 1                              size)
                                                                        17
コスト推定モデルの確認実験
                                               このグラフはシーケンシャル
                                                 アクセス時の結果

                                              図中x, ・, +の印は実際の
                                               測定で一番効率的なI/O
                                               スループットを出したもの
                                               を示している
                                              背景の色は先程のアクセ
                                               スコスト推定モデルで最も
                                               コストが低いと推定された
                                               ものを示している

Access    Total Case   Correct   Correct        アクセスコスト推定
Type      Count        Count     Rate
                                                モデルが大体正確で
Random    4200         3821      90.98%          あることを確認
Sequential 4200        3702      88.14%
                                                                 18
ハイブリッドデータレプリケーション
     方針
   全てのレイアウト方針に基づいたデータを用意し、最
    も推定アクセスコストの低いものを計算してアクセス

                                    1-DV


                                    1-DH


                                        2-D




各read, write時に一番アクセスコストの低いデータレイアウトを選ぶ
                                          19
ハイブリッドデータレプリケーション
     の効果測定
   1-DHと比べたときの性能向上割合




          提案手法では約70%の性能改善
                            20
本日のお題 – 最新研究トピックス
   分散ファイルシステムにおける効果的なデータ
    配置
    – A Cost-intelligent Application-specific Data
      Layout Scheme for Parallel File Systems [H.
      Song et al. HPDC’11] とその周辺
   分散アプリケーションと分散ファイルシステムの
    連携
    – A Workflow-Aware Storage System: An
      Opportunity Study [E. Vairavanathan et al.
      CCGrid’12] とその周辺


                                                     21
分散ファイルシステムの透過性
    分散ファイルシステムを使うときにはデータがどこに
     存在しているか意識する必要はない
     – どこからでもリモートのデータに透過的にアクセス
    分散ファイルシステムの利点でありつつ性能最適化
     の弊害にもなる



         分散ファイルシステム(抽象化可)


ワークフローアプリケーションなど
アプリケーションサイド

                                 22
ワークフローアプリケーションのI/O
       パターン
    Justin Wozniak et al PDSW’09
     – ワークフローアプリケーション内でのI/Oパターンを
       主流なものとして以下の4パターンに分類




Pipeline   Broadcast     Reduce     Scatter/Gather
                                                     23
各I/Oアクセスパターンでの最適化
      手法
   Pipeline
    – ファイルを作るときローカルストレージにデータを置くように
      し、次のジョブを同じノードにディスパッチ
   Broadcast
    – ファイルを作っているそばから積極的にレプリケーションを
      並列で行う
   Reduce
    – 全てのジョブが作るファイルをある同じノードに作るようにし、
      次のジョブはそのノードで走らせる
   Scatter/Gather
    – ファイルレベルではなく、ブロックレベルの最適化が必要
    – 今回は実装、評価せず
                                      24
ワークフロー実行エンジンと分散
        ストレージの連携実装

             アプリケーションヒント
             (e.g., Pipeline, Broadcast, Reduceなど)
 ワークフロー
 実行エンジン
                                             計算ノード

                   アプリケーション… アプリケーションアプリケーション
POSIX
API                  ローカル              ローカル          ローカル
                     ストレージ             ストレージ         ストレージ
ストレージヒント
(e.g., ファイルの位置)           Workflow-aware storage (shared)

                                                             25
評価:実験環境
       MosaStore(改良あり), MosaStore(改良なし), NFS
        (, Local)
          MosaStoreというのは論文筆者グループで開発して
            いる分散ファイルシステム
              アプリケーション … アプリケーション
                               アプリケーション
POSIX
API            ローカル              ローカル        ローカル
               ストレージ             ストレージ       ストレージ
                                                         Stage Out
                                  Intermediate Storage
 Stage In

               Backend file system (e.g., GPFS, NFS)
                                                               26
評価:ベンチマーク - Pipeline
   改良点: ファイルを自分のローカル
    で作成→同じノードに次のジョブを




                      WF = WorkFlow-aware




      Average runtime for medium workload   27
評価:ベンチマーク – Broadcast (1/2)
   改良点: 積極的なレプリケーション



                        WF = WorkFlow-aware

                      Best performance!!




     Average runtime for medium workload

                                              28
評価:ベンチマーク – Broadcast (2/2)
   さらにもう少し見てみる – レプリカ作成にかかった時間と
    アプリケーションの実行時間に分離




                             Best
                             Performance!!




                                       29
評価:ベンチマーク - Reduce
   改良点: 一つのノードにファイルを
    集め、そのノードにReduceジョブを




                      WF = WorkFlow-aware




      Average runtime for medium workload
                                            30
今日の話のまとめ
 分散アプリケーションでよく基盤として使われる分散
  ファイルシステムの利点など大ざっぱな
  背景を説明
 分散ファイルシステムでよく使われる基礎知識に
  関して説明
    – メタデータ管理手法、レプリケーション、ストライピング
   最新の研究として、分散ファイルシステムのデータ
    配置に関する論文を2本 Pick Up
    – 分散ファイルシステムにおける効果的なデータ配置
    – 分散アプリケーションの実行エンジンと分散ファイルシステム
      の連携

                                     31
Thank you for listening
     Question…?




                          32

Contenu connexe

Tendances

TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」(株)TAM
 
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」(株)TAM
 
VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-Takeshi Yamamuro
 
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」(株)TAM
 
Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理Yoji Kiyota
 
MapReduceプログラミング入門
MapReduceプログラミング入門MapReduceプログラミング入門
MapReduceプログラミング入門Satoshi Noto
 
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512Seiichiro Ishida
 
SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-Takeshi Yamamuro
 
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...Deep Learning JP
 
Coherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherenceCoherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherenceToshiaki Maki
 
データベース入門
データベース入門データベース入門
データベース入門拓 小林
 
Integration Technology of Ruby and DB.
Integration Technology of Ruby and DB.Integration Technology of Ruby and DB.
Integration Technology of Ruby and DB.Tamotsu Furuya
 
Hadoopとその周辺の紹介
Hadoopとその周辺の紹介Hadoopとその周辺の紹介
Hadoopとその周辺の紹介Shinya Okano
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中Satoshi Noto
 
Hadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントHadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントCloudera Japan
 
Session6 - LabVIEW NXG Training Course
Session6 - LabVIEW NXG Training CourseSession6 - LabVIEW NXG Training Course
Session6 - LabVIEW NXG Training CourseYusuke Tochigi
 
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」(株)TAM
 
マイニング探検会#10
マイニング探検会#10マイニング探検会#10
マイニング探検会#10Yoji Kiyota
 
LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側
LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側
LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側gipwest
 

Tendances (20)

TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
TAM 新人ディレクター システムスキルアップ プログラム第1回「サーバ概要」
 
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
TAM 新人ディレクター システムスキルアップ プログラム第2回「システム案件のヒアリング」
 
VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-VLDB'10勉強会 -Session 2-
VLDB'10勉強会 -Session 2-
 
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
 
Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理Hadoopによる大規模分散データ処理
Hadoopによる大規模分散データ処理
 
MapReduceプログラミング入門
MapReduceプログラミング入門MapReduceプログラミング入門
MapReduceプログラミング入門
 
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
 
SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-SIGMOD'10勉強会 -Session 8-
SIGMOD'10勉強会 -Session 8-
 
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
 
Coherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherenceCoherenceを利用するときに気をつけること #OracleCoherence
Coherenceを利用するときに気をつけること #OracleCoherence
 
データベース入門
データベース入門データベース入門
データベース入門
 
Integration Technology of Ruby and DB.
Integration Technology of Ruby and DB.Integration Technology of Ruby and DB.
Integration Technology of Ruby and DB.
 
Hadoopとその周辺の紹介
Hadoopとその周辺の紹介Hadoopとその周辺の紹介
Hadoopとその周辺の紹介
 
ただいまHadoop勉強中
ただいまHadoop勉強中ただいまHadoop勉強中
ただいまHadoop勉強中
 
Hadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイントHadoopのシステム設計・運用のポイント
Hadoopのシステム設計・運用のポイント
 
Session6 - LabVIEW NXG Training Course
Session6 - LabVIEW NXG Training CourseSession6 - LabVIEW NXG Training Course
Session6 - LabVIEW NXG Training Course
 
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
TAM 新人ディレクター システムスキルアップ プログラム第3回「Webサーバの選定」
 
MapR M7 技術概要
MapR M7 技術概要MapR M7 技術概要
MapR M7 技術概要
 
マイニング探検会#10
マイニング探検会#10マイニング探検会#10
マイニング探検会#10
 
LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側
LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側
LAMP技術者でも無理なくツカエルWindowsAzureで運営するソーシャルアプリの裏側
 

En vedette

Storage by Red Hat #rhcpday 2015
Storage by Red Hat #rhcpday 2015Storage by Red Hat #rhcpday 2015
Storage by Red Hat #rhcpday 2015Emma Haruka Iwao
 
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Cloudera Japan
 
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」オラクルエンジニア通信
 
Hadoop概要説明
Hadoop概要説明Hadoop概要説明
Hadoop概要説明Satoshi Noto
 
Q2 fy17 earnings slides final no guidance1
Q2 fy17 earnings slides   final no guidance1Q2 fy17 earnings slides   final no guidance1
Q2 fy17 earnings slides final no guidance1ir_cisco
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境DNA Data Bank of Japan center
 

En vedette (6)

Storage by Red Hat #rhcpday 2015
Storage by Red Hat #rhcpday 2015Storage by Red Hat #rhcpday 2015
Storage by Red Hat #rhcpday 2015
 
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
 
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
 
Hadoop概要説明
Hadoop概要説明Hadoop概要説明
Hadoop概要説明
 
Q2 fy17 earnings slides final no guidance1
Q2 fy17 earnings slides   final no guidance1Q2 fy17 earnings slides   final no guidance1
Q2 fy17 earnings slides final no guidance1
 
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
[DDBJ Challenge 2016] 遺伝研スーパーコンピュータのビッグデータ解析環境
 

Similaire à TokyoWebMining#18_nukamu

第2章アーキテクチャ
第2章アーキテクチャ第2章アーキテクチャ
第2章アーキテクチャKenta Hattori
 
Cloudianの構築と運用の基礎 (Cloudian Summit 2012)
Cloudianの構築と運用の基礎 (Cloudian Summit 2012)Cloudianの構築と運用の基礎 (Cloudian Summit 2012)
Cloudianの構築と運用の基礎 (Cloudian Summit 2012)CLOUDIAN KK
 
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Makoto Yui
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保するDNA Data Bank of Japan center
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...Insight Technology, Inc.
 
Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Akinori YOSHIDA
 
[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...
[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...
[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...Insight Technology, Inc.
 
SaaS/クラウドコンピューティングでのオープンソース活用とセキュリティ
SaaS/クラウドコンピューティングでのオープンソース活用とセキュリティSaaS/クラウドコンピューティングでのオープンソース活用とセキュリティ
SaaS/クラウドコンピューティングでのオープンソース活用とセキュリティKuniyasu Suzaki
 
Azure Cosmos DB を使った高速分散アプリケーションの設計パターン
Azure Cosmos DB を使った高速分散アプリケーションの設計パターンAzure Cosmos DB を使った高速分散アプリケーションの設計パターン
Azure Cosmos DB を使った高速分散アプリケーションの設計パターンKazuyuki Miyake
 
OpenStack Object Storage; Usage
OpenStack Object Storage; UsageOpenStack Object Storage; Usage
OpenStack Object Storage; Usageirix_jp
 
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat StorageEtsuji Nakai
 
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門Daiyu Hatakeyama
 
Rubyによるお手軽分散処理
Rubyによるお手軽分散処理Rubyによるお手軽分散処理
Rubyによるお手軽分散処理maebashi
 
Gluster fs and_swiftapi_20120429
Gluster fs and_swiftapi_20120429Gluster fs and_swiftapi_20120429
Gluster fs and_swiftapi_20120429Etsuji Nakai
 
Windows azureを知ろう ロール&ストレージ編
Windows azureを知ろう ロール&ストレージ編Windows azureを知ろう ロール&ストレージ編
Windows azureを知ろう ロール&ストレージ編Chiho Otonashi
 
Data replication and synchronization ガイダンス
Data replication and synchronization ガイダンスData replication and synchronization ガイダンス
Data replication and synchronization ガイダンスKazuhiro Taguchi
 
OSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; OverviewOSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; Overviewirix_jp
 

Similaire à TokyoWebMining#18_nukamu (20)

第2章アーキテクチャ
第2章アーキテクチャ第2章アーキテクチャ
第2章アーキテクチャ
 
Cloudianの構築と運用の基礎 (Cloudian Summit 2012)
Cloudianの構築と運用の基礎 (Cloudian Summit 2012)Cloudianの構築と運用の基礎 (Cloudian Summit 2012)
Cloudianの構築と運用の基礎 (Cloudian Summit 2012)
 
SQL Server 入門
SQL Server 入門SQL Server 入門
SQL Server 入門
 
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
 
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
[db tech showcase Tokyo 2017] A15: レプリケーションを使用したデータ分析基盤構築のキモ(事例)by 株式会社インサイトテ...
 
Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Data Center As A Computer 2章前半
Data Center As A Computer 2章前半
 
[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...
[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...
[db tech showcase Tokyo 2018] #dbts2018 #D24 『異種データベース間データ連携ウラ話 ~ 新しいデータベースを試...
 
SaaS/クラウドコンピューティングでのオープンソース活用とセキュリティ
SaaS/クラウドコンピューティングでのオープンソース活用とセキュリティSaaS/クラウドコンピューティングでのオープンソース活用とセキュリティ
SaaS/クラウドコンピューティングでのオープンソース活用とセキュリティ
 
Azure Cosmos DB を使った高速分散アプリケーションの設計パターン
Azure Cosmos DB を使った高速分散アプリケーションの設計パターンAzure Cosmos DB を使った高速分散アプリケーションの設計パターン
Azure Cosmos DB を使った高速分散アプリケーションの設計パターン
 
OpenStack Object Storage; Usage
OpenStack Object Storage; UsageOpenStack Object Storage; Usage
OpenStack Object Storage; Usage
 
Datomic&datalog紹介
Datomic&datalog紹介Datomic&datalog紹介
Datomic&datalog紹介
 
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
10年効く分散ファイルシステム技術 GlusterFS & Red Hat Storage
 
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門SQL Server 使いのための Azure Synapse Analytics - Spark 入門
SQL Server 使いのための Azure Synapse Analytics - Spark 入門
 
CCGrid2012 参加報告
CCGrid2012 参加報告CCGrid2012 参加報告
CCGrid2012 参加報告
 
Rubyによるお手軽分散処理
Rubyによるお手軽分散処理Rubyによるお手軽分散処理
Rubyによるお手軽分散処理
 
Gluster fs and_swiftapi_20120429
Gluster fs and_swiftapi_20120429Gluster fs and_swiftapi_20120429
Gluster fs and_swiftapi_20120429
 
Windows azureを知ろう ロール&ストレージ編
Windows azureを知ろう ロール&ストレージ編Windows azureを知ろう ロール&ストレージ編
Windows azureを知ろう ロール&ストレージ編
 
Data replication and synchronization ガイダンス
Data replication and synchronization ガイダンスData replication and synchronization ガイダンス
Data replication and synchronization ガイダンス
 
OSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; OverviewOSC2012 Nagoya - OpenStack - Storage System; Overview
OSC2012 Nagoya - OpenStack - Storage System; Overview
 

Dernier

Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directoryosamut
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdffurutsuka
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。iPride Co., Ltd.
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000Shota Ito
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxAtomu Hidaka
 

Dernier (9)

Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
Amazon SES を勉強してみる その12024/04/12の勉強会で発表されたものです。
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory20240412_HCCJP での Windows Server 2025 Active Directory
20240412_HCCJP での Windows Server 2025 Active Directory
 
UPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdfUPWARD_share_company_information_20240415.pdf
UPWARD_share_company_information_20240415.pdf
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
新人研修のまとめ       2024/04/12の勉強会で発表されたものです。新人研修のまとめ       2024/04/12の勉強会で発表されたものです。
新人研修のまとめ 2024/04/12の勉強会で発表されたものです。
 
PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000PHP-Conference-Odawara-2024-04-000000000
PHP-Conference-Odawara-2024-04-000000000
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptxIoT in the era of generative AI, Thanks IoT ALGYAN.pptx
IoT in the era of generative AI, Thanks IoT ALGYAN.pptx
 

TokyoWebMining#18_nukamu

  • 1. 分散ファイルシステムと 分散アプリケーションの研究 最新トピックス 東大大学院 情報理工学系研究科 修士2年 堀内美希 ( @nukamu )
  • 2. Agenda  イントロダクション – 少し自己紹介とか – 分散コンピューティングでの分散ファイルシステム の使用背景  分散ファイルシステムの基礎技術紹介  最新研究紹介 – 分散ファイルシステムにおける効果的なデータ配置 – 分散アプリケーションとの分散ファイルシステムの 連携  まとめ 2
  • 3. 少し自己紹介  名前: @nukamu  所属:東京大学大学院 田浦研究室  学年:修士2年  研究分野:分散コンピュー ティング(特に分散ストレー ジまわり)  プログラミング:C, pythonが特に好き  趣味:バンド、音楽系 3
  • 4. 分散ファイルシステム周りのwork  DDDFS (Dynamically-Duplicate Distributed File System) – 数週間前に行われたICTプログラムコンテストに応募 し賞を受賞 – Github - https://github.com/nukamu/dddfs  Mogami – 研究で作ってる 分散ファイル システム – 近日公開予定 4
  • 5. 分散ファイルシステムとは? 分散ファイルシステム  複数のストレージを束ねて使う  並列ファイルアクセスを可能にする 有名な分散ファイルシステム: PVFS, GPFS, Lustre, HDFS, Gluster etc. processes 5
  • 6. 分散ファイルシステムを使うことの 利点 – アクセスの並列化が可能なため高スループットが期待できる – 複数のプロセス(同一マシン上に限定しない)から同一ファイルが 参照可 File B File A File D File C ファイル共有ができる 高スループットを 得ることができる 6
  • 7. 分散アプリケーションでの 分散ファイルシステムの使われ方  ex.) ワークフローアプリケーション 分散ファイルシステム create – 依存関係のあるジョブの集合体 job – MapReduceもワークフローの A 一種といえる use job job BとCは同時 B A 実行が可能 job job B C  各ジョブ間での情報伝達をファイルを 介して行う→ファイル共有の必要性 job  図中ファイルはジョブAのoutputであり D かつジョブBのinput 依存関係グラフ 7
  • 8. ワークフロー実行エンジン  Swift[Zhao et al. 2007], Pegasus[Deelman et al. 2005], GXPMake[Taura et al. 2010] etc.. – マスターノードがジョブの依存関係に気を配りつつ、ワーカーノー ドにジョブをディスパッチ – ワーカー間ではファイルの共有が必要 分散ファイルシステム ワーカー ノード ジョブをディスパッチ マスター ノード 8
  • 10. メタデータの管理方法  多くの分散ファイルシステムでは・・・ データの場所 = メタデータとして管理 Data servers  メタデータサーバ  各ファイルのデータがどこにあるか管理 する  ファイルを要求するユーザに要求ファイル の場所を教えてあげる Metadata server 10
  • 11. レプリケーション  複数のサーバが同一ファイルのコンテンツを持つ(レ プリカ) File B File A File C Replica of File A Access Access Access ファイルへのアクセス競合を 避けることができる 11
  • 12. ストライピング  1つのファイルを複数のブロックに分割し、別々のスト レージに保存 – 並列アクセスによりI/Oスループットの向上が期待される 1/3 of A 2/3 of A 3/3 of A File A Access Access 12
  • 13. 本日のお題 – 最新研究トピックス  今回は主に分散ファイルシステム内でのデータの 最適配置関係のものを Pick Up 他にも色々 1. 分散ファイルシステムにおける効果的な 盛んに研究が データ配置 行われている  A Cost-intelligent Application-specific Data Layout Scheme for Parallel File Systems [H. Song et al. HPDC’11] 2. 分散アプリケーションと分散ファイルシステムの連携  A Workflow-Aware Storage System: An Opportunity Study [E. Vairavanathan et al. CCGrid’12] 13
  • 14. 本日のお題 – 最新研究トピックス  分散ファイルシステムにおける効果的なデータ 配置 – A Cost-intelligent Application-specific Data Layout Scheme for Parallel File Systems [H. Song et al. HPDC’11] とその周辺  分散アプリケーションと分散ファイルシステムの 連携 – A Workflow-Aware Storage System: An Opportunity Study [E. Vairavanathan et al. CCGrid’12] とその周辺 14
  • 15. 分散ファイルシステムでの効率的な データ配置とは?  レプリケーションやストライピングによりI/O スループットを向上させることができる  それでは、結果的にどのようなデータ配置が 効率的? 答え: アプリケーション に依存する Which is better? 15
  • 16. 一般的な3つのデータ配置方針 1-DV Layout 2-D Layout 1-DH Layout File A 一般的な分散 File B ファイルシステム File C では大抵実装 されている File D 16
  • 17. アクセスコスト推定モデル  I/Oアクセスコスト推定モデルを先程 e: 一つのネットワーク接続確立に 要するコスト の3種類のレイアウトタイプに関して v: ある単位のデータを転送するた 構築 めのコスト n: データサーバ数 α: 各I/Oのスタートアップコスト β: ある単位のデータを read/writeするのにかかるコスト Network me Establish Cost Network mv×(request Transmission size) Cost p: クライアントプロセス数 m: 一つのクライアント内 Storage Startup のプロセス数 (p/n)α Cost Process Process Process Process (p/n)β× 2 3 Storage I/O 0 1 (request Cost Client 0 Client 1 size) 17
  • 18. コスト推定モデルの確認実験 このグラフはシーケンシャル アクセス時の結果  図中x, ・, +の印は実際の 測定で一番効率的なI/O スループットを出したもの を示している  背景の色は先程のアクセ スコスト推定モデルで最も コストが低いと推定された ものを示している Access Total Case Correct Correct アクセスコスト推定 Type Count Count Rate モデルが大体正確で Random 4200 3821 90.98% あることを確認 Sequential 4200 3702 88.14% 18
  • 19. ハイブリッドデータレプリケーション 方針  全てのレイアウト方針に基づいたデータを用意し、最 も推定アクセスコストの低いものを計算してアクセス 1-DV 1-DH 2-D 各read, write時に一番アクセスコストの低いデータレイアウトを選ぶ 19
  • 20. ハイブリッドデータレプリケーション の効果測定  1-DHと比べたときの性能向上割合 提案手法では約70%の性能改善 20
  • 21. 本日のお題 – 最新研究トピックス  分散ファイルシステムにおける効果的なデータ 配置 – A Cost-intelligent Application-specific Data Layout Scheme for Parallel File Systems [H. Song et al. HPDC’11] とその周辺  分散アプリケーションと分散ファイルシステムの 連携 – A Workflow-Aware Storage System: An Opportunity Study [E. Vairavanathan et al. CCGrid’12] とその周辺 21
  • 22. 分散ファイルシステムの透過性  分散ファイルシステムを使うときにはデータがどこに 存在しているか意識する必要はない – どこからでもリモートのデータに透過的にアクセス  分散ファイルシステムの利点でありつつ性能最適化 の弊害にもなる 分散ファイルシステム(抽象化可) ワークフローアプリケーションなど アプリケーションサイド 22
  • 23. ワークフローアプリケーションのI/O パターン  Justin Wozniak et al PDSW’09 – ワークフローアプリケーション内でのI/Oパターンを 主流なものとして以下の4パターンに分類 Pipeline Broadcast Reduce Scatter/Gather 23
  • 24. 各I/Oアクセスパターンでの最適化 手法  Pipeline – ファイルを作るときローカルストレージにデータを置くように し、次のジョブを同じノードにディスパッチ  Broadcast – ファイルを作っているそばから積極的にレプリケーションを 並列で行う  Reduce – 全てのジョブが作るファイルをある同じノードに作るようにし、 次のジョブはそのノードで走らせる  Scatter/Gather – ファイルレベルではなく、ブロックレベルの最適化が必要 – 今回は実装、評価せず 24
  • 25. ワークフロー実行エンジンと分散 ストレージの連携実装 アプリケーションヒント (e.g., Pipeline, Broadcast, Reduceなど) ワークフロー 実行エンジン 計算ノード アプリケーション… アプリケーションアプリケーション POSIX API ローカル ローカル ローカル ストレージ ストレージ ストレージ ストレージヒント (e.g., ファイルの位置) Workflow-aware storage (shared) 25
  • 26. 評価:実験環境  MosaStore(改良あり), MosaStore(改良なし), NFS (, Local)  MosaStoreというのは論文筆者グループで開発して いる分散ファイルシステム アプリケーション … アプリケーション アプリケーション POSIX API ローカル ローカル ローカル ストレージ ストレージ ストレージ Stage Out Intermediate Storage Stage In Backend file system (e.g., GPFS, NFS) 26
  • 27. 評価:ベンチマーク - Pipeline  改良点: ファイルを自分のローカル で作成→同じノードに次のジョブを WF = WorkFlow-aware Average runtime for medium workload 27
  • 28. 評価:ベンチマーク – Broadcast (1/2)  改良点: 積極的なレプリケーション WF = WorkFlow-aware Best performance!! Average runtime for medium workload 28
  • 29. 評価:ベンチマーク – Broadcast (2/2)  さらにもう少し見てみる – レプリカ作成にかかった時間と アプリケーションの実行時間に分離 Best Performance!! 29
  • 30. 評価:ベンチマーク - Reduce  改良点: 一つのノードにファイルを 集め、そのノードにReduceジョブを WF = WorkFlow-aware Average runtime for medium workload 30
  • 31. 今日の話のまとめ  分散アプリケーションでよく基盤として使われる分散 ファイルシステムの利点など大ざっぱな 背景を説明  分散ファイルシステムでよく使われる基礎知識に 関して説明 – メタデータ管理手法、レプリケーション、ストライピング  最新の研究として、分散ファイルシステムのデータ 配置に関する論文を2本 Pick Up – 分散ファイルシステムにおける効果的なデータ配置 – 分散アプリケーションの実行エンジンと分散ファイルシステム の連携 31
  • 32. Thank you for listening Question…? 32