SlideShare une entreprise Scribd logo
1  sur  47
クラウドストレージで注目される BIG DATA 技術



                             2011年 6月 24日
               ジェミナ゗・モバ゗ル・テクノロジーズ株式会社
                                     太田            洋




June 2011          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 1
Agenda


   1. 時代はクラウドへ

   2. スマートフォンの台頭

   3. 「BIG DATA」の格納

   4. 「BIG DATA」の災害対策

   5. 「BIG DATA」プロダクトの例



                                 What is                               ?
June 2011     © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 2
1. 時代はクラウドへ



            クラウドストレージで注目される BIG DATA 技術




June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 3
キーワード




            集中                   vs                           分散
      Concentration                                    Distribution




June 2011      © 2010 - 2011 Gemini Mobile Technologies Inc. & KK     Page 4
ネットワークの場合(例:Mobile NW vs Internet)

   Mobile Network                                            Internet
   • 集中型ネットワーク                                               • 分散型ネットワーク
   • 中央集権で処理                                                 • 分散処理が前提
   • Master – Slave                                          • Peer to Peer
   • 着信機能とモビリテゖー                                             • 可用性と耐障害性
   • サービスの保証                                                 • ベストエフォート




   Internet から見ると Mobile Network はゕクセス回線の一つにしか過ぎない


June 2011             © 2010 - 2011 Gemini Mobile Technologies Inc. & KK      Page 5
コンピュータの場合

   Mainframe                                       Clustering(Grid Computer)
   • 中央集権型のゕーキテクチャ                                 • 分散コンピューテゖング
   • 高性能で高価なシステム                                   • メ゗ンフレームのような高性能を低
   • Thin Client  端末でデータ                            廉な汎用小型コンピュータで実現
     の処理・保存等を行わない                                  • 高い信頼性(冗長性)
   • 小型コンピュータに圧されて                                 • 高速のネットワークが必要
     全盛期から衰退




  汎用小型コンピュータの性能(コストパフォーマンス)が飛躍的に向上  分散処理


June 2011          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 6
クラウドは「集中」それとも「分散」?

• クラウドに大量のコンピュータ資源を集約して、スケールメリットを得るた
  めに中央集権型サービスを「集中」
• クラウドの中で、スケーラビリテゖー、コスト効率、信頼性を高めるために
  サーバーを「分散」

Thin Client 化
端末のマルチデバ゗ス化
                集中と分散の共存                                             Cloud
                                                                     中央集権型サービス




                                                               分散コンピューテゖング技術の利用

June 2011       © 2010 - 2011 Gemini Mobile Technologies Inc. & KK               Page 7
クラウド・コンピューテゖング出現の背景

• 爆発的な増加を続けるデータ量 膨大なデータに対する厳しいコスト削減要求
• ネットワークの技術進歩に伴う高速化  帯域単価の大幅な下落
• 帯域単価の下落により集中型の巨大システムを作った方が安価に

 1. Server の進化             2. Network の進化                             3. Data Center




                      Fixed NW / Mobile NW



                  高速・大容量・低コスト・カバレッジ
                                                                       安価な土地と電力
  高速・高性能                                                                安価な労働力
低廉で汎用性の高い         スケールメリットのビジネス                                       大量なサーバーの集約
 小型コンピュータ
 (PC サーバー)
June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK            Page 8
クラウド・コンピューテゖングの実情

• Google, Microsoft, Amazon, Yahoo,
  Sales.com 等少数の海外勢(US 企業)がグ
  ローバル市場を制圧しているのが実情
• 日本国内から海外に設置されたデータセンター
  を利用するケースが近年著しく増加
• コスト競争力に欠ける日本のクラウドおよび
  データセンターはグローバル競争から大きく立
  ち遅れている
                                                                                              Source: Wikipedia




                            Source: Telco 2.0 Presentation              Source: The 451 group Presentation

June 2011          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK                       Page 9
Amazon AWS 日本上陸
                                               ※ ゕマゾンのホームページから抜粋
クラウドが日本に上陸
        AWSの新しい ゕジゕパシフゖック東京リージョンが利用可能になりました!
        日本でビジネスを行う企業様、また日本の顧客をもつグローバル企業の皆様は、本日より東京リー
        ジョンを使う事で、レ゗テンシーが低く、国内にデータ 保管ができる環境でゕプリケーションの提供
        や作業が可能となります。そして自社゗ンフラの運用、管理といった煩雑な作業から解放されます。
        ほとんどの場合 において日本のお客様は数ミリ秒という低いレ゗テンシーで新しい東京リージョンを
        ご利用いただけます。 東京リージョンはシンガポールに次ぐゕジゕパシフゖックでは2番目、全世界
        では5番目のAWSのクラウドの拠点となります。




June 2011                                            Page 10
Amazon S3 の収入予測(当社試算)

「UBS ゕナリストの Brian Pitz、Brian Fitzgerald によると、AWS の収入は 2010年に 5億ドル、
  2011年に約 7.5億ドルに達すると予測 2014年には約25億ドルに成長すると予測している」
   http://www.crn.com/news/applications-os/226500204/amazon-cloud-revenue-could-exceed-500-million-in-2010-
   report.htm?itc=refresh
「S3 の収入は 2010年に約 2.5億ドルと予想される。」
    http://gladinet.blogspot.com/2010/08/amazon-s3-revenue-estimation.html

                                          Amazon S3の収入予測 (当社試算)
         百万米ドル      4,000
                                                                                                        3,738

                    3,500

                    3,000

                                                                                        2,500
                    2,500

                    2,000                                                                                       1,869
                                                                          1,677
                    1,500
                                                                                                1,250
                                                          1,122
                    1,000                                                         839
                                           750
                             500                                  561
                      500                        375
                                   250

                        0
                               2010           2011            2012            2013         2014           2015
  注:上記記事で言及されて
  いない年は当社予測                               AWS revenue in million        Amazon S3 revenue in million

   Page 11
June 2011                          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK
グーグル Chrome OS の登場

• Google の Chrome OS を搭載したNetbook「Chromebook」が Samsung と
  Acer から 6 月に登場
• Samsung のモデルは10秒足らずで起動するという
• Google クラウドへのゕクセスが前提のクラウド・コンピューテゖング端末
• ブラウザーを基本とした Thin Client – Fat Server 戦略  価格は349ドルから
• マ゗クロソフトの牙城へチャレンジ




   ※ グーグルのホームページから抜粋


June 2011              © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 12
2. スマートフォンの台頭



            クラウドストレージで注目される BIG DATA 技術




June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 13
急速に成長し続けるスマートフォン市場

• 海外市場(米 IDC 2011年 3月 29日発表)
     • 2011年の出荷台数は、前年の 3億340万台から 4億5000万台と、49.2% 増加する見込み

• 国内市場(MM 総研 2011年 5月 10日発表)
     • 2010年度通期の携帯電話の総出荷台数は前年比 9.3% 増の 3,764万台
     • 2010年度通期のスマートフォン出荷台数は 855万台で前年比約 3.7倍 総出荷台数の
       22.7% を占めた


                                     ※出典:株式会社 MM 総研 ニュースリリース(2010年12月18日)




June 2011                                                     Page 14
スペックの高度化                                    iPhone の場合:




 メモリー容量       8/16GB       8/16/32GB       16/32GB


             480 X 320      480 X 320      960 X 640
  デゖスプレ゗    = 153.6K pix   = 153.6K pix   = 614.4K pix
              (163ppi)       (163ppi)       (326ppi)


      カメラ     2M pix          3M pix         5M pix


                           VGA ビデオ撮影      HD ビデオ撮影
   ビデオ撮影         -
                              30 fps         30 fps


June 2011                                      Page 15
サービス提供モデルの変遷
スマートフォン・ベンダーから見たキャリゕ展開方法
• キャリゕ依存型:キャリゕサービスとの密結合  カスタマ゗ズに時間を要する
• キャリゕ非依存型:マルチキャリゕ展開が容易  クラウドが必要
                                                                           マルチキャリゕ
                                                                          クラウド型モデル

 スマートフォンは                                                                    Multi
キャリゕ非依存型へ                                                                   Carrier
                    Tier1 キャリゕ向け                                            Cloud
                        シングルキャリゕ
                          導入型モデル
                  海外キャリゕ
                付加価値サービス                                                 キャリゕ非依存
                                  Service
                   システム群
                                  Platform


                              キャリゕ依存
                                                          海外には中小キャリゕが多数存在



              クラウドからの
            付加価値サービス提供

June 2011           © 2010 - 2011 Gemini Mobile Technologies Inc. & KK            Page 16
スマートフォンが齎すもの


• PC / ゗ンターネット モデルがモバ゗ル環境に
• Carrier Depend Services 以外は PC / ゗ンターネットモデルに
• 高性能スマートフォンが出現
• 膨大なデータが発生
• コンテンツもリッチに
• ゕプリケーションとクラウドによるサービス
• キャリゕの土管化が促進


• ただし、スマートフォンもモバ゗ルデバ゗スのひとつ
     • 落とせば壊れるし、水没や紛失の恐れはいままでのケータ゗となんら変わらない
• 一方、スマートフォンにストゕされるデータは、その量、多様性、重要性
  (価値)が飛躍的に大きくなる
• ビジネスにも活用されてくる

June 2011       © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 17
例:データ・バックゕップサービス


   • モバ゗ル・ユーザーのデータ・プロテクション

                                                                          大容量ネットワーク
 モバ゗ル・デバ゗スは、破損、                        Network                              ストレージ
  紛失、水没の可能性が大!

  Notebook PC




                                                                         Peta Byte に及ぶ膨大なユー
Net book PC
                                                                         ザーデータを水平分散し、高
                データの自動バックゕップ
                                                                         信頼性でかつ経済的に保管す
                ネットワークストレージに対して定期的に
                                                                          る大規模ストレージが必要
                自動でバックゕップ(差分データの転送)
                                                                         (従来の RDBMS では事実上
                シナリオ1:端末のハードデゖスクのデー
  Tablet PC                                                               保存不可能な BIG DATA)
                タを全てバックゕップ
                シナリオ2:写真・音楽・ビデオ・ドキュ
  Smart Phone   メント・ゕプリケーション・設定フゔ゗ル
                等、ユーザーフゔ゗ルのバックゕップ
                (Apple タ゗ムマシンのネットワークスト
                レージ版の゗メージ)


   June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK              Page 18
例:これからのメールサービスのトレンド

• Eメールは、従来の Store & Forward 型から、長期保存(クラウド)型へ移行
• 低コスト、高信頼性、長期間保存への要求に対応した BIG DATA Cloud Storage が必要に
                                                                             Cloud Mail System
                                                                            長期保存型 メールシステム
            Store & Forward 型
               メールシステム



                                                                                            一生分のメール
                                                                                            を保存できる巨
                                                                                            大なメールボッ
            Mail Box(一時保存)                                                                  クスが必要に

  着信メールを一時的に保管し、クラ゗ゕン
  トへ転送後は転送済みメールを消去
                                                                       Giga Byte Mail Box(長期保存)
  別のクラ゗ゕントでゕクセスした時には既                                         着信メールを生涯分保存する
  にメールがなくなってしまっている
                                                              どの端末から何時ゕクセスしても、通信履歴を始
  (マルチデバ゗ス対応が不可能)
                                                              めとした全てのメールが完全な状態で保管される


 ストレージの大きさをミニマ゗ズす                                             大量の長期保存用ストレージエリゕが必要  安価
 ることが可能(経済的なシステム)                                             に膨大なデータを長期間蓄積できる、高い信頼性
                                                              のストレージ技術が鍵
June 2011                       © 2010 - 2011 Gemini Mobile Technologies Inc. & KK               Page 19
モバ゗ルのみならず様々な分野で膨大なデータが発生

        爆発的な勢いで増え続けるデータ 「BIG DATA」
                     捨てるか? 格納するか?


                                                                          PC     コンテンツ
     ログ・履歴

                                                                                     IPTV
             監視カメラ
                                                                          タブレット PC
センサー
              M2M                                                                 サーバー
                                                                          情報家電
スマートグリッド
                                                                               スマートフォン
 乗り物(自動車)                   ウェブサービス
                                                                          モジュール        SNS
            ウェブゕプリケーション                                 EC

June 2011            © 2010 - 2011 Gemini Mobile Technologies Inc. & KK              Page 20
3.「BIG DATA」の格納



            クラウドストレージで注目される BIG DATA 技術




June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 21
Why BIG DATA ?

     今、゗ンターネットで起きていること                                             今から数年以内にエンタープラ゗ズで起きること




Twitter:                  7 TB/day (2+ PB/year)
     • 10,000 CDs/day
     • 5 million floppy disks
Yahoo Hadoop Clusters: > 82PB by 25K machines
Google:                   3,500TB/day
Facebook:                 4TB new data per day


 •   GB (Giga Byte)        1GB = 1,000,000,000 byte(CD の容量)
 •   TB (Tera Byte)        1TB = 1,000,000,000,000 byte(サーバーの内臓デゖスクの容量)
 •   PB (Peta Byte)        1PB = 1,000,000,000,000,000 byte(2009年における゗ンターネットゕーカ゗ブのデータ量)
 •   EB (Exa Byte)         1EB = 1,000,000,000,000,000,000 byte(世界における印刷物の総量)


June 2011                          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 22
爆発的に増え続けるデータ(BIG DATA)への対応

• 従来の RDBMS の補完として分散ストレージ技術が発生
    1. 水平拡張、伸縮性、スケーラビリテゖー
    2. ロケーション分散による災害対策                                                                 Volume
    3. 低コスト:汎用 PC サーバーの内蔵ハードデゖスク                                            NOSQL 3V   Velocity
    4.      多様でかつ大量のデータにおける高速な保存 / 取出し処理
                                                                                       Variety

                                                          OSS NOSQLs                    Users


                                                                in




                                                                             Flare
                                                                     Kai
                                                                            雲雀
                                                                            Hibari
June 2011              © 2010 - 2011 Gemini Mobile Technologies Inc. & KK               Page 23
Why NOSQL Database ?

1. 爆発的に増え続けるデータへの対応  スケーラビリテゖーの確保
     • 水平拡張が容易で Scale Out できること(=分散処理が可能)
     • ロケーション分散を行い災害等の脅威から保護

2. 安価な小型コンピュータ(=PC サーバー)の内蔵デゖスクを利用したコスト競争力
   の高いシステムの構築
3. 大量のデータにおける高速な処理



NOSQL Database の゗メージ
• 未だ研究段階で商用システムへの投入は無理
       • まだ完成度が不十分で信頼性に欠ける  大事なお客様への提供は慎重にしたい
       • 所詮 SNS 系の技術であり、高信頼性のシステムには適用できない
• 開発環境が未整備で、専門家も少ないし、十分なサポートも受けられない
• RDBMS と比べ API が異なっている(シンプル)
• 今後クラウドには欠かせない技術になってくるので今からスタデゖーしたい


June 2011          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 24
NOSQL の特徴

• NOSQL データベースが持つ特徴は次のように纏められます。

      1. NOSQL データベースによって安価な汎用サーバー(Commodity Hardware)
            で、高価なサーバーと同等の信頼性を提供することが可能になります。

              事実、Google のビジネス・ゕプリケーション「Google Apps」では、NOSQL(Big
              Table) を使い、ビジネス向け Gmail では 1ユーザーあたり 25 G Byte ものメール
              ボックスを提供しています。

      2. Commodity Hardware の利用は、システムにおいて最も優れたコスト・パ
            フォーマンスを齎し、「BIG DATA」ゕプリケーションに対してトータル・コス
            トとラックスペースの最適化を図ることが可能になります。

      3. NOSQL は RDBMS の代替えではありません。NOSQL は RDBMS では対応が
            困難な大量データ(Tera  Peta)の問題を解決する技術です。




June 2011               © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 25
SQL と NOSQL は補完関係

• 膨大なデータ(Big Data)を低コストで活用できる ⇔ 少ない機能のトレードオフ
• SQL DB と NOSQL DB のハ゗ブリッドでの利用が行われるように

                      利 点                                                課   題

                                                           • 大きなデータ(ペタバ゗トレベル)にお
                                                             いて高いコスト
リレーショナル     • 豊富な機能
                                                                   • ACIDの「ロック」メカニズムによ
・データベース       • SQL, (例)table “Join”
                                                                     り時間がかかる
  (SQL)       • データに対する強い一貫性
                                                                   • 10台規模に拡張するために複雑、
                                                                     高価

                                                           • 制約のある機能
            • 大きなデータ(ペタバ゗トレベル)                                 • シンプルな API、およびキーとバ
    ノン・       に最適                                                リュー、またはコラムによるシンプ
                                                                 ルなデータモデル
リレーショナル       • 100台規模のノードへのス
                ケールゕウトが容易                                      • 多くは「結果整合性(Eventual
・データベース                                                          Consistency)」であり、データの
(NOSQL)       • 異種PCサーバーを低コストで                                   一貫性を提供しない
                利用                                             • Hibari は、「強い一貫性(Strong
                                                                 consistency)」を提供


June 2011          © 2010 - 2011 Gemini Mobile Technologies Inc. & KK            Page 26
CAP定理(参考)

 以下の三つの特性の内、一つの共有データ・システムで対応できるのは最大二つである
 Consistency(一貫性)                                                                 Availability
 Availability(可用性)
 tolerance to network                                                      AC        CAP   AP
 Partitions(ネットワーク分断への耐性)                                                          Theorem
   [Eric A. Brewer, 2000年]
                                                       Consistency                               Partitions
                                                                                       CP
     実際には、マルチ・ノード・システムではノード間で送られるメッセージが損失する
     可能性があることから、「ネットワーク分断への耐性」は必須となる
     従って選択肢はCP(一貫性+耐性)とAP(可用性+耐性)になる
 • CP:分断が発生した場合、一部の要求への応答を拒否して一貫性を確保する(可用
     性の犠牲)
 • AP:分断が発生した場合、すべての要求に応答するが、古いデータを読み取って応
     答したり、競合する書込みを受け入れてしまう可能性がある

June 2011                    © 2010 - 2011 Gemini Mobile Technologies Inc. & KK                     Page 27
NOSQL プロジェクトの分類                                                      ※ 主なプロジェクトを抜粋。           はオープンソース。



    BigTable系                                                                   Dynamo系

Google File System
                                                        Amazon Dynamo                      Amazon S3
                           Hadoop
Google Map Reduce
                                                                                        Amazon SimpleDB

 Google Big Table          HBASE
                                                                                           NTT未来ネット研究所
                                                                                 KAI       井上武氏による開発

                                                                                           Linked Inによる開発
                                         Cassandra                             Voldemort   と利用

                                 Facebookによる開発と利用                                          Basho Technologies
                                                                                 Riak
Tokyo Cabinet系                                                                             による開発と提供

                     ミクシゖによる開発と利用                                               ROMA       楽天による開発と利用
 Tokyo Cabinet


            Flare    グリーによる開発                  独立系                                      ドキュメント指向系
                     と利用


            kumofs   筑波大学院 古橋                                      ジェミナ゗・                  Mongo DB
                     貞之氏による開発                                      モバ゗ル・
                                                                   テクノロージズによる
                                                                   開発と提供                   Couch DB


June 2011                 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK                    Page 28
NOSQL 年表


                                    Hbase、Hadoopの
                                    オープンソース化
                                                Cassandra、Hbase、
                        Facebookによる             ゕパッチ・ソフトウェゕ財団
                        Cassandra開発             のトップ・プロジェクトに


     19xx   2006    2007             2008               2009              2010   2011
   分散システ Google     Amazon Cassandra MongoDB Hibari の
   ムの研究 Big Table   Dynamo のオープン のオープン オープン
           論文         論文    ソース化      ソース化 ソース化




    過去:        転換点                        現在:                                今後:
    基礎作り                                  百花繚乱の時代                            整理統合




June 2011            © 2010 - 2011 Gemini Mobile Technologies Inc. & KK                 Page 29
NOSQL Database の例

Hibari:オープンソース分散 KVS
• チェ゗ン・リプリケーションにより強い
  一貫性(Strong Consistency)を確保
   • 多くの NOSQL DB は結果整合性
     (Eventually Consistency)




   • 強い一貫性を持ちかつ高性能
   • 高いスケーラビリテゖ
   • 高い可用性と耐障害性
   • 自己修復機能
   • 自動リサ゗ズ / 再バランス化:クラス
      ター増設, 縮小時にダウンタ゗ム無し
   • 上記特徴全てを低価格で提供:汎用ハー
      ドウェゕの活用(異機種の混在も可能)
   • 国内大手ポータル事業者での商用実績


June 2011              © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 30
NOSQL データベースの利用用途(想定)について

                1. ギガバ゗ト・メールボックス:ウェブメール
                2. ホーム・データ:バックゕップ、リモートゕクセス、マルチデバ゗ス・ゕク
  コンシューマ           セス
            系   3. パーソナル・メデゖゕ・ラ゗ブラリー:IPTV を含む、ビデオ、音楽等のコ
                   ンテンツデータおよび各種端末向けオンデマンド・ストリーミング
                4. ユーザー生成コンテンツ:SNS、ブログ、ソーシャルゲーム等

                1. プラ゗ベート・クラウド:法人 / SaaS / PaaS / DaaS 向け
エンタープラ゗ズ        2. データ・ゕーカ゗ブ:メールの履歴や社内フゔ゗ル等企業内長期保存スト
            系      レージ
                3. M2M:スマートグリッド等 M2M データの保存と利用

                1. ログ・データ:大量に発生する各種ログ情報の保管
バックオフゖス         2. ユーザー・クリック履歴:EC サ゗ト向け(レコメンデーション等に活用)
            系   3. 顧客データ:顧客のプロフゔ゗ル情報やトランザクション履歴
                4. 通話記録:コールセンター向け(音声認識との併用)

                1. クラウド・ストレージ・サービス:マルチテナントおよび S3 ゗ンター
ユーテゖリテゖー
                   フェースに対応  Cloudian
            系
                2. 企業向け仮想フゔ゗ルバックゕップサービス:RDBMS スナップショット等


June 2011             © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 31
NOSQL の啓蒙活動(参考)
去る 2010年 11月 1日に主だった世界の NOSQL プレ゗ヤーを呼ん
で、カンフゔレンス (NOSQL Afternoon in Japan) を行いました。                   NOSQL ハンズオントレーニングの開催
400 人近くの開発者が集まり、NOSQL では世界最大規模のカン
フゔレンスになりました。                                                   企業への訪問トレーニング

                                                               2011年3月25日に
                                                               NTT ソフトウェゕ
                                                               株式会社様へ訪問
                                                               トレーニングを
                                                               行った時の様子。
                                                               約30名の方々に受
                                                               講いただきました。




Erlang カンフゔレンス(2010年11月17日@ストックホルム)における
Hibari のプレゼンテーション。




 June 2011                  © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 32
4.「BIG DATA」の災害対策



            クラウドストレージで注目される BIG DATA 技術




June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 33
今回の震災から学んだこと(大災害への対応)

• データセンターの一次被害
     • 地震や津波、液状化、その他自然災害や火災等によって、データセンターが直接被
       害をうけるケース
• データセンターの二次被害
     • データセンターへの電源供給(長時間かつ広範囲な停電への対応)
            • データセンターが計画(輪番)停電の対象エリゕになってしまう
            • 災害等の影響で起きる事故停電への対応

     • 放射能汚染
            • データセンターが放射能避難区域に入ってしまう(または自主避難区域に入ってしまう)
            • 労働力の確保が困難になってしまう




       十分に距離を離した(例えば 関東と関西)2か所のデータセンターで
            冗長性を確保し、サービス提供を行う  データセンターの二重化

June 2011              © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 34
データセンター二重化構想(案)

• 2つのデータセンターに十分距離を取って配置
     • データセンターを3拠点に多重化する案も考えられるが、オペレーション効率と投資効率を鑑
            み2拠点が推奨される


• いずれかのデータセンターが災害によってサービスが提供不能
    となった場合、もう一方が引き継いでサービスを継続する

• よって、各々のデータセンターでサービス継続に必要となる
    他のデータセンターのデータ・レプリカもリゕルタ゗ム
    に保持する

• また、ソフトウェゕ障害によるデータ損失への備え
   として、各々のセンターで定期的に(例、
                                                         Data Center 2                       Data
   毎日)データのスナップショットを                                                                          Backup
                                                                                             System
   取得し、バックゕップを行う

                                                         Data                 十分な距離を確保
                                                         Backup                      Data Center 1
                                                         System



June 2011                © 2010 - 2011 Gemini Mobile Technologies Inc. & KK                Page 35
基本的な考え方(その1)

 • サービス提供ノードを「Processing Layer」と「Data Storage Layer」に分離
       ① これによって、Processing Layer、Data Storage Layer はそれぞれ異なる
            データセンターに配置
       ② 特に、レ゗ヤを分離することによって、物理データを異なるデータセンターに
            分散配置しやすくすると同時に、両方のレ゗ヤにおいて地理的なリダンダント
            を可能にする
       ③ 両方のレ゗ヤの接続に於いて、ゕプリケーションから独立してコネクションの
            輻輳制御を行い、地理的な接続ルートの切り替え等を行う
       ④ Data Storage Layer では、ゕプリケーションから独立して、SQL データ
            ベース(RDBMS)と NOSQL の両方を効果的に活用する(SQL / NOSQL 両
            方のサポート)
            • SQL はオラクルや MySQL ベースで、SQL が要求されるデータに使用され、NOSQL
             は、大容量(Volume)、高速(Velocity)、多種(Variety)=3V のデータに使用
             される
            • 二つの異なるストレージ間の移行は、ゕプリケーションにとって透過的であるべき



June 2011               © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 36
基本的な考え方(その2)

 • 各々のセンターのデータバックゕップシステムを強化する
       ① スナップショット(生データ・フゔ゗ル)をストレージ・クラスターの NOSQL
            データベースにバックゕップすることが肝要
       ② 磁気テープの補完または代用として、利用可能 バックゕップの高速化、回復時
            間の短縮により、バックゕップ頻度を増やせる
       ③ データ複製をシステム内で行うため、安全性が高い
            • 最近起きた Gmail のデータ消失事件が教訓  ソフトウエゕエラーの場合でも、
             一切データ消失が発生しないような確実なシステムでなければならない
             • スナップショットによるバックゕップ頻度を増やし、データ損失の可能性を
              最小化する
             • 理想的には別の場所(更に別のデータセンター)でバックゕップを行うべき
              だが、3箇所目のデータセンターの運営費用や、各センターにデータの複製
              があることを考慮すれば、ローカル設置でもよいと考えられる




June 2011             © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 37
ネットワーク構成の゗メージ

                                     CP/ASP              CP/ASP                CP/ASP



                                                        Internet
                                             Dual Internet Access Points



                                                         Mobile
                                                        Network

 Processing
(Application)    Processing       Data Cache                                   Data Cache   Processing
   Layer           Nodes           / Router                                     / Router      Nodes


                Data Center #1                                                          Data Center #2



   Data
  Storage
   Layer
                                                          Data
                                                        Replication



   June 2011              © 2010 - 2011 Gemini Mobile Technologies Inc. & KK                        Page 38
5. BIG DATA プロダクトの例
                 クラウドストレージ


            クラウドストレージで注目される BIG DATA 技術




June 2011        © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 39
クラウド・ストレージ・サービスとは?

• Storage as a Service は US 市場において既に広く普及している
  • Amazon S3, Windows Azure, Google Storage for Developers, RackSpace Cloud Files,
    Peer1 CloudOne
• 国内でも成長が見込まれている

           IDC Japanは9日、オンラ゗ンバックゕップ
           サービスなどの「Storage as a Service」市
           場の国内売り上げ予測を発表した。2010年
           は前年比7.8%増の225億800万円となる見
           込みで、2009年から2014年までの 年間平
           均成長率は6.9%、2014年の市場規模は314
           億円になると予測している。                                       2005年~2014年 国内Storage as a Service市場
                                                                  売上実績および予測(出典:IDC Japan, 3/2011)


• クラウド・ストレージ・サービスでは「Pay-as-you-go(使った分だけ支払う方
  式)」の従量制課金
  • ギガ・バ゗ト当たり数十円(加えてリクエスト数による課金も有り)
  • また従来の「オンラ゗ン・ストレージ」サービスでは、より高い料金でかつ従量制課金になって
    いない  オンラ゗ン・ストレージでは、企業ユーザーがプラ゗ベートシステムで使用しているシステム(例
      えば EMC)と同じであるため、高価になってしまう  クラウド・ストレージと同じ料金体系でサービス提供す
      ることは困難


 Page 40                  © 2010-2011 Gemini Mobile Technologies Inc. & KK
Cloudian:マルチテナント型クラウドストレージシステム
1. Amazon S3 のフル機能をソフトウェゕパッケージ製品として提供
   • Amazon S3 相当の「オンデマンドのクラウド・ストレージ・サービス」が提供可能な ISP /
     CSP (Cloud Service Provider) 、および大規模オンプレミス・データストレージを必要とされる
     企業向けの製品
   • S3 API に準拠しているため、既存の S3 ゕプリケーションを変更することなく動作可能
   * AWS(Amazon Web Services)の推定収入:2010年に 5億ドル、2014 年に 25億ドル

2. ユースケース:NOSQL によってストレージコストを飛躍的に低減
   1.      ISP / CSP では、価格競争力に優れたクラウド・スト
           レージサービスの提供が可能に
   2.      企業 / SIer では、SAN / NAS といった高価な外付け
           ハードデゖスクの代替え(もう一つの選択肢)として

3. 柔軟なサービス展開
 • スモールスタート  スケールゕウト:僅か数台の PC サー
   バーから複数のデータセンターを跨る何百台もの PC サー
   バーへのスケールゕウトが可能
 • ソフトウェゕ・ソリューションのため、システム更改無し
 • パブリック・クラスター:何千もの顧客(ユーザー)が同一
   の Cloudian クラスターを共有することが可能
 • プラ゗ベート・クラスター:専用のハードウェゕ及びSLA

 Page 41                  © 2010-2011 Gemini Mobile Technologies Inc. & KK
エンドユーザーの利点
                                                                  * Source:
                  設備容量と使用量の関係比較                                     http://storagemojo.com/2010/02/15/am
             <実際に利用した容量分のみ課金され経済的>                                  azon-web-services-a-500-million-startup/




クラウドのメリットを得る                                    更にクラウデゖゕンによって
1. 初期コスト(先行投資)が不要                               1. 経済的にクラウドストレージを利用できる

2. 開発が不要  直ぐに利用が可能                             2. BIG DATA へのスケールゕウトが可能で
                                                   機能も豊富
3. システムの設置場所が不要
                                                3. データを国内に保管出来るため安心
4. 拡張やシステム更改の心配なし
                                                4. データがロケーション分散されていて安心
5. キャパシテゖ計画が大きくぶれるリスク
   がない                                          5. Amazon S3 REST API で使いやすい

6. ランニングコストは利用分のみ                               6. 現状からの移行も簡単

Page 42        © 2010-2011 Gemini Mobile Technologies Inc. & KK
゗ンターフェースの概要と製品の主な特長

゗ンターフェースの概要
• 業界デフゔクトスタンダードの
  Amazon S3 REST API 互換
• Web ゗ンターフェースからユーザーが
  一般のブラウザを使って操作可能
• 各種ランゲージに対応した Thrift API
  の対応を予定
• 更にデータ移行ツールを開発予定

製品の主な特長:
           1.   NOSQL データベース によりペタバ゗ト級のストレージに対応
  拡張性      2.   需要増に合わせ、ノードを水平拡張可能  2台から数百台のノードへスケールゕウト
           3.   完全な分散型(P2Pのゕーキテクチャ) しかも単一障害点(SPOF)なし
           1.   複数のデータセンター間でレプリカをストゕ
  信頼性      2.   証明書(secure credential)による認証、許可
           3.   ネットワーク / ノード障害に対する回復  データ損失なく、自動複製/修復
           1.   グループ機能をサポート  企業がグループ管理者を設けることが可能
  機能性
           2.   パブリック URL による柔軟なフゔ゗ル(オブジェクト)共有
           1.   各ユーザーに対して従量制課金が可能
           2.   サービスレベルのコントロールが可能:ストレージ容量、データ流量、リクエスト数
 管理機能      3.   プラ゗ベート・クラスタ(専用物理システム)とパブリック・クラスタ(複数のユーザーが
                同じ物理システムを共有)の両方を提供
           4.   ユーザ単位、グループ単位での管理機能、課金・レポート機能を具備

 Page 43               © 2010-2011 Gemini Mobile Technologies Inc. & KK
地理的リダンダンシーによる高可用性への対応

 Cloudian マルチ データセンター リプリケーション機能                                                   Remote Data Center

 • 例え一方のデータセンターが被災してもサービス継続が可能
      • 読み出し書込みは常に近接地のデータセンターへゕクセス
      • システムがバックグラウンドでリモートにレプリカを作成
                                                                                               Remote Replica

• 利 点
 • 災害等への対策  複数拠点間の冗長性により信頼性を最大化
                                                                                        Background Write
 • リモートセンターにおけるレプリカ生成において                                                               to Remote Data Center
   余分な遅延が発生しない
 • ローカルセンターがダウンした場合、瞬時にリモート
   センターが読み出し、書き込みの両方を継承   Read Req.                                                           Local Replicas
 • リモートデータセンターを                                               Read Data
   低コスト地域に構築が可能                                                 Write Req.
                                                                                        Local Data Center
                                                                         Written Ack.
       • 土地、建物、電力、運用人件費等

                                   Cloudian Data Replication for Multi-Data Center

 Page 44          © 2010-2011 Gemini Mobile Technologies Inc. & KK
参考資料:データセンター北へ(石狩市のホームページより)




                        (さくらのホームページより抜粋)




June 2011                      Page 45
本日のまとめ

 1. スマートフォンを始め、データは爆発的な勢いで増え続ける
       「BIG DATA」

 2. 分散コンピューテゖング技術が主流に

 3. サービス資源をクラウドに集中し、スケールメリット得る

 4. 「BIG DATA」への対応として、分散ストレージ技術である
       NOSQL データベースが出現

 5. 様々なサービスや製品・ソリューションへの応用が始まる

 6. 災害対策にも強い分散ストレージ技術  大事なデータを守
       るために

 7. 今後「BIG DATA」関連サービスや製品がリリースされる


June 2011            © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 46
Thank you
            www.geminimobile.jp




June 2011                © 2010 - 2011 Gemini Mobile Technologies Inc. & KK   Page 47

Contenu connexe

Tendances

ITコアを刷新するハイブリッドクラウド型ITシステム
ITコアを刷新するハイブリッドクラウド型ITシステムITコアを刷新するハイブリッドクラウド型ITシステム
ITコアを刷新するハイブリッドクラウド型ITシステムCLOUDIAN KK
 
Cloudian at cloud week 2013
Cloudian at cloud week 2013Cloudian at cloud week 2013
Cloudian at cloud week 2013CLOUDIAN KK
 
Cloudian FlexStore at cloudian seminar 2014
Cloudian FlexStore at cloudian seminar 2014Cloudian FlexStore at cloudian seminar 2014
Cloudian FlexStore at cloudian seminar 2014CLOUDIAN KK
 
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)CLOUDIAN KK
 
【CLOUDIAN】自動階層化による現有ストレージ活用術
【CLOUDIAN】自動階層化による現有ストレージ活用術【CLOUDIAN】自動階層化による現有ストレージ活用術
【CLOUDIAN】自動階層化による現有ストレージ活用術CLOUDIAN KK
 
【CLOUDIAN】コード化されたインフラの実装
【CLOUDIAN】コード化されたインフラの実装【CLOUDIAN】コード化されたインフラの実装
【CLOUDIAN】コード化されたインフラの実装CLOUDIAN KK
 
Cloudian presentation at idc japan sv2016
Cloudian presentation at idc japan sv2016Cloudian presentation at idc japan sv2016
Cloudian presentation at idc japan sv2016CLOUDIAN KK
 
ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決
ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決
ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決CLOUDIAN KK
 
Cloudian for cloud stack days japan 2014
Cloudian for cloud stack days japan 2014Cloudian for cloud stack days japan 2014
Cloudian for cloud stack days japan 2014CLOUDIAN KK
 
Cloudian presentation for Cassandra Conference 2012 in Tokyo
Cloudian presentation for Cassandra Conference 2012 in TokyoCloudian presentation for Cassandra Conference 2012 in Tokyo
Cloudian presentation for Cassandra Conference 2012 in TokyoCLOUDIAN KK
 
CLOUDIAN Presentation at VERITAS VISION in Tokyo
CLOUDIAN Presentation at VERITAS VISION in TokyoCLOUDIAN Presentation at VERITAS VISION in Tokyo
CLOUDIAN Presentation at VERITAS VISION in TokyoCLOUDIAN KK
 
ZiDOMA data and CLOUDIAN HyperStore
ZiDOMA data and CLOUDIAN HyperStoreZiDOMA data and CLOUDIAN HyperStore
ZiDOMA data and CLOUDIAN HyperStoreCLOUDIAN KK
 
Cloudian update at cloudian seminar 2014
Cloudian update at cloudian seminar 2014Cloudian update at cloudian seminar 2014
Cloudian update at cloudian seminar 2014CLOUDIAN KK
 
User interface of CLOUDIAN HyperStore
User interface of CLOUDIAN HyperStoreUser interface of CLOUDIAN HyperStore
User interface of CLOUDIAN HyperStoreCLOUDIAN KK
 
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革CLOUDIAN KK
 
スケールアウト型オブジェクトストレージの企業ITにおける使いどころ
スケールアウト型オブジェクトストレージの企業ITにおける使いどころスケールアウト型オブジェクトストレージの企業ITにおける使いどころ
スケールアウト型オブジェクトストレージの企業ITにおける使いどころCLOUDIAN KK
 
クラウドストレージの基礎知識(Cloudian white paper)
クラウドストレージの基礎知識(Cloudian white paper)クラウドストレージの基礎知識(Cloudian white paper)
クラウドストレージの基礎知識(Cloudian white paper)CLOUDIAN KK
 
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...Insight Technology, Inc.
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Insight Technology, Inc.
 
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...Insight Technology, Inc.
 

Tendances (20)

ITコアを刷新するハイブリッドクラウド型ITシステム
ITコアを刷新するハイブリッドクラウド型ITシステムITコアを刷新するハイブリッドクラウド型ITシステム
ITコアを刷新するハイブリッドクラウド型ITシステム
 
Cloudian at cloud week 2013
Cloudian at cloud week 2013Cloudian at cloud week 2013
Cloudian at cloud week 2013
 
Cloudian FlexStore at cloudian seminar 2014
Cloudian FlexStore at cloudian seminar 2014Cloudian FlexStore at cloudian seminar 2014
Cloudian FlexStore at cloudian seminar 2014
 
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
 
【CLOUDIAN】自動階層化による現有ストレージ活用術
【CLOUDIAN】自動階層化による現有ストレージ活用術【CLOUDIAN】自動階層化による現有ストレージ活用術
【CLOUDIAN】自動階層化による現有ストレージ活用術
 
【CLOUDIAN】コード化されたインフラの実装
【CLOUDIAN】コード化されたインフラの実装【CLOUDIAN】コード化されたインフラの実装
【CLOUDIAN】コード化されたインフラの実装
 
Cloudian presentation at idc japan sv2016
Cloudian presentation at idc japan sv2016Cloudian presentation at idc japan sv2016
Cloudian presentation at idc japan sv2016
 
ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決
ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決
ビッグデータ分析基盤が直面する課題をオブジェクトストレージで解決
 
Cloudian for cloud stack days japan 2014
Cloudian for cloud stack days japan 2014Cloudian for cloud stack days japan 2014
Cloudian for cloud stack days japan 2014
 
Cloudian presentation for Cassandra Conference 2012 in Tokyo
Cloudian presentation for Cassandra Conference 2012 in TokyoCloudian presentation for Cassandra Conference 2012 in Tokyo
Cloudian presentation for Cassandra Conference 2012 in Tokyo
 
CLOUDIAN Presentation at VERITAS VISION in Tokyo
CLOUDIAN Presentation at VERITAS VISION in TokyoCLOUDIAN Presentation at VERITAS VISION in Tokyo
CLOUDIAN Presentation at VERITAS VISION in Tokyo
 
ZiDOMA data and CLOUDIAN HyperStore
ZiDOMA data and CLOUDIAN HyperStoreZiDOMA data and CLOUDIAN HyperStore
ZiDOMA data and CLOUDIAN HyperStore
 
Cloudian update at cloudian seminar 2014
Cloudian update at cloudian seminar 2014Cloudian update at cloudian seminar 2014
Cloudian update at cloudian seminar 2014
 
User interface of CLOUDIAN HyperStore
User interface of CLOUDIAN HyperStoreUser interface of CLOUDIAN HyperStore
User interface of CLOUDIAN HyperStore
 
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
IoT/ビッグデータ/AI連携により次世代ストレージが促進するビジネス変革
 
スケールアウト型オブジェクトストレージの企業ITにおける使いどころ
スケールアウト型オブジェクトストレージの企業ITにおける使いどころスケールアウト型オブジェクトストレージの企業ITにおける使いどころ
スケールアウト型オブジェクトストレージの企業ITにおける使いどころ
 
クラウドストレージの基礎知識(Cloudian white paper)
クラウドストレージの基礎知識(Cloudian white paper)クラウドストレージの基礎知識(Cloudian white paper)
クラウドストレージの基礎知識(Cloudian white paper)
 
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
[db tech showcase Tokyo 2015] E15:Hadoop大量データ処理技術と日立匿名化技術によるプライバシー保護とデータ活用 by...
 

En vedette

Building Business UIs with EMF Forms (ECE2014)
Building Business UIs with EMF Forms (ECE2014)Building Business UIs with EMF Forms (ECE2014)
Building Business UIs with EMF Forms (ECE2014)Maximilian Kögel
 
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するSatoshi Ishikawa
 
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSSNYSOL
 
8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-Yuki Shimizu
 
米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向Takatsugu Kobayashi
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessRie Yamanaka
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Preferred Networks
 
ログ収集フレームワークの新バージョン「FlumeNG」
ログ収集フレームワークの新バージョン「FlumeNG」ログ収集フレームワークの新バージョン「FlumeNG」
ログ収集フレームワークの新バージョン「FlumeNG」AdvancedTechNight
 
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTipsAmazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTipsyuichi_komatsu
 
Awsとrubyで作るビッグデータ解析の裏側
Awsとrubyで作るビッグデータ解析の裏側Awsとrubyで作るビッグデータ解析の裏側
Awsとrubyで作るビッグデータ解析の裏側Shohei Kobayashi
 
SQL, NoSQL, BigData in Data Architecture
SQL, NoSQL, BigData in Data ArchitectureSQL, NoSQL, BigData in Data Architecture
SQL, NoSQL, BigData in Data ArchitectureVenu Anuganti
 
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識Katsuhiro Morishita
 
North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...
North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...
North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...vktbox
 
paradox of life
paradox of lifeparadox of life
paradox of lifesuminch
 

En vedette (20)

Building Business UIs with EMF Forms (ECE2014)
Building Business UIs with EMF Forms (ECE2014)Building Business UIs with EMF Forms (ECE2014)
Building Business UIs with EMF Forms (ECE2014)
 
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現するエフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
エフスタ東京Vol3 ビッグデータ解析手法を用いてソーシャルメディアの評価分析を実現する
 
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
 
8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-8つの魔法の習得 -RとRubyによるデータ解析入門より-
8つの魔法の習得 -RとRubyによるデータ解析入門より-
 
米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向米国でのビッグデータビジネスの動向
米国でのビッグデータビジネスの動向
 
New Technology Trends and Effects on Business
New Technology Trends and Effects on BusinessNew Technology Trends and Effects on Business
New Technology Trends and Effects on Business
 
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
 
ログ収集フレームワークの新バージョン「FlumeNG」
ログ収集フレームワークの新バージョン「FlumeNG」ログ収集フレームワークの新バージョン「FlumeNG」
ログ収集フレームワークの新バージョン「FlumeNG」
 
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTipsAmazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
Amazon Elastic MapReduceやSparkを中心とした社内の分析環境事例とTips
 
Awsとrubyで作るビッグデータ解析の裏側
Awsとrubyで作るビッグデータ解析の裏側Awsとrubyで作るビッグデータ解析の裏側
Awsとrubyで作るビッグデータ解析の裏側
 
SQL, NoSQL, BigData in Data Architecture
SQL, NoSQL, BigData in Data ArchitectureSQL, NoSQL, BigData in Data Architecture
SQL, NoSQL, BigData in Data Architecture
 
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
 
Oregon
OregonOregon
Oregon
 
Puerto rico
Puerto ricoPuerto rico
Puerto rico
 
Mississippi
MississippiMississippi
Mississippi
 
New mexico
New mexicoNew mexico
New mexico
 
North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...
North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...
North Vietnam Remote Villages Trek and Overland Tour Travel Hanoi Lao Cai Bac...
 
Nevada
NevadaNevada
Nevada
 
Nebraska
NebraskaNebraska
Nebraska
 
paradox of life
paradox of lifeparadox of life
paradox of life
 

Similaire à Big data presentation for mcpc

Cloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システム
Cloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システムCloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システム
Cloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システムCLOUDIAN KK
 
Wireless Japan[講演]八子 20110526
Wireless Japan[講演]八子 20110526Wireless Japan[講演]八子 20110526
Wireless Japan[講演]八子 20110526知礼 八子
 
プライベートクラウド導入成功への3カ条
プライベートクラウド導入成功への3カ条プライベートクラウド導入成功への3カ条
プライベートクラウド導入成功への3カ条Nissho-Blocks
 
スマフォセキュリティセミナ(配付用) R 20110417
スマフォセキュリティセミナ(配付用) R 20110417スマフォセキュリティセミナ(配付用) R 20110417
スマフォセキュリティセミナ(配付用) R 20110417知礼 八子
 
クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418知礼 八子
 
国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービスKajiBook
 
LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116知礼 八子
 
【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について
【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について
【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携についてHinemos
 
Cloudian meets CloudStack
Cloudian meets CloudStackCloudian meets CloudStack
Cloudian meets CloudStackCLOUDIAN KK
 
八子クラウド座談会 Opening talk_121208
八子クラウド座談会 Opening talk_121208八子クラウド座談会 Opening talk_121208
八子クラウド座談会 Opening talk_121208知礼 八子
 
PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」
PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」
PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」PC Cluster Consortium
 
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)Osaka University
 
モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~
モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~
モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~SEIL SMF
 
高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)Naoto MATSUMOTO
 
Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Dai Utsui
 
イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~
イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~
イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~Brocade
 
[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...
[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...
[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...オラクルエンジニア通信
 
Mk data intensive-onic2021
Mk data intensive-onic2021Mk data intensive-onic2021
Mk data intensive-onic2021Miya Kohno
 
「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」
「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」
「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」maruyama097
 

Similaire à Big data presentation for mcpc (20)

Cloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システム
Cloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システムCloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システム
Cloudian: Amazon S3準拠マルチテナント・クラウドストレージ・システム
 
Wireless Japan[講演]八子 20110526
Wireless Japan[講演]八子 20110526Wireless Japan[講演]八子 20110526
Wireless Japan[講演]八子 20110526
 
プライベートクラウド導入成功への3カ条
プライベートクラウド導入成功への3カ条プライベートクラウド導入成功への3カ条
プライベートクラウド導入成功への3カ条
 
スマフォセキュリティセミナ(配付用) R 20110417
スマフォセキュリティセミナ(配付用) R 20110417スマフォセキュリティセミナ(配付用) R 20110417
スマフォセキュリティセミナ(配付用) R 20110417
 
クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418クラウドEXPO 2011春資料 20110418
クラウドEXPO 2011春資料 20110418
 
国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス
 
LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116LTEモバイルクラウドセミナ[講演1] R 20101116
LTEモバイルクラウドセミナ[講演1] R 20101116
 
【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について
【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について
【HinemosWorld2014】A1-3_01_NTT Comのグローバルクラウド戦略とHinemosとの連携について
 
Cloudian meets CloudStack
Cloudian meets CloudStackCloudian meets CloudStack
Cloudian meets CloudStack
 
八子クラウド座談会 Opening talk_121208
八子クラウド座談会 Opening talk_121208八子クラウド座談会 Opening talk_121208
八子クラウド座談会 Opening talk_121208
 
PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」
PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」
PCCC22:日本オラクル株式会社 テーマ1「Oracle Cloud Infrastructure for HPC&AI」
 
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
Nttドコモ事例から見るモバイル&クラウド時代のサービス開発についてr4(public)
 
Aws summit tokyo 2016
Aws summit tokyo 2016Aws summit tokyo 2016
Aws summit tokyo 2016
 
モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~
モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~
モバイルWANが救う企業ネットワーク~SEILとSMFで創る高可用性WANのご紹介~
 
高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)高速ネットワーク技術と周辺動向(特別講義)
高速ネットワーク技術と周辺動向(特別講義)
 
Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会Gmo media.inc 第9回西日本ossの普及を考える会
Gmo media.inc 第9回西日本ossの普及を考える会
 
イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~
イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~
イケてる仮想化担当者のための今どきネットワーク虎の巻~VMwareソリューションの効果を最大化する必勝キーワードとその極意~
 
[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...
[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...
[Modern Cloud Day Tokyo 2019] オラクルクラウド移行を完了したゲストに聞くOracle Cloudを選択する理由&次世代インフ...
 
Mk data intensive-onic2021
Mk data intensive-onic2021Mk data intensive-onic2021
Mk data intensive-onic2021
 
「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」
「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」
「変貌するWebの世界 -- クラウドとクラウド・デバイスのインパクト」
 

Plus de CLOUDIAN KK

CLOUDIAN HYPERSTORE - 風林火山ストレージ
CLOUDIAN HYPERSTORE - 風林火山ストレージCLOUDIAN HYPERSTORE - 風林火山ストレージ
CLOUDIAN HYPERSTORE - 風林火山ストレージCLOUDIAN KK
 
クラウディアンのご紹介
クラウディアンのご紹介クラウディアンのご紹介
クラウディアンのご紹介CLOUDIAN KK
 
S3 API接続検証プログラムのご紹介
S3 API接続検証プログラムのご紹介S3 API接続検証プログラムのご紹介
S3 API接続検証プログラムのご紹介CLOUDIAN KK
 
Auto tiering and Versioning of CLOUDIAN HyperStore
Auto tiering and Versioning of CLOUDIAN HyperStoreAuto tiering and Versioning of CLOUDIAN HyperStore
Auto tiering and Versioning of CLOUDIAN HyperStoreCLOUDIAN KK
 
AWS SDK for Python and CLOUDIAN HyperStore
AWS SDK for Python and CLOUDIAN HyperStoreAWS SDK for Python and CLOUDIAN HyperStore
AWS SDK for Python and CLOUDIAN HyperStoreCLOUDIAN KK
 
AWS CLI and CLOUDIAN HyperStore
AWS CLI and CLOUDIAN HyperStoreAWS CLI and CLOUDIAN HyperStore
AWS CLI and CLOUDIAN HyperStoreCLOUDIAN KK
 
FOBAS CSC and CLOUDIAN HyperStore
FOBAS CSC and CLOUDIAN HyperStoreFOBAS CSC and CLOUDIAN HyperStore
FOBAS CSC and CLOUDIAN HyperStoreCLOUDIAN KK
 
ARCserve backup and CLOUDIAN HyperStore
ARCserve backup and CLOUDIAN HyperStoreARCserve backup and CLOUDIAN HyperStore
ARCserve backup and CLOUDIAN HyperStoreCLOUDIAN KK
 
NetApp SteelStore with CLOUDIAN HyperStore
NetApp SteelStore with CLOUDIAN HyperStoreNetApp SteelStore with CLOUDIAN HyperStore
NetApp SteelStore with CLOUDIAN HyperStoreCLOUDIAN KK
 
File server by CLOUDIAN HyperStore
File server by CLOUDIAN HyperStoreFile server by CLOUDIAN HyperStore
File server by CLOUDIAN HyperStoreCLOUDIAN KK
 
ownCloud and CLOUDIAN HyperStore
ownCloud and CLOUDIAN HyperStoreownCloud and CLOUDIAN HyperStore
ownCloud and CLOUDIAN HyperStoreCLOUDIAN KK
 
CloudBerry and CLOUDIAN HyperStore
CloudBerry and CLOUDIAN HyperStoreCloudBerry and CLOUDIAN HyperStore
CloudBerry and CLOUDIAN HyperStoreCLOUDIAN KK
 
Hadoop and CLOUDIAN HyperStore
Hadoop and CLOUDIAN HyperStoreHadoop and CLOUDIAN HyperStore
Hadoop and CLOUDIAN HyperStoreCLOUDIAN KK
 

Plus de CLOUDIAN KK (13)

CLOUDIAN HYPERSTORE - 風林火山ストレージ
CLOUDIAN HYPERSTORE - 風林火山ストレージCLOUDIAN HYPERSTORE - 風林火山ストレージ
CLOUDIAN HYPERSTORE - 風林火山ストレージ
 
クラウディアンのご紹介
クラウディアンのご紹介クラウディアンのご紹介
クラウディアンのご紹介
 
S3 API接続検証プログラムのご紹介
S3 API接続検証プログラムのご紹介S3 API接続検証プログラムのご紹介
S3 API接続検証プログラムのご紹介
 
Auto tiering and Versioning of CLOUDIAN HyperStore
Auto tiering and Versioning of CLOUDIAN HyperStoreAuto tiering and Versioning of CLOUDIAN HyperStore
Auto tiering and Versioning of CLOUDIAN HyperStore
 
AWS SDK for Python and CLOUDIAN HyperStore
AWS SDK for Python and CLOUDIAN HyperStoreAWS SDK for Python and CLOUDIAN HyperStore
AWS SDK for Python and CLOUDIAN HyperStore
 
AWS CLI and CLOUDIAN HyperStore
AWS CLI and CLOUDIAN HyperStoreAWS CLI and CLOUDIAN HyperStore
AWS CLI and CLOUDIAN HyperStore
 
FOBAS CSC and CLOUDIAN HyperStore
FOBAS CSC and CLOUDIAN HyperStoreFOBAS CSC and CLOUDIAN HyperStore
FOBAS CSC and CLOUDIAN HyperStore
 
ARCserve backup and CLOUDIAN HyperStore
ARCserve backup and CLOUDIAN HyperStoreARCserve backup and CLOUDIAN HyperStore
ARCserve backup and CLOUDIAN HyperStore
 
NetApp SteelStore with CLOUDIAN HyperStore
NetApp SteelStore with CLOUDIAN HyperStoreNetApp SteelStore with CLOUDIAN HyperStore
NetApp SteelStore with CLOUDIAN HyperStore
 
File server by CLOUDIAN HyperStore
File server by CLOUDIAN HyperStoreFile server by CLOUDIAN HyperStore
File server by CLOUDIAN HyperStore
 
ownCloud and CLOUDIAN HyperStore
ownCloud and CLOUDIAN HyperStoreownCloud and CLOUDIAN HyperStore
ownCloud and CLOUDIAN HyperStore
 
CloudBerry and CLOUDIAN HyperStore
CloudBerry and CLOUDIAN HyperStoreCloudBerry and CLOUDIAN HyperStore
CloudBerry and CLOUDIAN HyperStore
 
Hadoop and CLOUDIAN HyperStore
Hadoop and CLOUDIAN HyperStoreHadoop and CLOUDIAN HyperStore
Hadoop and CLOUDIAN HyperStore
 

Dernier

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Dernier (8)

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

Big data presentation for mcpc

  • 1. クラウドストレージで注目される BIG DATA 技術 2011年 6月 24日 ジェミナ゗・モバ゗ル・テクノロジーズ株式会社 太田 洋 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 1
  • 2. Agenda 1. 時代はクラウドへ 2. スマートフォンの台頭 3. 「BIG DATA」の格納 4. 「BIG DATA」の災害対策 5. 「BIG DATA」プロダクトの例 What is ? June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 2
  • 3. 1. 時代はクラウドへ クラウドストレージで注目される BIG DATA 技術 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 3
  • 4. キーワード 集中 vs 分散 Concentration Distribution June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 4
  • 5. ネットワークの場合(例:Mobile NW vs Internet) Mobile Network Internet • 集中型ネットワーク • 分散型ネットワーク • 中央集権で処理 • 分散処理が前提 • Master – Slave • Peer to Peer • 着信機能とモビリテゖー • 可用性と耐障害性 • サービスの保証 • ベストエフォート Internet から見ると Mobile Network はゕクセス回線の一つにしか過ぎない June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 5
  • 6. コンピュータの場合 Mainframe Clustering(Grid Computer) • 中央集権型のゕーキテクチャ • 分散コンピューテゖング • 高性能で高価なシステム • メ゗ンフレームのような高性能を低 • Thin Client  端末でデータ 廉な汎用小型コンピュータで実現 の処理・保存等を行わない • 高い信頼性(冗長性) • 小型コンピュータに圧されて • 高速のネットワークが必要 全盛期から衰退 汎用小型コンピュータの性能(コストパフォーマンス)が飛躍的に向上  分散処理 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 6
  • 7. クラウドは「集中」それとも「分散」? • クラウドに大量のコンピュータ資源を集約して、スケールメリットを得るた めに中央集権型サービスを「集中」 • クラウドの中で、スケーラビリテゖー、コスト効率、信頼性を高めるために サーバーを「分散」 Thin Client 化 端末のマルチデバ゗ス化 集中と分散の共存 Cloud 中央集権型サービス 分散コンピューテゖング技術の利用 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 7
  • 8. クラウド・コンピューテゖング出現の背景 • 爆発的な増加を続けるデータ量 膨大なデータに対する厳しいコスト削減要求 • ネットワークの技術進歩に伴う高速化  帯域単価の大幅な下落 • 帯域単価の下落により集中型の巨大システムを作った方が安価に 1. Server の進化 2. Network の進化 3. Data Center Fixed NW / Mobile NW 高速・大容量・低コスト・カバレッジ 安価な土地と電力 高速・高性能 安価な労働力 低廉で汎用性の高い スケールメリットのビジネス 大量なサーバーの集約 小型コンピュータ (PC サーバー) June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 8
  • 9. クラウド・コンピューテゖングの実情 • Google, Microsoft, Amazon, Yahoo, Sales.com 等少数の海外勢(US 企業)がグ ローバル市場を制圧しているのが実情 • 日本国内から海外に設置されたデータセンター を利用するケースが近年著しく増加 • コスト競争力に欠ける日本のクラウドおよび データセンターはグローバル競争から大きく立 ち遅れている Source: Wikipedia Source: Telco 2.0 Presentation Source: The 451 group Presentation June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 9
  • 10. Amazon AWS 日本上陸 ※ ゕマゾンのホームページから抜粋 クラウドが日本に上陸 AWSの新しい ゕジゕパシフゖック東京リージョンが利用可能になりました! 日本でビジネスを行う企業様、また日本の顧客をもつグローバル企業の皆様は、本日より東京リー ジョンを使う事で、レ゗テンシーが低く、国内にデータ 保管ができる環境でゕプリケーションの提供 や作業が可能となります。そして自社゗ンフラの運用、管理といった煩雑な作業から解放されます。 ほとんどの場合 において日本のお客様は数ミリ秒という低いレ゗テンシーで新しい東京リージョンを ご利用いただけます。 東京リージョンはシンガポールに次ぐゕジゕパシフゖックでは2番目、全世界 では5番目のAWSのクラウドの拠点となります。 June 2011 Page 10
  • 11. Amazon S3 の収入予測(当社試算) 「UBS ゕナリストの Brian Pitz、Brian Fitzgerald によると、AWS の収入は 2010年に 5億ドル、 2011年に約 7.5億ドルに達すると予測 2014年には約25億ドルに成長すると予測している」 http://www.crn.com/news/applications-os/226500204/amazon-cloud-revenue-could-exceed-500-million-in-2010- report.htm?itc=refresh 「S3 の収入は 2010年に約 2.5億ドルと予想される。」 http://gladinet.blogspot.com/2010/08/amazon-s3-revenue-estimation.html Amazon S3の収入予測 (当社試算) 百万米ドル 4,000 3,738 3,500 3,000 2,500 2,500 2,000 1,869 1,677 1,500 1,250 1,122 1,000 839 750 500 561 500 375 250 0 2010 2011 2012 2013 2014 2015 注:上記記事で言及されて いない年は当社予測 AWS revenue in million Amazon S3 revenue in million Page 11 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK
  • 12. グーグル Chrome OS の登場 • Google の Chrome OS を搭載したNetbook「Chromebook」が Samsung と Acer から 6 月に登場 • Samsung のモデルは10秒足らずで起動するという • Google クラウドへのゕクセスが前提のクラウド・コンピューテゖング端末 • ブラウザーを基本とした Thin Client – Fat Server 戦略  価格は349ドルから • マ゗クロソフトの牙城へチャレンジ ※ グーグルのホームページから抜粋 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 12
  • 13. 2. スマートフォンの台頭 クラウドストレージで注目される BIG DATA 技術 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 13
  • 14. 急速に成長し続けるスマートフォン市場 • 海外市場(米 IDC 2011年 3月 29日発表) • 2011年の出荷台数は、前年の 3億340万台から 4億5000万台と、49.2% 増加する見込み • 国内市場(MM 総研 2011年 5月 10日発表) • 2010年度通期の携帯電話の総出荷台数は前年比 9.3% 増の 3,764万台 • 2010年度通期のスマートフォン出荷台数は 855万台で前年比約 3.7倍 総出荷台数の 22.7% を占めた ※出典:株式会社 MM 総研 ニュースリリース(2010年12月18日) June 2011 Page 14
  • 15. スペックの高度化 iPhone の場合: メモリー容量 8/16GB 8/16/32GB 16/32GB 480 X 320 480 X 320 960 X 640 デゖスプレ゗ = 153.6K pix = 153.6K pix = 614.4K pix (163ppi) (163ppi) (326ppi) カメラ 2M pix 3M pix 5M pix VGA ビデオ撮影 HD ビデオ撮影 ビデオ撮影 - 30 fps 30 fps June 2011 Page 15
  • 16. サービス提供モデルの変遷 スマートフォン・ベンダーから見たキャリゕ展開方法 • キャリゕ依存型:キャリゕサービスとの密結合  カスタマ゗ズに時間を要する • キャリゕ非依存型:マルチキャリゕ展開が容易  クラウドが必要 マルチキャリゕ クラウド型モデル スマートフォンは Multi キャリゕ非依存型へ Carrier Tier1 キャリゕ向け Cloud シングルキャリゕ 導入型モデル 海外キャリゕ 付加価値サービス キャリゕ非依存 Service システム群 Platform キャリゕ依存 海外には中小キャリゕが多数存在 クラウドからの 付加価値サービス提供 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 16
  • 17. スマートフォンが齎すもの • PC / ゗ンターネット モデルがモバ゗ル環境に • Carrier Depend Services 以外は PC / ゗ンターネットモデルに • 高性能スマートフォンが出現 • 膨大なデータが発生 • コンテンツもリッチに • ゕプリケーションとクラウドによるサービス • キャリゕの土管化が促進 • ただし、スマートフォンもモバ゗ルデバ゗スのひとつ • 落とせば壊れるし、水没や紛失の恐れはいままでのケータ゗となんら変わらない • 一方、スマートフォンにストゕされるデータは、その量、多様性、重要性 (価値)が飛躍的に大きくなる • ビジネスにも活用されてくる June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 17
  • 18. 例:データ・バックゕップサービス • モバ゗ル・ユーザーのデータ・プロテクション 大容量ネットワーク モバ゗ル・デバ゗スは、破損、 Network ストレージ 紛失、水没の可能性が大! Notebook PC Peta Byte に及ぶ膨大なユー Net book PC ザーデータを水平分散し、高 データの自動バックゕップ 信頼性でかつ経済的に保管す ネットワークストレージに対して定期的に る大規模ストレージが必要 自動でバックゕップ(差分データの転送) (従来の RDBMS では事実上 シナリオ1:端末のハードデゖスクのデー Tablet PC 保存不可能な BIG DATA) タを全てバックゕップ シナリオ2:写真・音楽・ビデオ・ドキュ Smart Phone メント・ゕプリケーション・設定フゔ゗ル 等、ユーザーフゔ゗ルのバックゕップ (Apple タ゗ムマシンのネットワークスト レージ版の゗メージ) June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 18
  • 19. 例:これからのメールサービスのトレンド • Eメールは、従来の Store & Forward 型から、長期保存(クラウド)型へ移行 • 低コスト、高信頼性、長期間保存への要求に対応した BIG DATA Cloud Storage が必要に Cloud Mail System 長期保存型 メールシステム Store & Forward 型 メールシステム 一生分のメール を保存できる巨 大なメールボッ Mail Box(一時保存) クスが必要に 着信メールを一時的に保管し、クラ゗ゕン トへ転送後は転送済みメールを消去 Giga Byte Mail Box(長期保存) 別のクラ゗ゕントでゕクセスした時には既 着信メールを生涯分保存する にメールがなくなってしまっている どの端末から何時ゕクセスしても、通信履歴を始 (マルチデバ゗ス対応が不可能) めとした全てのメールが完全な状態で保管される ストレージの大きさをミニマ゗ズす 大量の長期保存用ストレージエリゕが必要  安価 ることが可能(経済的なシステム) に膨大なデータを長期間蓄積できる、高い信頼性 のストレージ技術が鍵 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 19
  • 20. モバ゗ルのみならず様々な分野で膨大なデータが発生 爆発的な勢いで増え続けるデータ 「BIG DATA」 捨てるか? 格納するか? PC コンテンツ ログ・履歴 IPTV 監視カメラ タブレット PC センサー M2M サーバー 情報家電 スマートグリッド スマートフォン 乗り物(自動車) ウェブサービス モジュール SNS ウェブゕプリケーション EC June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 20
  • 21. 3.「BIG DATA」の格納 クラウドストレージで注目される BIG DATA 技術 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 21
  • 22. Why BIG DATA ? 今、゗ンターネットで起きていること 今から数年以内にエンタープラ゗ズで起きること Twitter: 7 TB/day (2+ PB/year) • 10,000 CDs/day • 5 million floppy disks Yahoo Hadoop Clusters: > 82PB by 25K machines Google: 3,500TB/day Facebook: 4TB new data per day • GB (Giga Byte) 1GB = 1,000,000,000 byte(CD の容量) • TB (Tera Byte) 1TB = 1,000,000,000,000 byte(サーバーの内臓デゖスクの容量) • PB (Peta Byte) 1PB = 1,000,000,000,000,000 byte(2009年における゗ンターネットゕーカ゗ブのデータ量) • EB (Exa Byte) 1EB = 1,000,000,000,000,000,000 byte(世界における印刷物の総量) June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 22
  • 23. 爆発的に増え続けるデータ(BIG DATA)への対応 • 従来の RDBMS の補完として分散ストレージ技術が発生 1. 水平拡張、伸縮性、スケーラビリテゖー 2. ロケーション分散による災害対策 Volume 3. 低コスト:汎用 PC サーバーの内蔵ハードデゖスク NOSQL 3V Velocity 4. 多様でかつ大量のデータにおける高速な保存 / 取出し処理 Variety OSS NOSQLs Users in Flare Kai 雲雀 Hibari June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 23
  • 24. Why NOSQL Database ? 1. 爆発的に増え続けるデータへの対応  スケーラビリテゖーの確保 • 水平拡張が容易で Scale Out できること(=分散処理が可能) • ロケーション分散を行い災害等の脅威から保護 2. 安価な小型コンピュータ(=PC サーバー)の内蔵デゖスクを利用したコスト競争力 の高いシステムの構築 3. 大量のデータにおける高速な処理 NOSQL Database の゗メージ • 未だ研究段階で商用システムへの投入は無理 • まだ完成度が不十分で信頼性に欠ける  大事なお客様への提供は慎重にしたい • 所詮 SNS 系の技術であり、高信頼性のシステムには適用できない • 開発環境が未整備で、専門家も少ないし、十分なサポートも受けられない • RDBMS と比べ API が異なっている(シンプル) • 今後クラウドには欠かせない技術になってくるので今からスタデゖーしたい June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 24
  • 25. NOSQL の特徴 • NOSQL データベースが持つ特徴は次のように纏められます。 1. NOSQL データベースによって安価な汎用サーバー(Commodity Hardware) で、高価なサーバーと同等の信頼性を提供することが可能になります。 事実、Google のビジネス・ゕプリケーション「Google Apps」では、NOSQL(Big Table) を使い、ビジネス向け Gmail では 1ユーザーあたり 25 G Byte ものメール ボックスを提供しています。 2. Commodity Hardware の利用は、システムにおいて最も優れたコスト・パ フォーマンスを齎し、「BIG DATA」ゕプリケーションに対してトータル・コス トとラックスペースの最適化を図ることが可能になります。 3. NOSQL は RDBMS の代替えではありません。NOSQL は RDBMS では対応が 困難な大量データ(Tera  Peta)の問題を解決する技術です。 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 25
  • 26. SQL と NOSQL は補完関係 • 膨大なデータ(Big Data)を低コストで活用できる ⇔ 少ない機能のトレードオフ • SQL DB と NOSQL DB のハ゗ブリッドでの利用が行われるように 利 点 課 題 • 大きなデータ(ペタバ゗トレベル)にお いて高いコスト リレーショナル • 豊富な機能 • ACIDの「ロック」メカニズムによ ・データベース • SQL, (例)table “Join” り時間がかかる (SQL) • データに対する強い一貫性 • 10台規模に拡張するために複雑、 高価 • 制約のある機能 • 大きなデータ(ペタバ゗トレベル) • シンプルな API、およびキーとバ ノン・ に最適 リュー、またはコラムによるシンプ ルなデータモデル リレーショナル • 100台規模のノードへのス ケールゕウトが容易 • 多くは「結果整合性(Eventual ・データベース Consistency)」であり、データの (NOSQL) • 異種PCサーバーを低コストで 一貫性を提供しない 利用 • Hibari は、「強い一貫性(Strong consistency)」を提供 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 26
  • 27. CAP定理(参考) 以下の三つの特性の内、一つの共有データ・システムで対応できるのは最大二つである Consistency(一貫性) Availability Availability(可用性) tolerance to network AC CAP AP Partitions(ネットワーク分断への耐性) Theorem [Eric A. Brewer, 2000年] Consistency Partitions CP 実際には、マルチ・ノード・システムではノード間で送られるメッセージが損失する 可能性があることから、「ネットワーク分断への耐性」は必須となる 従って選択肢はCP(一貫性+耐性)とAP(可用性+耐性)になる • CP:分断が発生した場合、一部の要求への応答を拒否して一貫性を確保する(可用 性の犠牲) • AP:分断が発生した場合、すべての要求に応答するが、古いデータを読み取って応 答したり、競合する書込みを受け入れてしまう可能性がある June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 27
  • 28. NOSQL プロジェクトの分類 ※ 主なプロジェクトを抜粋。 はオープンソース。 BigTable系 Dynamo系 Google File System Amazon Dynamo Amazon S3 Hadoop Google Map Reduce Amazon SimpleDB Google Big Table HBASE NTT未来ネット研究所 KAI 井上武氏による開発 Linked Inによる開発 Cassandra Voldemort と利用 Facebookによる開発と利用 Basho Technologies Riak Tokyo Cabinet系 による開発と提供 ミクシゖによる開発と利用 ROMA 楽天による開発と利用 Tokyo Cabinet Flare グリーによる開発 独立系 ドキュメント指向系 と利用 kumofs 筑波大学院 古橋 ジェミナ゗・ Mongo DB 貞之氏による開発 モバ゗ル・ テクノロージズによる 開発と提供 Couch DB June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 28
  • 29. NOSQL 年表 Hbase、Hadoopの オープンソース化 Cassandra、Hbase、 Facebookによる ゕパッチ・ソフトウェゕ財団 Cassandra開発 のトップ・プロジェクトに 19xx 2006 2007 2008 2009 2010 2011 分散システ Google Amazon Cassandra MongoDB Hibari の ムの研究 Big Table Dynamo のオープン のオープン オープン 論文 論文 ソース化 ソース化 ソース化 過去: 転換点 現在: 今後: 基礎作り 百花繚乱の時代 整理統合 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 29
  • 30. NOSQL Database の例 Hibari:オープンソース分散 KVS • チェ゗ン・リプリケーションにより強い 一貫性(Strong Consistency)を確保 • 多くの NOSQL DB は結果整合性 (Eventually Consistency) • 強い一貫性を持ちかつ高性能 • 高いスケーラビリテゖ • 高い可用性と耐障害性 • 自己修復機能 • 自動リサ゗ズ / 再バランス化:クラス ター増設, 縮小時にダウンタ゗ム無し • 上記特徴全てを低価格で提供:汎用ハー ドウェゕの活用(異機種の混在も可能) • 国内大手ポータル事業者での商用実績 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 30
  • 31. NOSQL データベースの利用用途(想定)について 1. ギガバ゗ト・メールボックス:ウェブメール 2. ホーム・データ:バックゕップ、リモートゕクセス、マルチデバ゗ス・ゕク コンシューマ セス 系 3. パーソナル・メデゖゕ・ラ゗ブラリー:IPTV を含む、ビデオ、音楽等のコ ンテンツデータおよび各種端末向けオンデマンド・ストリーミング 4. ユーザー生成コンテンツ:SNS、ブログ、ソーシャルゲーム等 1. プラ゗ベート・クラウド:法人 / SaaS / PaaS / DaaS 向け エンタープラ゗ズ 2. データ・ゕーカ゗ブ:メールの履歴や社内フゔ゗ル等企業内長期保存スト 系 レージ 3. M2M:スマートグリッド等 M2M データの保存と利用 1. ログ・データ:大量に発生する各種ログ情報の保管 バックオフゖス 2. ユーザー・クリック履歴:EC サ゗ト向け(レコメンデーション等に活用) 系 3. 顧客データ:顧客のプロフゔ゗ル情報やトランザクション履歴 4. 通話記録:コールセンター向け(音声認識との併用) 1. クラウド・ストレージ・サービス:マルチテナントおよび S3 ゗ンター ユーテゖリテゖー フェースに対応  Cloudian 系 2. 企業向け仮想フゔ゗ルバックゕップサービス:RDBMS スナップショット等 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 31
  • 32. NOSQL の啓蒙活動(参考) 去る 2010年 11月 1日に主だった世界の NOSQL プレ゗ヤーを呼ん で、カンフゔレンス (NOSQL Afternoon in Japan) を行いました。 NOSQL ハンズオントレーニングの開催 400 人近くの開発者が集まり、NOSQL では世界最大規模のカン フゔレンスになりました。 企業への訪問トレーニング 2011年3月25日に NTT ソフトウェゕ 株式会社様へ訪問 トレーニングを 行った時の様子。 約30名の方々に受 講いただきました。 Erlang カンフゔレンス(2010年11月17日@ストックホルム)における Hibari のプレゼンテーション。 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 32
  • 33. 4.「BIG DATA」の災害対策 クラウドストレージで注目される BIG DATA 技術 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 33
  • 34. 今回の震災から学んだこと(大災害への対応) • データセンターの一次被害 • 地震や津波、液状化、その他自然災害や火災等によって、データセンターが直接被 害をうけるケース • データセンターの二次被害 • データセンターへの電源供給(長時間かつ広範囲な停電への対応) • データセンターが計画(輪番)停電の対象エリゕになってしまう • 災害等の影響で起きる事故停電への対応 • 放射能汚染 • データセンターが放射能避難区域に入ってしまう(または自主避難区域に入ってしまう) • 労働力の確保が困難になってしまう 十分に距離を離した(例えば 関東と関西)2か所のデータセンターで 冗長性を確保し、サービス提供を行う  データセンターの二重化 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 34
  • 35. データセンター二重化構想(案) • 2つのデータセンターに十分距離を取って配置 • データセンターを3拠点に多重化する案も考えられるが、オペレーション効率と投資効率を鑑 み2拠点が推奨される • いずれかのデータセンターが災害によってサービスが提供不能 となった場合、もう一方が引き継いでサービスを継続する • よって、各々のデータセンターでサービス継続に必要となる 他のデータセンターのデータ・レプリカもリゕルタ゗ム に保持する • また、ソフトウェゕ障害によるデータ損失への備え として、各々のセンターで定期的に(例、 Data Center 2 Data 毎日)データのスナップショットを Backup System 取得し、バックゕップを行う Data 十分な距離を確保 Backup Data Center 1 System June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 35
  • 36. 基本的な考え方(その1) • サービス提供ノードを「Processing Layer」と「Data Storage Layer」に分離 ① これによって、Processing Layer、Data Storage Layer はそれぞれ異なる データセンターに配置 ② 特に、レ゗ヤを分離することによって、物理データを異なるデータセンターに 分散配置しやすくすると同時に、両方のレ゗ヤにおいて地理的なリダンダント を可能にする ③ 両方のレ゗ヤの接続に於いて、ゕプリケーションから独立してコネクションの 輻輳制御を行い、地理的な接続ルートの切り替え等を行う ④ Data Storage Layer では、ゕプリケーションから独立して、SQL データ ベース(RDBMS)と NOSQL の両方を効果的に活用する(SQL / NOSQL 両 方のサポート) • SQL はオラクルや MySQL ベースで、SQL が要求されるデータに使用され、NOSQL は、大容量(Volume)、高速(Velocity)、多種(Variety)=3V のデータに使用 される • 二つの異なるストレージ間の移行は、ゕプリケーションにとって透過的であるべき June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 36
  • 37. 基本的な考え方(その2) • 各々のセンターのデータバックゕップシステムを強化する ① スナップショット(生データ・フゔ゗ル)をストレージ・クラスターの NOSQL データベースにバックゕップすることが肝要 ② 磁気テープの補完または代用として、利用可能 バックゕップの高速化、回復時 間の短縮により、バックゕップ頻度を増やせる ③ データ複製をシステム内で行うため、安全性が高い • 最近起きた Gmail のデータ消失事件が教訓  ソフトウエゕエラーの場合でも、 一切データ消失が発生しないような確実なシステムでなければならない • スナップショットによるバックゕップ頻度を増やし、データ損失の可能性を 最小化する • 理想的には別の場所(更に別のデータセンター)でバックゕップを行うべき だが、3箇所目のデータセンターの運営費用や、各センターにデータの複製 があることを考慮すれば、ローカル設置でもよいと考えられる June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 37
  • 38. ネットワーク構成の゗メージ CP/ASP CP/ASP CP/ASP Internet Dual Internet Access Points Mobile Network Processing (Application) Processing Data Cache Data Cache Processing Layer Nodes / Router / Router Nodes Data Center #1 Data Center #2 Data Storage Layer Data Replication June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 38
  • 39. 5. BIG DATA プロダクトの例 クラウドストレージ クラウドストレージで注目される BIG DATA 技術 June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 39
  • 40. クラウド・ストレージ・サービスとは? • Storage as a Service は US 市場において既に広く普及している • Amazon S3, Windows Azure, Google Storage for Developers, RackSpace Cloud Files, Peer1 CloudOne • 国内でも成長が見込まれている IDC Japanは9日、オンラ゗ンバックゕップ サービスなどの「Storage as a Service」市 場の国内売り上げ予測を発表した。2010年 は前年比7.8%増の225億800万円となる見 込みで、2009年から2014年までの 年間平 均成長率は6.9%、2014年の市場規模は314 億円になると予測している。 2005年~2014年 国内Storage as a Service市場 売上実績および予測(出典:IDC Japan, 3/2011) • クラウド・ストレージ・サービスでは「Pay-as-you-go(使った分だけ支払う方 式)」の従量制課金 • ギガ・バ゗ト当たり数十円(加えてリクエスト数による課金も有り) • また従来の「オンラ゗ン・ストレージ」サービスでは、より高い料金でかつ従量制課金になって いない  オンラ゗ン・ストレージでは、企業ユーザーがプラ゗ベートシステムで使用しているシステム(例 えば EMC)と同じであるため、高価になってしまう  クラウド・ストレージと同じ料金体系でサービス提供す ることは困難 Page 40 © 2010-2011 Gemini Mobile Technologies Inc. & KK
  • 41. Cloudian:マルチテナント型クラウドストレージシステム 1. Amazon S3 のフル機能をソフトウェゕパッケージ製品として提供 • Amazon S3 相当の「オンデマンドのクラウド・ストレージ・サービス」が提供可能な ISP / CSP (Cloud Service Provider) 、および大規模オンプレミス・データストレージを必要とされる 企業向けの製品 • S3 API に準拠しているため、既存の S3 ゕプリケーションを変更することなく動作可能 * AWS(Amazon Web Services)の推定収入:2010年に 5億ドル、2014 年に 25億ドル 2. ユースケース:NOSQL によってストレージコストを飛躍的に低減 1. ISP / CSP では、価格競争力に優れたクラウド・スト レージサービスの提供が可能に 2. 企業 / SIer では、SAN / NAS といった高価な外付け ハードデゖスクの代替え(もう一つの選択肢)として 3. 柔軟なサービス展開 • スモールスタート  スケールゕウト:僅か数台の PC サー バーから複数のデータセンターを跨る何百台もの PC サー バーへのスケールゕウトが可能 • ソフトウェゕ・ソリューションのため、システム更改無し • パブリック・クラスター:何千もの顧客(ユーザー)が同一 の Cloudian クラスターを共有することが可能 • プラ゗ベート・クラスター:専用のハードウェゕ及びSLA Page 41 © 2010-2011 Gemini Mobile Technologies Inc. & KK
  • 42. エンドユーザーの利点 * Source: 設備容量と使用量の関係比較 http://storagemojo.com/2010/02/15/am <実際に利用した容量分のみ課金され経済的> azon-web-services-a-500-million-startup/ クラウドのメリットを得る 更にクラウデゖゕンによって 1. 初期コスト(先行投資)が不要 1. 経済的にクラウドストレージを利用できる 2. 開発が不要  直ぐに利用が可能 2. BIG DATA へのスケールゕウトが可能で 機能も豊富 3. システムの設置場所が不要 3. データを国内に保管出来るため安心 4. 拡張やシステム更改の心配なし 4. データがロケーション分散されていて安心 5. キャパシテゖ計画が大きくぶれるリスク がない 5. Amazon S3 REST API で使いやすい 6. ランニングコストは利用分のみ 6. 現状からの移行も簡単 Page 42 © 2010-2011 Gemini Mobile Technologies Inc. & KK
  • 43. ゗ンターフェースの概要と製品の主な特長 ゗ンターフェースの概要 • 業界デフゔクトスタンダードの Amazon S3 REST API 互換 • Web ゗ンターフェースからユーザーが 一般のブラウザを使って操作可能 • 各種ランゲージに対応した Thrift API の対応を予定 • 更にデータ移行ツールを開発予定 製品の主な特長: 1. NOSQL データベース によりペタバ゗ト級のストレージに対応 拡張性 2. 需要増に合わせ、ノードを水平拡張可能  2台から数百台のノードへスケールゕウト 3. 完全な分散型(P2Pのゕーキテクチャ) しかも単一障害点(SPOF)なし 1. 複数のデータセンター間でレプリカをストゕ 信頼性 2. 証明書(secure credential)による認証、許可 3. ネットワーク / ノード障害に対する回復  データ損失なく、自動複製/修復 1. グループ機能をサポート  企業がグループ管理者を設けることが可能 機能性 2. パブリック URL による柔軟なフゔ゗ル(オブジェクト)共有 1. 各ユーザーに対して従量制課金が可能 2. サービスレベルのコントロールが可能:ストレージ容量、データ流量、リクエスト数 管理機能 3. プラ゗ベート・クラスタ(専用物理システム)とパブリック・クラスタ(複数のユーザーが 同じ物理システムを共有)の両方を提供 4. ユーザ単位、グループ単位での管理機能、課金・レポート機能を具備 Page 43 © 2010-2011 Gemini Mobile Technologies Inc. & KK
  • 44. 地理的リダンダンシーによる高可用性への対応 Cloudian マルチ データセンター リプリケーション機能 Remote Data Center • 例え一方のデータセンターが被災してもサービス継続が可能 • 読み出し書込みは常に近接地のデータセンターへゕクセス • システムがバックグラウンドでリモートにレプリカを作成 Remote Replica • 利 点 • 災害等への対策  複数拠点間の冗長性により信頼性を最大化 Background Write • リモートセンターにおけるレプリカ生成において to Remote Data Center 余分な遅延が発生しない • ローカルセンターがダウンした場合、瞬時にリモート センターが読み出し、書き込みの両方を継承 Read Req. Local Replicas • リモートデータセンターを Read Data 低コスト地域に構築が可能 Write Req. Local Data Center Written Ack. • 土地、建物、電力、運用人件費等 Cloudian Data Replication for Multi-Data Center Page 44 © 2010-2011 Gemini Mobile Technologies Inc. & KK
  • 45. 参考資料:データセンター北へ(石狩市のホームページより) (さくらのホームページより抜粋) June 2011 Page 45
  • 46. 本日のまとめ 1. スマートフォンを始め、データは爆発的な勢いで増え続ける 「BIG DATA」 2. 分散コンピューテゖング技術が主流に 3. サービス資源をクラウドに集中し、スケールメリット得る 4. 「BIG DATA」への対応として、分散ストレージ技術である NOSQL データベースが出現 5. 様々なサービスや製品・ソリューションへの応用が始まる 6. 災害対策にも強い分散ストレージ技術  大事なデータを守 るために 7. 今後「BIG DATA」関連サービスや製品がリリースされる June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 46
  • 47. Thank you www.geminimobile.jp June 2011 © 2010 - 2011 Gemini Mobile Technologies Inc. & KK Page 47