Contenu connexe
Similaire à 45分で理解する 最近のスパコン事情 斉藤之雄
Similaire à 45分で理解する 最近のスパコン事情 斉藤之雄 (20)
45分で理解する 最近のスパコン事情 斉藤之雄
- 1. 45分で理解する
最近のスパコン事情
オフィスサイトウ 斉藤之雄
www.fxfrog.com
Twitter @yukio_saitoh
不許複製 2012/07/03
1
- 2. インデックス
• スパコンとは(一般定義)
• グリッド・コンピューティングとの違い
• 実物スパコン例 (東京工業大学 TSUBAME 2.0)/ GPGPU
• 実物スパコン例 (富士通 K コンピュータ) / 専用CPU
• スパコン性能は国際競争力を示す
• GPGPU 入門マシンを自作しよう(予算5万円)
• 身近なスパコン、計算資源利用方法
• きっと役立つ情報入手先
• まとめ
メモ:技術者向けではなく広く一般パソコン利用者が抵抗なく吸収できる
ように書きました 2
- 3. スパコンとは(一般定義)
• スーパーコンピュータ(略称:スパコン)は、1970年代前半の黎明期から演算処理速度がその時
代の一般的な大型コンピュータよりも極めて高速なコンピュータのこと。1990年代以降は並列コ
ンピューティングによるハイパフォーマンス・コンピューティング (HPC) もほぼ同義語として使
用されているが、スパコンの構成法の一つである。
• 主要スパコンメーカ:富士通,日立, NEC, IBM, HP, SGI, クレイ, DELL 等
• スパコンは膨大な科学計算処理が目的であり、かつては軍事目的や工業製品の設計用に注目され
ていたが、1990年以降は新薬開発の短縮化、外科手術の最適化、地震津波予測、気象予測、構造
計算、金融工学のシミュレーションに幅広く利用されている。
• 基盤ソフトウェアは 2000年までは UNIX が主流であったが、現在は※ Windows HPC Server 2008 R2
採用例があるが、ソルバー(科学技術計算公式群)が充実している Linux が主流となっている。
• スパコンの構成は並列化計算のため構成は計算ノード、ネットワーク、ペタバイトストレージを
形成しており高密度配置した 19’ ラック1基で数100 GFLOPS の演算性能を持つものが珍しくない。
• Top 500 と呼ばれる全世界のスパコン・ベンチマークランキングリストがあるが、ベンチマークに
対する消費電力の優れたスパコンリストに Green 500 がある。Top 500 と Green 500 両方にトップク
ラスであることがホンモノの実力を持ったスパコンであるといえる 。
※ 初代は Windows Compute Cluster Server
3
- 4. グリッド・コンピューティングとの違い
• グリッドは広域ネットワーク上の計算,データ,実験装置,センサ,人間
などの資源を仮想化・統合し,必要に応じて仮想計算機 (Virtual Computer) や
仮想組織 (Virtual Organization) を動的に形成するためのインフラであり、コン
ピュータ処理を集約し、再利用する仕組み。
• スパコンは同一建屋あるいは敷地を対象としたグリッド・コンピューティ
ングに形成されている。
• 一般的なパソコンを用い、使用しない夜間時間に稼働する専用ミドルウェ
アを介在し、家庭からのWANネットワーク越しに計算資源を集中させ、大
規模計算を行う仕組みがあり、分散コンピューティング技術として利用さ
れている。スパコンに匹敵する計算資源があると言われるが、安定した資
源が担保されたものではないため、生命科学系 BOINC(SETI@homeは下火)
が主要な目的である。
※ BOINC 利用方法(日本語対応) http://boinc.berkeley.edu/
4
- 5. スパコン例 GPGPU
(東京工業大学学術国際情報センターTSUBAME 2.0)
← ラックを開けたところ
インフィニバンドで結合
(2011/10/19 撮影許可のもと)
ほぼアキバで入手可能パーツ
メモ:NVIDIA社製GPUアクセラレータTesla M2050 + SSD + InfiniBand
ref.) http://tsubame.gsic.titech.ac.jp/tsubame2-system-architecture 5
(General-purpose computing on graphics processing units; GPUによる汎目的計算)
- 6. スパコン例 専用CPU
(富士通 K コンピュータ)
← モック筺体
(2011/10/4 撮影許可のもと)
国家プロジェクトとして富士通が受託開発
↓ 6次元メッシュ/トーラス構造の
インタコネクトの立体模造。
世界第一位でなければならなかった国産スパコンと豆腐インターコネクト
6
- 7. スパコン性能は国際競争力を示す
TOP 10 of 500 - 06/2012
1 米国 Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom
2 日本 K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect
3 米国 Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
4 ドイツ SuperMUC - iDataPlex DX360M4, Xeon E5-2680 8C 2.70GHz, Infiniband FDR
5 中国 Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, NVIDIA 2050
6 米国 Jaguar - Cray XK6, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA 2090
7 イタリア Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
8 ドイツ JuQUEEN - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
9 フランス Curie thin nodes - Bullx B510, Xeon E5-2680 8C 2.700GHz, Infiniband QDR
10 中国 Nebulae - Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050
スパコン性能が科学産業において【国際競争力】が優位になるのは全世界
で証明されている。スパコン事業は複数年の設計期間を要するため、単純
な事業仕分けとして規模縮小することは国際競争力を弱めるものである
※スパコン性能例として TSUBAME 2.0 で、創薬目的のタンパク質結合
シミュレーション3ヶ月程度で解析実現(計算設計は数年) 7
- 8. GPGPU 入門マシンを自作しよう
(予算5万円)
• GPGPU専用の統合開発環境は NVIDIAによる「CUDA」や、AMDの「ATI Stream」があるが、ここで
は CUDA 環境マシンを紹介したい
マザーボード: Asus P5K-VM (オンボード VGA でコンピュータ操作)
CPU: intel Core 2 Duo E8200 @2.66GHz
RAM:DDR2-800 2GB × 4 (8GB)
GPU:[ELSA] NVIDIA GeForce GTX 560 Ti OC アクセライズ / CUDA 384 Cores(演算コア数)
GPU Core 1.80GHz (DDR5/2050MHz, 256bit)
2009年頃のマシンへ 2011年夏に発売された GeForce GTX 560 Ti OC (2万円) を増設した
deviceQuery 実施例 → http://www.fxfrog.com/page/13?cat=6973
GPU 性能テスト例 → http://www.fxfrog.com/page/7?cat=6973
GPU による Windows ドメインパスワードキャッシュ・ブルートフォース解析例
→ http://www.fxfrog.com/page/6?cat=6973
準モンテカルロ法でオプション決定価格計算 → http://www.fxfrog.com/archives/3484
これらはゼロから開発したものではなく、CUDA 開発環境や SorceForge 等から入手したものである
CUDA 対応 グラボスペック(2011/Aug) 資料
http://www.slideshare.net/fullscreen/kermit123/nvidia-cuda-specification- 8
memo20110828modified/1
- 9. 身近なスパコン、計算資源利用方法
• TSUBAME を利用(みんなのペタスケール・スパコン)
• Amazon HPC アプリケーションを利用 (EC2 クラスタ・インスタンス)
→ http://aws.amazon.com/jp/hpc-applications/
スポットで HPC 利用体験 → http://www.youtube.com/embed/2Ym7epCYnSk
TSUBAME 計算サービス→ http://www.gsic.titech.ac.jp/tsubame
(評価したいだけであれば、 AWS EC2 クラスタ・インスタンスが 9
迅速且つ経済性が高い)
- 10. きっと役立つ情報入手先
• GPUコンピューティング研究会 (無料会員登録)
http://gpu-computing.gsic.titech.ac.jp/
• OpenACC (既存 CUDA ソースに数行追加実装するだけで高速化実現)
http://www.openacc-standard.org/
• 東工大 GSIC
http://www.gsic.titech.ac.jp/
• NVIDIA CUDA コンパイラ (無償入手可。ベータ版入手は要登録)
http://www.nvidia.co.jp/object/cuda_home_new_jp.html
• ATI Stream テクノロジ
http://www.amd.com/jp/products/technologies/stream-technology/Pages/stream-
technology.aspx
• Microsoft Windows HPC Server Developers – General (英語)
http://social.microsoft.com/Forums/ja-jp/windowshpcdevs/threads
10
- 11. まとめ
• 気軽にスパコン利用できる時代に入っている
• スパコン性能を高めることは国際競争力の強化と関係がある
• スパコンのクラウドサービスもある (IBM, 富士通, Amazon 等)
• アキバで入手できるパーツでスパコン構築可能
• スパコンにおけるプログラミング習得は C / C++ 基本文法を理解しており、
並列化処理 OpenMP等の基礎構文がその上で知識構築が必要
• 並列化処理が苦手でも最適化対応する各種 GPGPU / CUDA オプション製品や
パッケージが NVIDIA、サードパーティ各社、SorceForge から入手できる
• GPU はコア間のメモリアクセス距離が物理的に近いため、CPU に対して
GPU が並列演算性能が高い。またメニーコアで高速演算するにはパソコン
向け CPU ではなく、K コンピュータのように専用 CPU と内部結合を開発
せねばならない
オフィスサイトウでは、InfiniBand や SSD を用いた大量のデータを
高速かつ確実に処理する手法構成を日々研究しています。 11
営業パートナーなどお気軽にご相談ください。 Twitter @yukio_saitoh