Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.
PowerEdge R730 及び
NVIDIA GRID K2 パフォーマンス測定結果報告書
背景
• GPUサーバから複数のレンダリング映像を送出する
といった使い方をする場合、以下の製品が候補とし
て考えられる
– NVIDIA GRID K1/K2 (VDI用途)
– NVIDIA GRID K340/K520 (CloudGam...
背景
• K1/K2はVDI用途とされているが…
– VDIのような定形リソース分割をする形ではなく、
フレキシブルなGPUリソースの利用を検討したい
• コンテンツ制作の柔軟性のため
– より汎用な製品を使うことによるメリット
• 供給の安定...
評価項目
• 1サーバでどれだけのアプリインスタンスを同
時実行できるのか
• K340/K520といった特化製品との挙動差異を
見る(今回の資料からは割愛)
概略図
Windows Server 2012 R2
App App App
PowerEdge R730
H.264 H.264
H.264 H.264
H.264 H.264 H.264
• サーバ上でアプリインスタンスを動かす
• 生成し...
評価機(サーバ)の仕様
• CPU
– Intel Xeon E5-2600 v3 2.60GHz x2
• RAM
– 32GB
• GPU
– NVIDIA GRID K2 x 2
評価ソフトウェア仕様
• アプリケーション仕様
– 解像度: 1280x720
– ビデオフレームレート: 30 fps
• アプリケーション種別
– App1
• 三角形の回転表示(シンプルなアプリ)
– App2
• 低負荷な2D表示
※今...
評価項目
• 主にビデオエンコーディング処理よる負荷計測にフォー
カス
– 評価機
• 測定スクリプトで計測
– CPU 使用率
– メモリ使用量
– NVIDIA GRID K2
• 1チップ単一処理/4チップ分散処理における性能差を比較
•...
評価結果 (ビデオチップ=1個で処理)
アプリケーション 最大インスタンス数 ボトルネック要因
App1 6 VPU
App2 6 VPU
評価結果 (ビデオチップ=4個で分散処理)
アプリケーション 最大インスタンス数 ボトルネック要因
App1 24 VPU
App2 24 VPU
ボトルネックにより発生する現象
ボトルネック要因 現象
CPU アプリケーション処理低下
GPU フレームレート低下
VPU エンコード遅延
RAM/VRAM不足 一定数よりアプリインスタンスが起動不能
まとめ
• NVIDIA GRID K2 について
– ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない
– K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログ
スペックなのでK2がCoreあたり...
まとめ
• アプリケーションのボトルネック傾向
– App1/2ともにVPUによるボトルネックが最初に来ている。それで最大
同時接続台数が決まっている
– アプリが高品質な3D映像を生成するアプリケーションに変わったとし
てもCPU/GPUの負...
APPENDIX
GPU使用率(App1)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
VPU使用率(App1)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
GPU使用率(App2)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
VPU使用率(App2)4チップ使用時
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
...
Prochain SlideShare
Chargement dans…5
×

PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

1 395 vues

Publié le

Publié dans : Technologie
  • Identifiez-vous pour voir les commentaires

PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書

  1. 1. PowerEdge R730 及び NVIDIA GRID K2 パフォーマンス測定結果報告書
  2. 2. 背景 • GPUサーバから複数のレンダリング映像を送出する といった使い方をする場合、以下の製品が候補とし て考えられる – NVIDIA GRID K1/K2 (VDI用途) – NVIDIA GRID K340/K520 (CloudGaming用途)
  3. 3. 背景 • K1/K2はVDI用途とされているが… – VDIのような定形リソース分割をする形ではなく、 フレキシブルなGPUリソースの利用を検討したい • コンテンツ制作の柔軟性のため – より汎用な製品を使うことによるメリット • 供給の安定 • サポート
  4. 4. 評価項目 • 1サーバでどれだけのアプリインスタンスを同 時実行できるのか • K340/K520といった特化製品との挙動差異を 見る(今回の資料からは割愛)
  5. 5. 概略図 Windows Server 2012 R2 App App App PowerEdge R730 H.264 H.264 H.264 H.264 H.264 H.264 H.264 • サーバ上でアプリインスタンスを動かす • 生成した画面をNVIDIA GPUを使って H.264 にエンコード • ビデオデータをパケットとして接続相手のク ライアントに送出 • クライアントでデコード・表示 PC Smart Device PC
  6. 6. 評価機(サーバ)の仕様 • CPU – Intel Xeon E5-2600 v3 2.60GHz x2 • RAM – 32GB • GPU – NVIDIA GRID K2 x 2
  7. 7. 評価ソフトウェア仕様 • アプリケーション仕様 – 解像度: 1280x720 – ビデオフレームレート: 30 fps • アプリケーション種別 – App1 • 三角形の回転表示(シンプルなアプリ) – App2 • 低負荷な2D表示 ※今回の検証では3D性能による負荷の計測は行っていない。
  8. 8. 評価項目 • 主にビデオエンコーディング処理よる負荷計測にフォー カス – 評価機 • 測定スクリプトで計測 – CPU 使用率 – メモリ使用量 – NVIDIA GRID K2 • 1チップ単一処理/4チップ分散処理における性能差を比較 • 測定スクリプトで計測 – GPU使用率 – VPU使用率*1 – ビデオメモリ使用量
  9. 9. 評価結果 (ビデオチップ=1個で処理) アプリケーション 最大インスタンス数 ボトルネック要因 App1 6 VPU App2 6 VPU
  10. 10. 評価結果 (ビデオチップ=4個で分散処理) アプリケーション 最大インスタンス数 ボトルネック要因 App1 24 VPU App2 24 VPU
  11. 11. ボトルネックにより発生する現象 ボトルネック要因 現象 CPU アプリケーション処理低下 GPU フレームレート低下 VPU エンコード遅延 RAM/VRAM不足 一定数よりアプリインスタンスが起動不能
  12. 12. まとめ • NVIDIA GRID K2 について – ほぼ期待どおりの挙動。VDI向けだからという制限は感じられない – K520は同時16セッション(GPU Coreあたり 8 セッション)というカタログ スペックなのでK2がCoreあたり6セッションで頭打ちになっている事か らするとVPU性能に差異がある可能性もある
  13. 13. まとめ • アプリケーションのボトルネック傾向 – App1/2ともにVPUによるボトルネックが最初に来ている。それで最大 同時接続台数が決まっている – アプリが高品質な3D映像を生成するアプリケーションに変わったとし てもCPU/GPUの負荷が上がるだけでVPU負荷については解像度が変 わらない限り変化はない
  14. 14. APPENDIX
  15. 15. GPU使用率(App1)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 gpuusage(%) Num of running applications The transition of max gpu usage (App1) gpu3 gpu2 gpu1 gpu0
  16. 16. VPU使用率(App1)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 vpuusage(%) Num of running applications The transition of max vpu usage(App1) vpu3 vpu2 vpu1 vpu0
  17. 17. GPU使用率(App2)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 gpuusage(%) Num of running applicaitons The transition of max gpu usage(App2) gpu3 gpu2 gpu1 gpu0
  18. 18. VPU使用率(App2)4チップ使用時 0 50 100 150 200 250 300 350 400 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 vpuusage(%) Num of running applications The transition of vpu usage(App2) vpu3 vpu2 vpu1 vpu0

×