More Related Content
Similar to エヌビディア GPU が加速するディープラーニング (20)
More from NVIDIA Japan (20)
エヌビディア GPU が加速するディープラーニング
- 7. パフォーマンスリーダー
0
500
1000
1500
2000
2500
3000
3500
2008 2009 2010 2011 2012 2013 2014
倍精度演算性能
NVIDIA GPU x86 CPU
M2090
M1060
K20
K80
Westmere
Sandy Bridge
Haswell
GFLOPS
0
100
200
300
400
500
600
2008 2009 2010 2011 2012 2013 2014
メモリバンド幅
NVIDIA GPU x86 CPU
GB/s
K20
K80
Westmere
Sandy Bridge
Haswell
Ivy Bridge
K40
Ivy Bridge
K40
M2090
M1060
- 8. TESLA K80
ビッグデータ解析と科学技術計算のた
めの世界最速のアクセラレータ
Caffe Benchmark: AlexNet training throughput based on 20 iterations, CPU: E5-2697v2 @ 2.70GHz. 64GB System Memory, CentOS 6.2
最大性能
アプリケーション毎に
ダイナミックに性能を最大化
メモリ倍増
ビッグデータアプリに最適
24GB
オイル
& ガス
ビッグデータ
解析
HPC
可視化
K40
12GB
2倍高速
2.9 TF| 4,992 コア | 480 GB/s
0x
5x
10x
15x
20x
25x
1 2 3
ディープラーニング: Caffe
最高のスループット
のためのデュアル
GPU アクセラレータ
- 9. GPU とソフトウェアの進化
による性能向上
AlexNet [A. Krizhevsky et al.,2012]
2.5M
18M
23M
43M
0
10
20
30
40
50
16 Core CPU GTX Titan Titan Black
cuDNN v1
Titan X
cuDNN v2
MillionsofImages
1日当りにトレーンングできる画像の数 (Caffe)
E5-2698 v3 @ 2.3GHz / 3.6GHz Turbo
GPU は CPU の
17倍の性能
- 15. SGEMM/W
2012 20142008 2010 2016
48
36
12
0
24
60
2018
72
Tesla Fermi
Kepler
Maxwell
Pascal
16 ビット演算
3D メモリ
NVLink
Volta
GPU ロードマップ
Pascal アーキテクチャで1ワット当りのSGEMM性能を2倍に