Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

1000: 基調講演

2015年9月18日開催 GTC Japan 2015 講演資料

エヌビディア米国本社のMarc HamiltonがGPU テクノロジーの最新情報、未来の姿をご紹介します。

  • Soyez le premier à commenter

1000: 基調講演

  1. 1. エヌビディア コーポレーション ソリューション アーキテクチャ & エンジニアリング 副社長 マーク・ハミルトン 基調講演
  2. 2. ビジュアルコンピューティングの世界的リーダー ENTERPRISE 自動車ゲーム HPC & クラウドエンタープライズ
  3. 3. GPU コンピューティングの大きな飛躍 20152008 3,000,000 CUDA ダウンロード 150,000 CUDA ダウンロード 60,000 学術論文 4,000 学術論文 800 大学の CUDA コース 60 大学の CUDA コース 54,000 スーパーコンピューティング テラフロップス 77 スーパーコンピューティング テラフロップス 450,000 Tesla GPU 6,000 Tesla GPU 319 CUDA アプリ 27 CUDA アプリ
  4. 4. GEFORCE NOW You listen to music on Spotify. You watch movies on Netflix. GeForce Now lets you play games the same way. Instantly stream the latest titles from our powerful cloud-gaming supercomputers. Think of it as your game console in the sky. Gaming is now easy and instant. 先進のレンダリングから 仮想PCまで 製品の可視化 建築 サイエンス 先進のレンダリングが可能にする 次世代バーチャル製品開発 GRID 2.0 が実現する拡張性、 仮想 PC におけるセキュリティ リアルタイム可視化が HPC データ センターに新たな価値を 建築 製品デザイン リアルタイム可視化
  5. 5. 東京工業大学 学術国際情報センター 副センター長 GPU コンピューティング研究会 主査 共同利用推進室 室長 CUDA Fellow 青木 尊之教授
  6. 6. スパコンにおける VDI の必要性 大規模データ 数100GB~数10TB プリ・ポスト処理(可視化) ※ 膨大なデータ転送時間 ※ 巨大なローカルストレージ 数時間~数日 (~数10MB/s)
  7. 7. 大規模データ 数100GB~数10TB プリ・ポスト処理 ※ データ転送時間の削減 ※ セキュリティの大幅向上 スパコンにおける VDI の必要性 シンクライアント デスクトップ画面のみ インターネット (~10Mbps) スパコン直結 VDIシステム
  8. 8. TSUBAME2.5直結 VDI システム (概要) 計算ノード 4224 GPU (Tesla K20X) NVIDIA GRID K2 x 3 HP ProLiant SL250s × 3 Xeon(R) CPU E5-2660 v2 2.20GHz ×2 128GB インターネット
  9. 9.  TSUBAMEで動作するCAEアプリケーションのインタラクティブ・ポスト処理 (CST MWStudio)  TSUBAMEで行った大規模計算をTSUBAME上で可視化した計算結果のフルHD 動画再生 個別要素法の粒子計算によるバンカーショット (1670万個) 粒子法(SPH) による多数の浮遊物を含んだ津波シミュレーション (8700万個) メッシュ(VOF) 法による気液二相流シミュレーション (1.1億メッシュ) TSUBAME2.5直結 VDI システム (デモ)
  10. 10. NVIDIA GRID 2.0
  11. 11. ハイパーバイザ 仮想マシン vGPU NVIDIA GRID vGPU アーキテクチャ クライアント デバイス データセンター サーバー VMware Horizon View Citrix XenDesktop ゲスト OS Windows NVIDIA ドライバ ゲスト OS Linux NVIDIA ドライバ 仮想マシン vGPU サーバー vGPU マネージャー GRIDCPU
  12. 12. NVIDIA GRID は誰のため? よりよいユーザー エクスペリエンスを期待する ビジネスユーザー 中小規模のファイルを扱う エンジニアとデザイナー 最高のグラフィックス性能を 必要とする エンジニアとデザイナー
  13. 13. GRID 拡張仮想 ワークステーション GRID 仮想 ワークステーション GRID 仮想 PC NVIDIA データセンター GPU (TESLA M6/M60) ソフトウェア・サポート + アップデートサブスクリプション 一年更新 ソフトウェア ライセンス (一括払い) ハードウェア NVIDIA GRID 2.0
  14. 14. ディープラーニング
  15. 15. 典型的なネットワーク例 ディープラーニングとは? 目的 顔認識 トレーニングデータ 1,000万~1億イメージ ネットワークアーキテクチャ 10 層 10 億パラメータ ラーニングアルゴリズム 30 エクサフロップスの計算量 GPU を利用して30日
  16. 16. 木 猫 犬 機械学習ソフトウェア “亀” フォワード プロパゲーション “亀” から “犬” へ 計算の重み付けを更新 バックワード プロパゲーション 学習済みモデル “猫” 反復 トレーニング 推論
  17. 17. なぜディープラーニングが注目を集めるのか? ビッグデータの存在 GPU の計算パワー新しいアルゴリズム 毎日 3億5000万枚 の画像がアップロード 毎時 2.5 ペタバイトの 顧客データ 毎分 300 時間分の ビデオがアップロード
  18. 18. エヌビディア ディープラーニング アプリケーション DIGITS ツール 開発 運用 ディープラーニング フレームワーク ソフトウェア システム ハードウェア ソフトウェア システム ハードウェア cuDNN DevBox TITAN X システム管理 TESLA
  19. 19. NVIDIA cuDNN ハイパフォーマンス ニューラルネットワーク トレーニング Caffe、Chainer、Theano、Torch などのディープラー ニング フレームワークを GPU で高速化 pooling、ReLU、sigmoid、softmax、TANH など様々 なタイプのレイヤーをサポート 最新のエヌビディア GPU アーキテクチャに最適化 Linux、Windows、OSX および Linux for Tegra (ARM) をサポート GPU が加速するディープラーニング フレームワーク http://developer.nvidia.com/cuDNN 0 20 40 60 80 cuDNN 1 (TITAN Black) cuDNN 2 (TITAN X) cuDNN 3 (TITAN X) 性能向上 1日で学習できる画像の数(100万枚単位)
  20. 20. NVIDIA DIGITS インタラクティブ ディープラーニング GPU トレーニング システム Test Image トレーニング進捗確認DNN の構成データ処理 レイヤーの可視化 http://developer.nvidia.com/digits
  21. 21. DIGITS デモ エヌビディア CUDA エンジニア 村上 真奈
  22. 22. 音声認識 画像分析 自然言語処理 エヌビディアが加速するディープラーニング フレームワーク エンドユーザ アプリケーション DIGITS ディープラーニング フレームワーク (Caffe, Chainer, Torch, Theano) 高度に最適化された cuDNN ライブラリ CUDA プログラミング ツールキット GPU ハードウェア
  23. 23. GPUコンピューティング DL ライブラリ DL の技術開発力 Chainer Chainerおよび関連技術の開発期間の短縮 各産業へのディープラーニングの適用を促進 ×
  24. 24. 株式会社 Preferred Networks 代表取締役社長 西川 徹様
  25. 25. Distributed Cooperative Deep Learning 次世代ビッグデータ・IoT技術基盤の確立を目指して 分散協調型 強化学習 学習結果は リアルタイムに反映
  26. 26. From Sensing to Controlling Action IoT デバイスはセンシングだけでなくリモートでのコントロール・アクションを実現する Data Collection Control Sensing Cooperate
  27. 27. Chainer ChainerはCUDAを採用 GPUを数行のコードで動かせる 複数GPUでの実行も可能 パワフル Pythonの任意の制御構文を 使って逆伝播可能なコードが 書ける コードは直観的で、デバッグも 容易 直観的 様々なネットワークアーキテク チャをサポート feed-forward、convnet、 recurrent、 recursive nets バッチごとに異なるアーキテク チャも記述可能 フレキシブル A Powerful, Flexible, and Intuitive Framework of Neural Networks
  28. 28. DAVE ディープラーニングによるロボットナビゲーション ディープニューラルネットワークが人間の運転手を「見て」、対応を学習 DARPA 自動走行車 (2004年) “右に曲れ” “左に曲れ”
  29. 29. エヌビディア コーポレーション 自動車担当シニアディレクター ダニー・シャピロ 自動運転を目指して
  30. 30. NVIDIA オートモーティブ 世界中の道路に さらにこれから… 800万台以上 20以上のブランド 100以上のモデル
  31. 31. NVIDIA
  32. 32. フォトリアル デザイン シミュレーション
  33. 33. 効率を改善するためのシミュレーション
  34. 34. シミュレーションによるより良い、より速い車作り
  35. 35. 実際のクラッシュ クラッシュシミュレーション シミュレーションによる、より良い、より速い車作り
  36. 36. ソフトウェア ディファインド カー
  37. 37. ソフトウェア ディファインド カー
  38. 38. ソフトウェア ディファインド カー
  39. 39. ソフトウェア ディファインド カー
  40. 40. ソフトウェア ディファインド カー
  41. 41. ソフトウェア ディファインド カー
  42. 42. ソフトウェア ディファインド カー
  43. 43. 今日の ADAS FPGA CV ASIC SENSE ACTPLAN CPU BRAKE WARN
  44. 44. 次世代の ADAS ACTSENSE ACT ACCELERATE PLAN STEER BRAKE WARN FPGA CV ASIC CPU
  45. 45. 次世代の ADAS
  46. 46. 自動運転にはディープラーニングが必須の技術に FPGA CV ASIC SENSE ACT ACCELERATE PLAN CPU DNN STEER BRAKE WARN
  47. 47. ディープラーニングによる車の分類 画像 “Audi A7” Image source: “Unsupervised Learning of Hierarchical Representations with Convolutional Deep Belief Networks” ICML 2009 & Comm. ACM 2011. Honglak Lee, Roger Grosse, Rajesh Ranganath, and Andrew Ng.
  48. 48. DRIVE PX 自動運転用 カーコンピューター NVIDIA GPU によるディープラーニング スーパーコンピューター 学習済みの ニューラルネットモデル 分類された対象物 ! より良く見える、そして学習する自動車へ カメラ入力 正しく認識されなかった 対象物をフィードバック
  49. 49. NVIDIA DRIVE™ PX 自動運転用カーコンピューター 2.3 テラフロップス 12 カメラ入力 センサーフュージョンとディープラーニング
  50. 50. Video: Danny-05
  51. 51. ADAS Today 歩行者
  52. 52. 乗用車
  53. 53. スクールバス
  54. 54. 救急車
  55. 55. 株式会社 ZMP 代表取締役社長 谷口 恒様
  56. 56. ©2015 ZMP Inc. All Rights Reserved. 農業機械 自動運転 技術 物流支援ロボットタクシー社 様々な応用事業を実現していく 鉱山・建設機械 自律移動 技術 ロボット技術 エアロセンス社 Robot of Everything
  57. 57. ZMP RoboCarシリーズにNVIDIA DRIVE PXを採用 ©2015 ZMP Inc. All Rights Reserved. NVIDIA DRIVE PX上で動作するディープラーニングを応用した画像認識ソフトウェアを開発、販売 さらに、RoboCarシリーズとDRIVE PXを組み合わせて販売へ DRIVE PX ® MiniVan ↓ 歩行者認識 DNNを使ったヒトの胴体検出と ステレオカメラによる距離計測処理 ↑ 車両/レーン認識 ↑ 信号機認識 DNNによる車両、レーン検知、信号認識
  58. 58. イノベーションのためのモデル OEM TIER 1 チップ サプライヤー TIER 1 OEM SILICON VALLEY 伝統的なモデル
  59. 59. MERCI 月面での自動運転
  60. 60. 未来の GPU テクノロジー
  61. 61. 2012 20142008 2010 2016 2018 48 36 12 0 24 60 72 Tesla Fermi Kepler Maxwell Pascal 混合精度演算 倍精度演算 3D メモリ NVLink Volta GPU ロードマップ SGEMM/W
  62. 62. ユニファイドメモリ 単一メモリ空間による容易なプログラミング NVLink ハイスピードインターコネクト PCIE Gen 3 の5倍の性能 メモリバンド幅 メモリ容量およびバンド幅の大幅な向上 Pascal: 次世代 GPU パフォーマンス 世界最高の倍精度演算
  63. 63. NVIDIA OpenACC ツールキット アクセラレイテッドコンピューティングへのシンプルかつ強力なパスを無償提供 http://www.nvidia.com/openacc からダウンロード PGI コンパイラ アカデミックユーザーへ OpenACC コンパイラを無償提供 NVProf プロファイラ コンパイラディレクティブの挿入箇所を容易に発見 コードサンプル 実際のアプリケーションのアルゴリズムから学ぶ ドキュメント クィックスタートガイド、ベストプラクティス、フォーラム
  64. 64. 世界の HPC のリーダーシップへ 2017年運用開始予定 100-300 ペタフロップス 10倍のアプリケーション性能 IBM POWER9 CPU と NVIDIA Volta GPU NVLink ハイスピードインターコネクト 40,000 個の Volta GPU CORAL プロジェクト 米国国家戦略計算イニシアティブ 2023年までに米国でエクサフロップスシステムを作る大統領令 ポストムーアの法則時代への明確なパス 現行の米国最速スパコンの30倍の性能 GPU がプレエクサおよびエクサスケールマシンを実現 研究開発予算 5 億ドル (2016-22)
  65. 65. 日本アイ・ビー・エム株式会社 ハイエンド・システム事業部 理事 朝海 孝様
  66. 66. 74 HPCの新潮流 –Data Centric Computing- IBM POWER9 CPU + NVIDIA Volta GPU NVLink 超高速インターコネクト ノード当り 40 テラフロップス以上 3,400ノード以上 2017年稼動予定 SUMMIT SIERRA ピーク性能 150-300 ペタフロップス ピーク性能 100 ペタフロップス以上 データを動かさずに処理する“新しい設計思想”に準拠した データセントリックシステム時代の幕開け!
  67. 67. 75 ビッグデータの有効利活用で 社会に貢献! 豊かな日本社会へ データセントリック推進センターで オープンコラボレーション! 日本発のInnovation 標準製品・低消費電力で 超高速ビッグデータ分析を! POWER+GPGPU データセントリック推進センターを日本に開設へ 豊かな日本社会へ POWER + GPGPU 日本発の Innovation
  68. 68. TESLA アクセラレイテッド データセンタープラットフォーム TESLA データセンター サーバー / ラック QUADRO デザイン & レンダリング VCA, Iray DESIGNWORKS GRID 仮想PC & ワークステーション vGPU HPC OpenACC CUDA ディープラーニング cuDNN DIGITS TESLA システム管理およびコミュニケーションミドルウェア
  69. 69. Enjoy GTC Japan 2015!
  70. 70. WELCOME TO THE FUTURE

×