SlideShare une entreprise Scribd logo
1  sur  2
Télécharger pour lire hors ligne
GTC 2017 での発表内容まとめ NEWS
SILICON VALLEY MARCH 26-29, 2018
日本版
GTC 2018のエヌビディア発表内容まとめ
日本版
v2.2
GTC 2018 はカリフォルニア州のサンノゼ コンベンションセンターで3月26日から29日の4日間にわたって開催
され、過去最大となる 7700 人の開発者、研究者、メディア関係者等が 65 カ国以上から参加しました。
全体で 600 以上のテクニカルセッション、60 種類に及ぶハンズオンラボが実施され、展示会場には150 以
上のブースが並んで各社が最新の技術を披露しました。
日本では、GTC Japan 2018 を9月13日-14日の2日間、グランドプリンスホテル新高輪にて開催します。
皆様の参加をお待ちしております。詳しくはこちら: https://www.nvidia.com/ja-jp/gtc
世界最大の GPU 技術イベント GTC 2018 が大盛況のうちに閉幕
Tesla V100 32GB 版
ディープラーニングのモデルは年々その複雑さを増しており、GPU にはより大きなメモリが求められています。
今回、Tesla V100 に今までの 2 倍となる 32GB の HBM2 メモリを搭載した新モデルを発表しました。
5,120 個の CUDA コアと 640 個の Tensor コアによる演算性能や 900GB/s のメモリバンド幅、消費電
力等は現行の 16GB モデルと同一です。
Tesla V100 の詳細はこちら: https://www.nvidia.com/en-us/data-center/tesla-v100
なお、昨年 Tesla P100 を 1024 基備えるスーパーコンピューター「MN-1」で、ImageNet データセットを15
分で学習するという記録を達成した Preferred Networks 様より、この Tesla V100 32GB 版を 512 基
搭載した「MN-1b」の構築が発表されました。
MN-1b に関してはこちら: https://www.preferred-networks.jp/ja/news/pr20180328
TESLA V100 (SXM2)
TESLA V100 (PCIe)
NVIDIA DGX-2 - Tesla V100 を 16 基搭載する GPU スーパーコンピューター
2016 年の GTC で最初の DGX-1 を発表してから2年弱。128 ノードクラスタの
「DGX SATURNV」が GREEN 500 の首位を獲得したり、日本の理化学研究所にも
54 ノードの大規模 DGX-1 クラスタが導入されるなど、大きな成果が生まれています。
今回、AI 研究を新たな段階ヘ進める力となるべく、NVIDIA DGX-2 を発表しました。
DGX-2 は 32GB 版の Tesla V100 を単一筐体内に 16 基(!)搭載。Tensor コアによ
る FP16, FP32 混合精度演算性能は 2 ペタフロップスに達します。
詳しくはこちら: https://www.nvidia.com/en-us/data-center/dgx-2/
NVSwitch インターコネクト DGX-2 の大きな特徴は、16基の GPU を「NVSwitch」という新しいインターコネクトで接続している
ことです。これは 2.4TB/s のバイセクションバンド幅を持ち、つまり8組の Tesla V100 がそれぞれ
同時に 300GB/s で通信できることになります。
詳しくはこちら: https://www.nvidia.com/en-us/data-center/nvlink/
仮想化に対応
DGX-2 は最新の Xeon Platinum CPU を2基と
1.5TB のシステムメモリを備える大型サーバーであり、
複数の利用者が各自の環境を柔軟に作り出せる
プライベートクラウドの基盤にも最適です。
KVM による仮想化に対応し、VM から GPU 及び
NVSwitch へ完全にアクセス可能です。
ノード間接続も高速
DGX-2 はシングルノードでも極めて高い性能を発
揮しますが、8 本の EDR InfiniBand、100GbE、
ROCE といった多様な低遅延・広帯域
ノード間接続をサポートします。
Quadro GV100
Volta 世代初の Quadro 製品となる Quadro GV100 を発表しました。Tesla V100 及び TITAN V と同じ
GV100 チップを搭載する製品です。前世代の Quadro GP100 と同様に NVLink のコネクタを備え、これに
よって2基の Quadro GV100 を接続できます。2個の NVLink ブリッジにより、GV100 間の帯域は双方向で
200 GB/s となり、最大8枚のディスプレイを同期することが可能です。この高い性能により、Quadro GV100
は先日の GDC 2018 で発表された「NVIDIA RTX」によるリアルタイム レイ トレーシングにも対応します。
そして Quadro GV100 は単に「高性能なプロフェッショナル向けグラフィクスカード」ではありません。
Tesla V100 譲りの演算性能 (倍精度: 7.4、単精度: 14.8、Tensor コアを使った混合精度演算では
118.5 TFLOPS) は、HPC や AI 向けのアクセラレータとして極めて強力なもので、「HPCも、AIも、グラフィック
スもこなせる最強のワークステーション GPU」が Quadro GV100 なのです。
詳しくはこちら: https://blogs.nvidia.com/blog/2018/03/27/quadro-gv100-deep-learning-simulation/
Quadro GV100
Facebook: https://www.facebook.com/NVIDIAAI.JP
Twitter: @NVIDIAAIJP / @NVIDIAJapan ハッシュタグ: #GTC18
NVIDIA GPU Cloud の拡大
自動運転のためのハードウェア及びソフトウェア群である「NVIDIA DRIVE」に関しても多くの発表がありました。
最も重要なのは走行テストを仮想空間で効率的に行うための DRIVE Sim 及び DRIVE Constellation です。
自動運転車の開発には、様々な道路状況で繰り返しテストを重ねることが不可欠ですが、実走のみで全てのテストを
行うことは、時間やコストの面から限界があります。DRIVE Sim は、GPU によって走行環境を作り出すシミュレーターで、
晴天、雨、吹雪といった気象状況、逆光や夜間走行による視界の変化などを自在に生成できます。実走では危険を
伴う状況も、DRIVE Sim では安全に何度でも再現することができるのです。
DRIVE Constellation は DRIVE Sim を使ったシミュレーションをデータセンターで効率的に繰り返すためのプラット
フォームで、二つのサーバーからなります。片方は DRIVE Sim が作動するシミュレータ、もう一方では車載コンピュー
ターの DRIVE Pegasus が動作し、DRIVE Sim によって生成された走行状況を「本当に走っているつもりで」処理しま
す。その結果は DRIVE Sim 側にフィードバックされ、次の状況生成に反映されます。このフィードバックループは毎秒
30 回という頻度で回り続け、DRIVE Pegasus で動作するソフトウェアの動作検証に役立てられます。
また、ハードウェア面では次世代の SoC である Orin が発表されました。 DRIVE Pegasus には Xavier SoC が2基に
加えて2基の外部 GPU を持ちますが、 Orin は2基の SoC のみで Pegasus に匹敵する性能を持つ予定です。
自動運転車の効率的な走行シミュレーション - DRIVE SIM、DRIVE CONSTELLATION
最新情報を日本で - NVIDIA Deep Learning Seminar 2018 を4月24日に開催
GTC 2018 で発表される数多くの最新情報は、とてもこの1枚では伝えきれません。そこで、基調講演の内容のみならず、数多くのテクニカルセッションや
ポスターで発表される研究成果や事例を厳選し、日本の皆様にお伝えするイベント「NVIDIA Deep Learning Seminar 2018」を4月24日に開催し
ます。エヌビディア及び協賛各社の展示ブースも多数設置予定です。皆様の参加をお待ちしております。
Deep Learning Seminar 2018 への登録はこちら: http://eventregist.com/e/NVDLS2018
NVIDIA GPU Cloud (NGC) は HPC アプリケーションやディープラーニング
フレームワークを Docker イメージで提供するクラウドサービスで、Pascal
世代以降の GPU があれば、PC、ワークステーション、クラウドなど様々な
環境で利用可能です。
今回、正式サポート対象のクラウドプラットフォームに AliCloud、Google
Cloud Platform、Oracle Cloud が追加されました。
また、NGC レジストリに、可視化ツールの NVIDIA Index や VMD、そして
GPU 対応データベースの Kinetica などが追加され、およそ 30 種類のア
プリケーションが揃いました。ぜひご利用ください。
NGC への登録(無料)はこちら: http://www.nvidia.com/ngcsignup
推論最適化エンジンである TensorRT 4 に多くの機能追加がありました。
• TensorFlow 1.7に、TensorRT を統合。ResNet 50の推論ベンチ
マークテストで8倍の高速化を実現。
• ONNX のサポート: Pytorch, Caffe 2, CNTK, MXNet, Chainer と
の相互運用性を改善。
• カスタムネットワークの高速化: Tesla V100 の Tensor コアを使った
推論をサポート。
• Xavierのサポート: NVIDIA DRIVEに代表される Xavier ベースのプ
ラットフォームへの最適化。
詳細: https://devblogs.nvidia.com/tensorrt-integration-speeds-tensorflow-inference/
コンテナオーケストレーションツールとして事実上の標準となっている
Kubernetes 上での GPU アプリケーション実行をサポートするためにコミュ
ニティに貢献していきます。ポイントは以下の通りです:
• NVIDIA Device Plugin による GPU サポート。
• 様々な GPU クラスタへのアプリケーションの容易なデプロイを可能に。
• GPU 共有による使用率の最大化。
• NVML や DCGM といった管理ツールによる Kubernetes 上の GPU
の監視・メトリック取得の実現
詳細: https://developer.nvidia.com/container-runtime-and-orchestrators
仮想 GPU (GRIDテクノロジ) に関して次の発表がありました。
• Quadro vDWS が Tesla V100 をサポート。
• GRID vPC が複数の 4K モニタや Linux OS をサポート。
• GPU VM のライブ マイグレーションをサポートするなど、運用管理機能
の改善
Tesla V100 等の最新 GPU をサポートすることで、Quadro vDWS は
Ansys Discovery Live のような複雑なリアルタイムシミュレーションや、
ディープラーニングワークロードを含め、設計プロセスの全てをカバーする
ワークステーションになります。
詳細: https://blogs.nvidia.com/blog/2018/03/27/live-gpu-migration-virtualization/
オールフラッシュストレージ製品のリーディングベンダーであるピュア・ストレー
ジは、高性能並列ストレージ製品 FlashBlade と NVIDIA DGX-1 を組
み合わせた AI アプライアンス “AIRI” - AI-Ready Infrastructure を発
表しました。AIRI はエヌビディアとピュア・ストレージが共同で策定したリファ
レンスアーキテクチャに基づいており、極めて大量のデータを元にしたディー
プラーニングのワークフローにおいても、ストレージがネックとなることなく、
DGX-1 の性能を最大限に発揮できる構成になっています。
GTC の ピュア・ストレージ ブースでは、4台の DGX-1 と FlashBlade が
統合された AIRI の実機が展示されました。
詳細: https://blogs.nvidia.co.jp/2018/04/05/pure-storage-airi-nvidia-dgx/
詳細: https://nvidianews.nvidia.com/news/nvidia-introduces-drive-constellation-simulation-system-to-safely-drive-autonomous-vehicles-billions-of-miles-in-virtual-reality
DGX-1 と Pure Storage FlashBladeVirtual GPU March 2018 Release
TensorRT 4 の新機能
Kubernetes on NVIDIA GPU
この資料: bit.ly/nvnewsgtc18
NVIDIA Isaac SDK は AI ロボットを開発・展開するためのドライバ、ライブ
ラリ、及びツール群です。ロボット開発に必須の認識・ナビゲーション・操作
といった機能だけでなく、通信とデータ管理のフレームワークを提供します。
また、SDK には Isaac Sim というシミュレーターも含まれます。これはロボッ
トを実環境に展開する前に、現実世界を再現した仮想環境内で学習と
テストを繰り返し、動作精度を効率的に高めるためのものです。
Isaac SDK を利用することで、実機のみで開発・テストを行う場合と比べ
て何百時間もの労力を削減でき、次世代の AI ロボットを迅速に市場へ
投入できるようになるでしょう。
詳細: https://developer.nvidia.com/isaac-sdk
Isaac SDK

Contenu connexe

Plus de Kuninobu SaSaki

20150821 Azure 仮想マシンと仮想ネットワーク
20150821 Azure 仮想マシンと仮想ネットワーク20150821 Azure 仮想マシンと仮想ネットワーク
20150821 Azure 仮想マシンと仮想ネットワークKuninobu SaSaki
 
Azure仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワークAzure仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワークKuninobu SaSaki
 
もっとわかる Microsoft Azure 最新技術アップデート編 - 20150123
もっとわかる Microsoft Azure最新技術アップデート編 - 20150123もっとわかる Microsoft Azure最新技術アップデート編 - 20150123
もっとわかる Microsoft Azure 最新技術アップデート編 - 20150123Kuninobu SaSaki
 
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」Kuninobu SaSaki
 
20140818 オープン白熱塾 ksasakims
20140818 オープン白熱塾 ksasakims20140818 オープン白熱塾 ksasakims
20140818 オープン白熱塾 ksasakimsKuninobu SaSaki
 
YAPC::Asia Tokyo 2013 ランチセッション
YAPC::Asia Tokyo 2013 ランチセッションYAPC::Asia Tokyo 2013 ランチセッション
YAPC::Asia Tokyo 2013 ランチセッションKuninobu SaSaki
 
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Kuninobu SaSaki
 
Effective Hyper-V - 久しぶりエディション
Effective Hyper-V - 久しぶりエディションEffective Hyper-V - 久しぶりエディション
Effective Hyper-V - 久しぶりエディションKuninobu SaSaki
 
HPC Azure TOP500 2012-11
HPC Azure TOP500 2012-11HPC Azure TOP500 2012-11
HPC Azure TOP500 2012-11Kuninobu SaSaki
 
TechEd2010_T2-401_EffectiveHyper-V
TechEd2010_T2-401_EffectiveHyper-VTechEd2010_T2-401_EffectiveHyper-V
TechEd2010_T2-401_EffectiveHyper-VKuninobu SaSaki
 
TechEd2009_T1-402_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-VTechEd2009_T1-402_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-VKuninobu SaSaki
 
TechEd2008_T1-407_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-VTechEd2008_T1-407_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-VKuninobu SaSaki
 

Plus de Kuninobu SaSaki (14)

SC16 NVIDIA NEWS
SC16 NVIDIA NEWSSC16 NVIDIA NEWS
SC16 NVIDIA NEWS
 
20150821 Azure 仮想マシンと仮想ネットワーク
20150821 Azure 仮想マシンと仮想ネットワーク20150821 Azure 仮想マシンと仮想ネットワーク
20150821 Azure 仮想マシンと仮想ネットワーク
 
Azure仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワークAzure仮想マシンと仮想ネットワーク
Azure仮想マシンと仮想ネットワーク
 
もっとわかる Microsoft Azure 最新技術アップデート編 - 20150123
もっとわかる Microsoft Azure最新技術アップデート編 - 20150123もっとわかる Microsoft Azure最新技術アップデート編 - 20150123
もっとわかる Microsoft Azure 最新技術アップデート編 - 20150123
 
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
Cloudera World Tokyo 2014 LTセッション「マイクロソフトとHadoop」
 
20140818 オープン白熱塾 ksasakims
20140818 オープン白熱塾 ksasakims20140818 オープン白熱塾 ksasakims
20140818 オープン白熱塾 ksasakims
 
YAPC::Asia Tokyo 2013 ランチセッション
YAPC::Asia Tokyo 2013 ランチセッションYAPC::Asia Tokyo 2013 ランチセッション
YAPC::Asia Tokyo 2013 ランチセッション
 
Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介Windows Azure HDInsight サービスの紹介
Windows Azure HDInsight サービスの紹介
 
Effective Hyper-V - 久しぶりエディション
Effective Hyper-V - 久しぶりエディションEffective Hyper-V - 久しぶりエディション
Effective Hyper-V - 久しぶりエディション
 
HPC Azure TOP500 2012-11
HPC Azure TOP500 2012-11HPC Azure TOP500 2012-11
HPC Azure TOP500 2012-11
 
WDD2012_SC-004
WDD2012_SC-004WDD2012_SC-004
WDD2012_SC-004
 
TechEd2010_T2-401_EffectiveHyper-V
TechEd2010_T2-401_EffectiveHyper-VTechEd2010_T2-401_EffectiveHyper-V
TechEd2010_T2-401_EffectiveHyper-V
 
TechEd2009_T1-402_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-VTechEd2009_T1-402_EffectiveHyper-V
TechEd2009_T1-402_EffectiveHyper-V
 
TechEd2008_T1-407_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-VTechEd2008_T1-407_EffectiveHyper-V
TechEd2008_T1-407_EffectiveHyper-V
 

Dernier

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 

Dernier (10)

LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 

GTC18 NVIDIA News 日本版

  • 1. GTC 2017 での発表内容まとめ NEWS SILICON VALLEY MARCH 26-29, 2018 日本版 GTC 2018のエヌビディア発表内容まとめ 日本版 v2.2 GTC 2018 はカリフォルニア州のサンノゼ コンベンションセンターで3月26日から29日の4日間にわたって開催 され、過去最大となる 7700 人の開発者、研究者、メディア関係者等が 65 カ国以上から参加しました。 全体で 600 以上のテクニカルセッション、60 種類に及ぶハンズオンラボが実施され、展示会場には150 以 上のブースが並んで各社が最新の技術を披露しました。 日本では、GTC Japan 2018 を9月13日-14日の2日間、グランドプリンスホテル新高輪にて開催します。 皆様の参加をお待ちしております。詳しくはこちら: https://www.nvidia.com/ja-jp/gtc 世界最大の GPU 技術イベント GTC 2018 が大盛況のうちに閉幕 Tesla V100 32GB 版 ディープラーニングのモデルは年々その複雑さを増しており、GPU にはより大きなメモリが求められています。 今回、Tesla V100 に今までの 2 倍となる 32GB の HBM2 メモリを搭載した新モデルを発表しました。 5,120 個の CUDA コアと 640 個の Tensor コアによる演算性能や 900GB/s のメモリバンド幅、消費電 力等は現行の 16GB モデルと同一です。 Tesla V100 の詳細はこちら: https://www.nvidia.com/en-us/data-center/tesla-v100 なお、昨年 Tesla P100 を 1024 基備えるスーパーコンピューター「MN-1」で、ImageNet データセットを15 分で学習するという記録を達成した Preferred Networks 様より、この Tesla V100 32GB 版を 512 基 搭載した「MN-1b」の構築が発表されました。 MN-1b に関してはこちら: https://www.preferred-networks.jp/ja/news/pr20180328 TESLA V100 (SXM2) TESLA V100 (PCIe) NVIDIA DGX-2 - Tesla V100 を 16 基搭載する GPU スーパーコンピューター 2016 年の GTC で最初の DGX-1 を発表してから2年弱。128 ノードクラスタの 「DGX SATURNV」が GREEN 500 の首位を獲得したり、日本の理化学研究所にも 54 ノードの大規模 DGX-1 クラスタが導入されるなど、大きな成果が生まれています。 今回、AI 研究を新たな段階ヘ進める力となるべく、NVIDIA DGX-2 を発表しました。 DGX-2 は 32GB 版の Tesla V100 を単一筐体内に 16 基(!)搭載。Tensor コアによ る FP16, FP32 混合精度演算性能は 2 ペタフロップスに達します。 詳しくはこちら: https://www.nvidia.com/en-us/data-center/dgx-2/ NVSwitch インターコネクト DGX-2 の大きな特徴は、16基の GPU を「NVSwitch」という新しいインターコネクトで接続している ことです。これは 2.4TB/s のバイセクションバンド幅を持ち、つまり8組の Tesla V100 がそれぞれ 同時に 300GB/s で通信できることになります。 詳しくはこちら: https://www.nvidia.com/en-us/data-center/nvlink/ 仮想化に対応 DGX-2 は最新の Xeon Platinum CPU を2基と 1.5TB のシステムメモリを備える大型サーバーであり、 複数の利用者が各自の環境を柔軟に作り出せる プライベートクラウドの基盤にも最適です。 KVM による仮想化に対応し、VM から GPU 及び NVSwitch へ完全にアクセス可能です。 ノード間接続も高速 DGX-2 はシングルノードでも極めて高い性能を発 揮しますが、8 本の EDR InfiniBand、100GbE、 ROCE といった多様な低遅延・広帯域 ノード間接続をサポートします。 Quadro GV100 Volta 世代初の Quadro 製品となる Quadro GV100 を発表しました。Tesla V100 及び TITAN V と同じ GV100 チップを搭載する製品です。前世代の Quadro GP100 と同様に NVLink のコネクタを備え、これに よって2基の Quadro GV100 を接続できます。2個の NVLink ブリッジにより、GV100 間の帯域は双方向で 200 GB/s となり、最大8枚のディスプレイを同期することが可能です。この高い性能により、Quadro GV100 は先日の GDC 2018 で発表された「NVIDIA RTX」によるリアルタイム レイ トレーシングにも対応します。 そして Quadro GV100 は単に「高性能なプロフェッショナル向けグラフィクスカード」ではありません。 Tesla V100 譲りの演算性能 (倍精度: 7.4、単精度: 14.8、Tensor コアを使った混合精度演算では 118.5 TFLOPS) は、HPC や AI 向けのアクセラレータとして極めて強力なもので、「HPCも、AIも、グラフィック スもこなせる最強のワークステーション GPU」が Quadro GV100 なのです。 詳しくはこちら: https://blogs.nvidia.com/blog/2018/03/27/quadro-gv100-deep-learning-simulation/ Quadro GV100
  • 2. Facebook: https://www.facebook.com/NVIDIAAI.JP Twitter: @NVIDIAAIJP / @NVIDIAJapan ハッシュタグ: #GTC18 NVIDIA GPU Cloud の拡大 自動運転のためのハードウェア及びソフトウェア群である「NVIDIA DRIVE」に関しても多くの発表がありました。 最も重要なのは走行テストを仮想空間で効率的に行うための DRIVE Sim 及び DRIVE Constellation です。 自動運転車の開発には、様々な道路状況で繰り返しテストを重ねることが不可欠ですが、実走のみで全てのテストを 行うことは、時間やコストの面から限界があります。DRIVE Sim は、GPU によって走行環境を作り出すシミュレーターで、 晴天、雨、吹雪といった気象状況、逆光や夜間走行による視界の変化などを自在に生成できます。実走では危険を 伴う状況も、DRIVE Sim では安全に何度でも再現することができるのです。 DRIVE Constellation は DRIVE Sim を使ったシミュレーションをデータセンターで効率的に繰り返すためのプラット フォームで、二つのサーバーからなります。片方は DRIVE Sim が作動するシミュレータ、もう一方では車載コンピュー ターの DRIVE Pegasus が動作し、DRIVE Sim によって生成された走行状況を「本当に走っているつもりで」処理しま す。その結果は DRIVE Sim 側にフィードバックされ、次の状況生成に反映されます。このフィードバックループは毎秒 30 回という頻度で回り続け、DRIVE Pegasus で動作するソフトウェアの動作検証に役立てられます。 また、ハードウェア面では次世代の SoC である Orin が発表されました。 DRIVE Pegasus には Xavier SoC が2基に 加えて2基の外部 GPU を持ちますが、 Orin は2基の SoC のみで Pegasus に匹敵する性能を持つ予定です。 自動運転車の効率的な走行シミュレーション - DRIVE SIM、DRIVE CONSTELLATION 最新情報を日本で - NVIDIA Deep Learning Seminar 2018 を4月24日に開催 GTC 2018 で発表される数多くの最新情報は、とてもこの1枚では伝えきれません。そこで、基調講演の内容のみならず、数多くのテクニカルセッションや ポスターで発表される研究成果や事例を厳選し、日本の皆様にお伝えするイベント「NVIDIA Deep Learning Seminar 2018」を4月24日に開催し ます。エヌビディア及び協賛各社の展示ブースも多数設置予定です。皆様の参加をお待ちしております。 Deep Learning Seminar 2018 への登録はこちら: http://eventregist.com/e/NVDLS2018 NVIDIA GPU Cloud (NGC) は HPC アプリケーションやディープラーニング フレームワークを Docker イメージで提供するクラウドサービスで、Pascal 世代以降の GPU があれば、PC、ワークステーション、クラウドなど様々な 環境で利用可能です。 今回、正式サポート対象のクラウドプラットフォームに AliCloud、Google Cloud Platform、Oracle Cloud が追加されました。 また、NGC レジストリに、可視化ツールの NVIDIA Index や VMD、そして GPU 対応データベースの Kinetica などが追加され、およそ 30 種類のア プリケーションが揃いました。ぜひご利用ください。 NGC への登録(無料)はこちら: http://www.nvidia.com/ngcsignup 推論最適化エンジンである TensorRT 4 に多くの機能追加がありました。 • TensorFlow 1.7に、TensorRT を統合。ResNet 50の推論ベンチ マークテストで8倍の高速化を実現。 • ONNX のサポート: Pytorch, Caffe 2, CNTK, MXNet, Chainer と の相互運用性を改善。 • カスタムネットワークの高速化: Tesla V100 の Tensor コアを使った 推論をサポート。 • Xavierのサポート: NVIDIA DRIVEに代表される Xavier ベースのプ ラットフォームへの最適化。 詳細: https://devblogs.nvidia.com/tensorrt-integration-speeds-tensorflow-inference/ コンテナオーケストレーションツールとして事実上の標準となっている Kubernetes 上での GPU アプリケーション実行をサポートするためにコミュ ニティに貢献していきます。ポイントは以下の通りです: • NVIDIA Device Plugin による GPU サポート。 • 様々な GPU クラスタへのアプリケーションの容易なデプロイを可能に。 • GPU 共有による使用率の最大化。 • NVML や DCGM といった管理ツールによる Kubernetes 上の GPU の監視・メトリック取得の実現 詳細: https://developer.nvidia.com/container-runtime-and-orchestrators 仮想 GPU (GRIDテクノロジ) に関して次の発表がありました。 • Quadro vDWS が Tesla V100 をサポート。 • GRID vPC が複数の 4K モニタや Linux OS をサポート。 • GPU VM のライブ マイグレーションをサポートするなど、運用管理機能 の改善 Tesla V100 等の最新 GPU をサポートすることで、Quadro vDWS は Ansys Discovery Live のような複雑なリアルタイムシミュレーションや、 ディープラーニングワークロードを含め、設計プロセスの全てをカバーする ワークステーションになります。 詳細: https://blogs.nvidia.com/blog/2018/03/27/live-gpu-migration-virtualization/ オールフラッシュストレージ製品のリーディングベンダーであるピュア・ストレー ジは、高性能並列ストレージ製品 FlashBlade と NVIDIA DGX-1 を組 み合わせた AI アプライアンス “AIRI” - AI-Ready Infrastructure を発 表しました。AIRI はエヌビディアとピュア・ストレージが共同で策定したリファ レンスアーキテクチャに基づいており、極めて大量のデータを元にしたディー プラーニングのワークフローにおいても、ストレージがネックとなることなく、 DGX-1 の性能を最大限に発揮できる構成になっています。 GTC の ピュア・ストレージ ブースでは、4台の DGX-1 と FlashBlade が 統合された AIRI の実機が展示されました。 詳細: https://blogs.nvidia.co.jp/2018/04/05/pure-storage-airi-nvidia-dgx/ 詳細: https://nvidianews.nvidia.com/news/nvidia-introduces-drive-constellation-simulation-system-to-safely-drive-autonomous-vehicles-billions-of-miles-in-virtual-reality DGX-1 と Pure Storage FlashBladeVirtual GPU March 2018 Release TensorRT 4 の新機能 Kubernetes on NVIDIA GPU この資料: bit.ly/nvnewsgtc18 NVIDIA Isaac SDK は AI ロボットを開発・展開するためのドライバ、ライブ ラリ、及びツール群です。ロボット開発に必須の認識・ナビゲーション・操作 といった機能だけでなく、通信とデータ管理のフレームワークを提供します。 また、SDK には Isaac Sim というシミュレーターも含まれます。これはロボッ トを実環境に展開する前に、現実世界を再現した仮想環境内で学習と テストを繰り返し、動作精度を効率的に高めるためのものです。 Isaac SDK を利用することで、実機のみで開発・テストを行う場合と比べ て何百時間もの労力を削減でき、次世代の AI ロボットを迅速に市場へ 投入できるようになるでしょう。 詳細: https://developer.nvidia.com/isaac-sdk Isaac SDK