SlideShare une entreprise Scribd logo
1  sur  19
IDC Frontier Inc. All rights reserved.
激アツ!
GPUパワーとインフラの戦い
株式会社IDCフロンティア
菊石 謙介
2017年6月13日
2
IDC Frontier Inc. All rights reserved.
GPUのインフラ運用は結構大変!
3
IDC Frontier Inc. All rights reserved.
株式会社IDCフロンティア
菊石 謙介
技術開発本部 インフラ開発部 部長
2010年から約6年にわたりクラウドサービスのインフラを担当
製品選定・導入を実施。今も継続中。
直近ではIDCFクラウド GPU Boost typeを企画・導入
4
IDC Frontier Inc. All rights reserved.
IDCフロンティア
Yahoo! JAPANグループで
主にデータセンターや
IDCFクラウドや
プライベートクラウドなど
ITインフラの提供を行って
おります
【データセンター】
国内9拠点のデータセンター群
【クラウド IaaS】
東日本リージョン/西日本リージョン
5
IDC Frontier Inc. All rights reserved.
白河データセンター
IDCフロンティアの大規模データセンター
北九州データセンター
白河データセンター
サーバ収容キャパシティ約25万台の規模で全国展開
6
IDC Frontier Inc. All rights reserved.
データセンター内
ラックの収容設計は?
IDCF公式
7
IDC Frontier Inc. All rights reserved.
IDCFのラック標準性能
CPUのみのサーバ向けが標準性能
■規格 : 19inchラック
■サイズ:
W600×D1200×H2300(mm)
■ユニット数 : 49U or 50U
■空調性能 8kW
■搭載質量 : 800kg
8
IDC Frontier Inc. All rights reserved.
GPUサーバを搭載すると
空調性能(8kW)がボトルネック
DGX1だと4台搭載できるかどうか
12Uしか使えない
37Uがデッドスペース
49Uラック
NVIDIA DGX1
Tesla P100 x 8
250w x 8 =2kW
9
IDC Frontier Inc. All rights reserved.
IDCFでは
通常のCPUクラウドサーバとGPUクラウドサーバ
を混載することでスペースを有効活用
GPUサーバ 16U(2Ux8台)
CPUサーバ 16U(1Ux16台)
NWスイッチ 7U
GPUの熱を逃がすためにラックの上部に設置するとかも考慮してたりします。。
10
IDC Frontier Inc. All rights reserved.
でも理想は、、、
ラック全部を
GPUで埋めたい!!
(36kW/ラック)
11
IDC Frontier Inc. All rights reserved.
空
調
空
調
GPU
局所空調での検証実験中
シミュレーション上は
45kW~50kWまで冷却可能
今後データセンター全体の設計に反映させていく必要あり
12
IDC Frontier Inc. All rights reserved.
GPUサーバの排気が
DCのエアフローに影響?
13
IDC Frontier Inc. All rights reserved.
ラックA ラックB
A吸気 B吸気A排気 B排気
ホット コールドコールド
通常のエアフロー
Cold Aisle Cold AisleCold Aisle
Cold Aisle Cold AisleCold Aisle
Hot AisleHot Aisle
Hot AisleHot Aisle
Hot Chamber
Chimney ChimneyChimney
Machine room Machine room Machine room
排気
排気排気
白河データセンターのエアフロー設計
14
IDC Frontier Inc. All rights reserved.
GPU搭載サーバのファン性能
サーバ搭載用のTESLAシリーズは
サーバ内のファンで吸気し
GPU自体を冷やす設計
回転数 16,500 RPM
X6 個
回転数 20,500 RPM
x6 個
GPU搭載時は回転数の高いファンに
交換する必要がある
15
IDC Frontier Inc. All rights reserved.
ラックA ラックB
A吸気 B吸気A排気 B排気
ホット コールドコールド
A吸気 B吸気A排気 B排気
ホット コールドコールド
GPUサーバ SW
サーバ
通常のエアフロー
現在のエアフロー
①ラックAのGPUサーバの排気風量が強いため、ホットアイルを横断してラックBの排気面まで侵
入ラックBにあるサーバの排気がラックAのGPUサーバの排気風量に負けて逆流
②ラックBのスイッチやケーブル配線スペースの隙間から逆流した暖気をラックBのサーバが吸気
③熱い空気を吸って内部センサーで温度異常検知。サーバー停止にいたる
→様々な方法を検討し、エアフローを制御
16
IDC Frontier Inc. All rights reserved.
もはやラック内だけで対策は不可能
データセンター全体を
コントロールしなければ
17
IDC Frontier Inc. All rights reserved.
GPUインフラで悩む前に
IDCフロンティアにご相談ください
18
IDC Frontier Inc. All rights reserved.
19
IDC Frontier Inc. All rights reserved.
ご静聴ありがとうございました。
IDCフロンティアを今後ともよろしくお願い致します。

Contenu connexe

Tendances

実話!実はIDCFクラウドって◯◯なんです
 実話!実はIDCFクラウドって◯◯なんです 実話!実はIDCFクラウドって◯◯なんです
実話!実はIDCFクラウドって◯◯なんですIDC Frontier
 
転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい
転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい
転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがいIDC Frontier
 
Aerospike on IDCF Cloud
Aerospike on IDCF CloudAerospike on IDCF Cloud
Aerospike on IDCF CloudIDC Frontier
 
Vagrantでクラウド上にdocker環境を作る
Vagrantでクラウド上にdocker環境を作るVagrantでクラウド上にdocker環境を作る
Vagrantでクラウド上にdocker環境を作るIDC Frontier
 
次世代のIT技術を支える、高度なファシリティ
次世代のIT技術を支える、高度なファシリティ次世代のIT技術を支える、高度なファシリティ
次世代のIT技術を支える、高度なファシリティIDC Frontier
 
201310 ITproEXPO_clouddaystokyo2013fall_idcf
201310 ITproEXPO_clouddaystokyo2013fall_idcf201310 ITproEXPO_clouddaystokyo2013fall_idcf
201310 ITproEXPO_clouddaystokyo2013fall_idcfIDC Frontier
 
サバフェス上位入賞者にみる ioMemory×MySQL 最新チューニング教えます
サバフェス上位入賞者にみる ioMemory×MySQL  最新チューニング教えますサバフェス上位入賞者にみる ioMemory×MySQL  最新チューニング教えます
サバフェス上位入賞者にみる ioMemory×MySQL 最新チューニング教えますIDC Frontier
 
クラウドサービスの活用〜IDCFクラウド〜
クラウドサービスの活用〜IDCFクラウド〜クラウドサービスの活用〜IDCFクラウド〜
クラウドサービスの活用〜IDCFクラウド〜IDC Frontier
 
サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順IDC Frontier
 
IDCFクラウド MeetUp2 LT
IDCFクラウド MeetUp2 LTIDCFクラウド MeetUp2 LT
IDCFクラウド MeetUp2 LTFujishiro Takuya
 
Rancherなら簡単にできる マルチクラウドコンテナー
Rancherなら簡単にできる マルチクラウドコンテナーRancherなら簡単にできる マルチクラウドコンテナー
Rancherなら簡単にできる マルチクラウドコンテナーIDC Frontier
 
MPLS_JAPAN_2013_IDCF
MPLS_JAPAN_2013_IDCFMPLS_JAPAN_2013_IDCF
MPLS_JAPAN_2013_IDCFIDC Frontier
 
サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順IDC Frontier
 
ATS対策- IDCフロンティア
ATS対策- IDCフロンティアATS対策- IDCフロンティア
ATS対策- IDCフロンティアIDC Frontier
 
[SDN JAPAN 2013] IaaS事業者が考える真のSDN
[SDN JAPAN 2013] IaaS事業者が考える真のSDN[SDN JAPAN 2013] IaaS事業者が考える真のSDN
[SDN JAPAN 2013] IaaS事業者が考える真のSDNIDC Frontier
 
SCALR OSS版のインストール手順のご紹介 20131204 01
SCALR OSS版のインストール手順のご紹介 20131204 01SCALR OSS版のインストール手順のご紹介 20131204 01
SCALR OSS版のインストール手順のご紹介 20131204 01Haruhiko KAJIKAWA
 
VYATTA USERS MEETING Autumn 2013_idcf
VYATTA USERS MEETING Autumn 2013_idcfVYATTA USERS MEETING Autumn 2013_idcf
VYATTA USERS MEETING Autumn 2013_idcfIDC Frontier
 
あなたの知らないとっても恐ろしいDDoSサイバー攻撃
あなたの知らないとっても恐ろしいDDoSサイバー攻撃あなたの知らないとっても恐ろしいDDoSサイバー攻撃
あなたの知らないとっても恐ろしいDDoSサイバー攻撃NihonRadware
 
DaiNishino_SDN-conference-2014_TB-07_2012-02-18
DaiNishino_SDN-conference-2014_TB-07_2012-02-18DaiNishino_SDN-conference-2014_TB-07_2012-02-18
DaiNishino_SDN-conference-2014_TB-07_2012-02-18Dai Nishino
 
実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方Fujishiro Takuya
 

Tendances (20)

実話!実はIDCFクラウドって◯◯なんです
 実話!実はIDCFクラウドって◯◯なんです 実話!実はIDCFクラウドって◯◯なんです
実話!実はIDCFクラウドって◯◯なんです
 
転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい
転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい
転職したてのエンジニアが見た 国産クラウド開発現場の苦労とやりがい
 
Aerospike on IDCF Cloud
Aerospike on IDCF CloudAerospike on IDCF Cloud
Aerospike on IDCF Cloud
 
Vagrantでクラウド上にdocker環境を作る
Vagrantでクラウド上にdocker環境を作るVagrantでクラウド上にdocker環境を作る
Vagrantでクラウド上にdocker環境を作る
 
次世代のIT技術を支える、高度なファシリティ
次世代のIT技術を支える、高度なファシリティ次世代のIT技術を支える、高度なファシリティ
次世代のIT技術を支える、高度なファシリティ
 
201310 ITproEXPO_clouddaystokyo2013fall_idcf
201310 ITproEXPO_clouddaystokyo2013fall_idcf201310 ITproEXPO_clouddaystokyo2013fall_idcf
201310 ITproEXPO_clouddaystokyo2013fall_idcf
 
サバフェス上位入賞者にみる ioMemory×MySQL 最新チューニング教えます
サバフェス上位入賞者にみる ioMemory×MySQL  最新チューニング教えますサバフェス上位入賞者にみる ioMemory×MySQL  最新チューニング教えます
サバフェス上位入賞者にみる ioMemory×MySQL 最新チューニング教えます
 
クラウドサービスの活用〜IDCFクラウド〜
クラウドサービスの活用〜IDCFクラウド〜クラウドサービスの活用〜IDCFクラウド〜
クラウドサービスの活用〜IDCFクラウド〜
 
サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順
 
IDCFクラウド MeetUp2 LT
IDCFクラウド MeetUp2 LTIDCFクラウド MeetUp2 LT
IDCFクラウド MeetUp2 LT
 
Rancherなら簡単にできる マルチクラウドコンテナー
Rancherなら簡単にできる マルチクラウドコンテナーRancherなら簡単にできる マルチクラウドコンテナー
Rancherなら簡単にできる マルチクラウドコンテナー
 
MPLS_JAPAN_2013_IDCF
MPLS_JAPAN_2013_IDCFMPLS_JAPAN_2013_IDCF
MPLS_JAPAN_2013_IDCF
 
サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順サーバー初心者のためのWordPressサイト構築手順
サーバー初心者のためのWordPressサイト構築手順
 
ATS対策- IDCフロンティア
ATS対策- IDCフロンティアATS対策- IDCフロンティア
ATS対策- IDCフロンティア
 
[SDN JAPAN 2013] IaaS事業者が考える真のSDN
[SDN JAPAN 2013] IaaS事業者が考える真のSDN[SDN JAPAN 2013] IaaS事業者が考える真のSDN
[SDN JAPAN 2013] IaaS事業者が考える真のSDN
 
SCALR OSS版のインストール手順のご紹介 20131204 01
SCALR OSS版のインストール手順のご紹介 20131204 01SCALR OSS版のインストール手順のご紹介 20131204 01
SCALR OSS版のインストール手順のご紹介 20131204 01
 
VYATTA USERS MEETING Autumn 2013_idcf
VYATTA USERS MEETING Autumn 2013_idcfVYATTA USERS MEETING Autumn 2013_idcf
VYATTA USERS MEETING Autumn 2013_idcf
 
あなたの知らないとっても恐ろしいDDoSサイバー攻撃
あなたの知らないとっても恐ろしいDDoSサイバー攻撃あなたの知らないとっても恐ろしいDDoSサイバー攻撃
あなたの知らないとっても恐ろしいDDoSサイバー攻撃
 
DaiNishino_SDN-conference-2014_TB-07_2012-02-18
DaiNishino_SDN-conference-2014_TB-07_2012-02-18DaiNishino_SDN-conference-2014_TB-07_2012-02-18
DaiNishino_SDN-conference-2014_TB-07_2012-02-18
 
実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方実践!DBベンチマークツールの使い方
実践!DBベンチマークツールの使い方
 

En vedette

オイシックス事例発表・顧客属性推定とレコメンド
オイシックス事例発表・顧客属性推定とレコメンドオイシックス事例発表・顧客属性推定とレコメンド
オイシックス事例発表・顧客属性推定とレコメンドKeisho Suzuki
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Hideto Masuoka
 
Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱Junya Kamura
 
HPCとAIをつなぐGPUクラウド
HPCとAIをつなぐGPUクラウドHPCとAIをつなぐGPUクラウド
HPCとAIをつなぐGPUクラウドHPC Systems Inc.
 
GTC 2017 さらに発展する AI 革命
GTC 2017 さらに発展する AI 革命GTC 2017 さらに発展する AI 革命
GTC 2017 さらに発展する AI 革命NVIDIA Japan
 
次世代の AI とディープラーニング GTC 2017
次世代の AI とディープラーニング GTC 2017次世代の AI とディープラーニング GTC 2017
次世代の AI とディープラーニング GTC 2017NVIDIA Japan
 
GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介NVIDIA Japan
 
NVIDIA GPU 技術最新情報
NVIDIA GPU 技術最新情報NVIDIA GPU 技術最新情報
NVIDIA GPU 技術最新情報IDC Frontier
 
Icml読み会 deep speech2
Icml読み会 deep speech2Icml読み会 deep speech2
Icml読み会 deep speech2Jiro Nishitoba
 
Estimating structured vector autoregressive models
Estimating structured vector autoregressive modelsEstimating structured vector autoregressive models
Estimating structured vector autoregressive modelsAkira Tanimoto
 
Dropout Distillation
Dropout DistillationDropout Distillation
Dropout DistillationShotaro Sano
 
Meta-Learning with Memory Augmented Neural Network
Meta-Learning with Memory Augmented Neural NetworkMeta-Learning with Memory Augmented Neural Network
Meta-Learning with Memory Augmented Neural NetworkYusuke Watanabe
 
加速するデータドリブンコミュニケーション
加速するデータドリブンコミュニケーション加速するデータドリブンコミュニケーション
加速するデータドリブンコミュニケーションKeisuke Anzai
 
Learning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for GraphsLearning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for GraphsTakuya Akiba
 
ICML2016読み会 概要紹介
ICML2016読み会 概要紹介ICML2016読み会 概要紹介
ICML2016読み会 概要紹介Kohei Hayashi
 
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural NetworksSeiya Tokui
 

En vedette (17)

オイシックス事例発表・顧客属性推定とレコメンド
オイシックス事例発表・顧客属性推定とレコメンドオイシックス事例発表・顧客属性推定とレコメンド
オイシックス事例発表・顧客属性推定とレコメンド
 
Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史Chainerで知るdeep learning進化の歴史
Chainerで知るdeep learning進化の歴史
 
Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱Deep learningの世界に飛び込む前の命綱
Deep learningの世界に飛び込む前の命綱
 
HPCとAIをつなぐGPUクラウド
HPCとAIをつなぐGPUクラウドHPCとAIをつなぐGPUクラウド
HPCとAIをつなぐGPUクラウド
 
GTC 2017 さらに発展する AI 革命
GTC 2017 さらに発展する AI 革命GTC 2017 さらに発展する AI 革命
GTC 2017 さらに発展する AI 革命
 
GTC17 NVIDIA News
GTC17 NVIDIA NewsGTC17 NVIDIA News
GTC17 NVIDIA News
 
次世代の AI とディープラーニング GTC 2017
次世代の AI とディープラーニング GTC 2017次世代の AI とディープラーニング GTC 2017
次世代の AI とディープラーニング GTC 2017
 
GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介GTC 2017 基調講演からディープラーニング関連情報のご紹介
GTC 2017 基調講演からディープラーニング関連情報のご紹介
 
NVIDIA GPU 技術最新情報
NVIDIA GPU 技術最新情報NVIDIA GPU 技術最新情報
NVIDIA GPU 技術最新情報
 
Icml読み会 deep speech2
Icml読み会 deep speech2Icml読み会 deep speech2
Icml読み会 deep speech2
 
Estimating structured vector autoregressive models
Estimating structured vector autoregressive modelsEstimating structured vector autoregressive models
Estimating structured vector autoregressive models
 
Dropout Distillation
Dropout DistillationDropout Distillation
Dropout Distillation
 
Meta-Learning with Memory Augmented Neural Network
Meta-Learning with Memory Augmented Neural NetworkMeta-Learning with Memory Augmented Neural Network
Meta-Learning with Memory Augmented Neural Network
 
加速するデータドリブンコミュニケーション
加速するデータドリブンコミュニケーション加速するデータドリブンコミュニケーション
加速するデータドリブンコミュニケーション
 
Learning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for GraphsLearning Convolutional Neural Networks for Graphs
Learning Convolutional Neural Networks for Graphs
 
ICML2016読み会 概要紹介
ICML2016読み会 概要紹介ICML2016読み会 概要紹介
ICML2016読み会 概要紹介
 
論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks論文紹介 Pixel Recurrent Neural Networks
論文紹介 Pixel Recurrent Neural Networks
 

Similaire à 激アツ!GPUパワーとインフラの戦い

Open hackday3 idcf_cloud
Open hackday3 idcf_cloudOpen hackday3 idcf_cloud
Open hackday3 idcf_cloudMakoto Oya
 
IDCFクラウドセミナー RDB活用
IDCFクラウドセミナー RDB活用IDCFクラウドセミナー RDB活用
IDCFクラウドセミナー RDB活用IDC Frontier
 
オートスケールアップ Powered by Mackerel
オートスケールアップ Powered by Mackerelオートスケールアップ Powered by Mackerel
オートスケールアップ Powered by MackerelFujishiro Takuya
 
Loves Baremetal-servers, Loves POWER
Loves Baremetal-servers, Loves POWERLoves Baremetal-servers, Loves POWER
Loves Baremetal-servers, Loves POWERFujishiro Takuya
 
ベアメタルサーバー/オンプレミスと実現するハイブリッドクラウド
ベアメタルサーバー/オンプレミスと実現するハイブリッドクラウドベアメタルサーバー/オンプレミスと実現するハイブリッドクラウド
ベアメタルサーバー/オンプレミスと実現するハイブリッドクラウドFujishiro Takuya
 
Node RED で実現する製造業の DX
Node RED で実現する製造業の DXNode RED で実現する製造業の DX
Node RED で実現する製造業の DX雅治 新澤
 
20200807 Aidemy Meetup
20200807 Aidemy Meetup20200807 Aidemy Meetup
20200807 Aidemy MeetupAkihiro ITO
 
サバフェス2016まとめLT
サバフェス2016まとめLTサバフェス2016まとめLT
サバフェス2016まとめLTsvfes
 
20180817 azure antenna_iot central hands-on
20180817 azure antenna_iot central hands-on20180817 azure antenna_iot central hands-on
20180817 azure antenna_iot central hands-onMinoru Naito
 
はじめてのIT 勉強会@仙台 宣伝枠LT
はじめてのIT 勉強会@仙台 宣伝枠LTはじめてのIT 勉強会@仙台 宣伝枠LT
はじめてのIT 勉強会@仙台 宣伝枠LTCData Software Japan
 
NVIDIA Jetson導入事例ご紹介
NVIDIA Jetson導入事例ご紹介NVIDIA Jetson導入事例ご紹介
NVIDIA Jetson導入事例ご紹介NVIDIA Japan
 
僕はまだ10%しかIDCFクラウドを理解していなかった
僕はまだ10%しかIDCFクラウドを理解していなかった僕はまだ10%しかIDCFクラウドを理解していなかった
僕はまだ10%しかIDCFクラウドを理解していなかったFujishiro Takuya
 
Joug(Oktaユーザーグループ)登壇資料
Joug(Oktaユーザーグループ)登壇資料Joug(Oktaユーザーグループ)登壇資料
Joug(Oktaユーザーグループ)登壇資料ssuserdf544a
 
Rancher ではじめる マルチクラウドコンテナー
Rancher ではじめる マルチクラウドコンテナーRancher ではじめる マルチクラウドコンテナー
Rancher ではじめる マルチクラウドコンテナーFujishiro Takuya
 
Drupalによる大規模サイトの設計・実装 において何に気をつけるべきか
Drupalによる大規模サイトの設計・実装において何に気をつけるべきかDrupalによる大規模サイトの設計・実装において何に気をつけるべきか
Drupalによる大規模サイトの設計・実装 において何に気をつけるべきかdgcircus
 
大規模Redisサーバ縮小化の戦い
大規模Redisサーバ縮小化の戦い大規模Redisサーバ縮小化の戦い
大規模Redisサーバ縮小化の戦いYuto Komai
 
国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービスKajiBook
 

Similaire à 激アツ!GPUパワーとインフラの戦い (20)

Open hackday3 idcf_cloud
Open hackday3 idcf_cloudOpen hackday3 idcf_cloud
Open hackday3 idcf_cloud
 
IDCFクラウドセミナー RDB活用
IDCFクラウドセミナー RDB活用IDCFクラウドセミナー RDB活用
IDCFクラウドセミナー RDB活用
 
オートスケールアップ Powered by Mackerel
オートスケールアップ Powered by Mackerelオートスケールアップ Powered by Mackerel
オートスケールアップ Powered by Mackerel
 
Loves Baremetal-servers, Loves POWER
Loves Baremetal-servers, Loves POWERLoves Baremetal-servers, Loves POWER
Loves Baremetal-servers, Loves POWER
 
ベアメタルサーバー/オンプレミスと実現するハイブリッドクラウド
ベアメタルサーバー/オンプレミスと実現するハイブリッドクラウドベアメタルサーバー/オンプレミスと実現するハイブリッドクラウド
ベアメタルサーバー/オンプレミスと実現するハイブリッドクラウド
 
20180319 ccon sync kintone
20180319 ccon sync kintone20180319 ccon sync kintone
20180319 ccon sync kintone
 
Node RED で実現する製造業の DX
Node RED で実現する製造業の DXNode RED で実現する製造業の DX
Node RED で実現する製造業の DX
 
20200807 Aidemy Meetup
20200807 Aidemy Meetup20200807 Aidemy Meetup
20200807 Aidemy Meetup
 
サバフェス2016まとめLT
サバフェス2016まとめLTサバフェス2016まとめLT
サバフェス2016まとめLT
 
20180817 azure antenna_iot central hands-on
20180817 azure antenna_iot central hands-on20180817 azure antenna_iot central hands-on
20180817 azure antenna_iot central hands-on
 
VIOPS10: クラウドのつぎに起こるコト
VIOPS10: クラウドのつぎに起こるコトVIOPS10: クラウドのつぎに起こるコト
VIOPS10: クラウドのつぎに起こるコト
 
はじめてのIT 勉強会@仙台 宣伝枠LT
はじめてのIT 勉強会@仙台 宣伝枠LTはじめてのIT 勉強会@仙台 宣伝枠LT
はじめてのIT 勉強会@仙台 宣伝枠LT
 
hbstudy37 slide
hbstudy37 slidehbstudy37 slide
hbstudy37 slide
 
NVIDIA Jetson導入事例ご紹介
NVIDIA Jetson導入事例ご紹介NVIDIA Jetson導入事例ご紹介
NVIDIA Jetson導入事例ご紹介
 
僕はまだ10%しかIDCFクラウドを理解していなかった
僕はまだ10%しかIDCFクラウドを理解していなかった僕はまだ10%しかIDCFクラウドを理解していなかった
僕はまだ10%しかIDCFクラウドを理解していなかった
 
Joug(Oktaユーザーグループ)登壇資料
Joug(Oktaユーザーグループ)登壇資料Joug(Oktaユーザーグループ)登壇資料
Joug(Oktaユーザーグループ)登壇資料
 
Rancher ではじめる マルチクラウドコンテナー
Rancher ではじめる マルチクラウドコンテナーRancher ではじめる マルチクラウドコンテナー
Rancher ではじめる マルチクラウドコンテナー
 
Drupalによる大規模サイトの設計・実装 において何に気をつけるべきか
Drupalによる大規模サイトの設計・実装において何に気をつけるべきかDrupalによる大規模サイトの設計・実装において何に気をつけるべきか
Drupalによる大規模サイトの設計・実装 において何に気をつけるべきか
 
大規模Redisサーバ縮小化の戦い
大規模Redisサーバ縮小化の戦い大規模Redisサーバ縮小化の戦い
大規模Redisサーバ縮小化の戦い
 
国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス国内初Cloud stack採用のオープンクラウドサービス
国内初Cloud stack採用のオープンクラウドサービス
 

激アツ!GPUパワーとインフラの戦い

  • 1. IDC Frontier Inc. All rights reserved. 激アツ! GPUパワーとインフラの戦い 株式会社IDCフロンティア 菊石 謙介 2017年6月13日
  • 2. 2 IDC Frontier Inc. All rights reserved. GPUのインフラ運用は結構大変!
  • 3. 3 IDC Frontier Inc. All rights reserved. 株式会社IDCフロンティア 菊石 謙介 技術開発本部 インフラ開発部 部長 2010年から約6年にわたりクラウドサービスのインフラを担当 製品選定・導入を実施。今も継続中。 直近ではIDCFクラウド GPU Boost typeを企画・導入
  • 4. 4 IDC Frontier Inc. All rights reserved. IDCフロンティア Yahoo! JAPANグループで 主にデータセンターや IDCFクラウドや プライベートクラウドなど ITインフラの提供を行って おります 【データセンター】 国内9拠点のデータセンター群 【クラウド IaaS】 東日本リージョン/西日本リージョン
  • 5. 5 IDC Frontier Inc. All rights reserved. 白河データセンター IDCフロンティアの大規模データセンター 北九州データセンター 白河データセンター サーバ収容キャパシティ約25万台の規模で全国展開
  • 6. 6 IDC Frontier Inc. All rights reserved. データセンター内 ラックの収容設計は? IDCF公式
  • 7. 7 IDC Frontier Inc. All rights reserved. IDCFのラック標準性能 CPUのみのサーバ向けが標準性能 ■規格 : 19inchラック ■サイズ: W600×D1200×H2300(mm) ■ユニット数 : 49U or 50U ■空調性能 8kW ■搭載質量 : 800kg
  • 8. 8 IDC Frontier Inc. All rights reserved. GPUサーバを搭載すると 空調性能(8kW)がボトルネック DGX1だと4台搭載できるかどうか 12Uしか使えない 37Uがデッドスペース 49Uラック NVIDIA DGX1 Tesla P100 x 8 250w x 8 =2kW
  • 9. 9 IDC Frontier Inc. All rights reserved. IDCFでは 通常のCPUクラウドサーバとGPUクラウドサーバ を混載することでスペースを有効活用 GPUサーバ 16U(2Ux8台) CPUサーバ 16U(1Ux16台) NWスイッチ 7U GPUの熱を逃がすためにラックの上部に設置するとかも考慮してたりします。。
  • 10. 10 IDC Frontier Inc. All rights reserved. でも理想は、、、 ラック全部を GPUで埋めたい!! (36kW/ラック)
  • 11. 11 IDC Frontier Inc. All rights reserved. 空 調 空 調 GPU 局所空調での検証実験中 シミュレーション上は 45kW~50kWまで冷却可能 今後データセンター全体の設計に反映させていく必要あり
  • 12. 12 IDC Frontier Inc. All rights reserved. GPUサーバの排気が DCのエアフローに影響?
  • 13. 13 IDC Frontier Inc. All rights reserved. ラックA ラックB A吸気 B吸気A排気 B排気 ホット コールドコールド 通常のエアフロー Cold Aisle Cold AisleCold Aisle Cold Aisle Cold AisleCold Aisle Hot AisleHot Aisle Hot AisleHot Aisle Hot Chamber Chimney ChimneyChimney Machine room Machine room Machine room 排気 排気排気 白河データセンターのエアフロー設計
  • 14. 14 IDC Frontier Inc. All rights reserved. GPU搭載サーバのファン性能 サーバ搭載用のTESLAシリーズは サーバ内のファンで吸気し GPU自体を冷やす設計 回転数 16,500 RPM X6 個 回転数 20,500 RPM x6 個 GPU搭載時は回転数の高いファンに 交換する必要がある
  • 15. 15 IDC Frontier Inc. All rights reserved. ラックA ラックB A吸気 B吸気A排気 B排気 ホット コールドコールド A吸気 B吸気A排気 B排気 ホット コールドコールド GPUサーバ SW サーバ 通常のエアフロー 現在のエアフロー ①ラックAのGPUサーバの排気風量が強いため、ホットアイルを横断してラックBの排気面まで侵 入ラックBにあるサーバの排気がラックAのGPUサーバの排気風量に負けて逆流 ②ラックBのスイッチやケーブル配線スペースの隙間から逆流した暖気をラックBのサーバが吸気 ③熱い空気を吸って内部センサーで温度異常検知。サーバー停止にいたる →様々な方法を検討し、エアフローを制御
  • 16. 16 IDC Frontier Inc. All rights reserved. もはやラック内だけで対策は不可能 データセンター全体を コントロールしなければ
  • 17. 17 IDC Frontier Inc. All rights reserved. GPUインフラで悩む前に IDCフロンティアにご相談ください
  • 18. 18 IDC Frontier Inc. All rights reserved.
  • 19. 19 IDC Frontier Inc. All rights reserved. ご静聴ありがとうございました。 IDCフロンティアを今後ともよろしくお願い致します。

Notes de l'éditeur

  1. ----- 会議メモ (16/11/06 22:31) ----- VSANで実現するオールフラッシュIDCFプライベートクラウドと題して 当社サービスにVSANを導入した過程についてお話しさせていただきます。 よろしくお願いします。
  2. ----- 会議メモ (16/11/06 22:31) ----- アジェンダはこのようなかたちで進めさせていただきます。
  3. ----- 会議メモ (16/11/06 22:31) ----- 私自身の簡単な紹介ですが 2010年のクラウドサービス立ち上げ当初からクラウドのインフラを担当しておりまして 製品選定から導入・運用まで実施してきました。 いまも同じことをやってます。
  4. ----- 会議メモ (16/11/06 22:31) ----- 当社のことをどのくらいご存知の方がいらっしゃるかわかりませんが IDCフロンティアはヤフージャパンの子会社で おもにデータセンターやクラウドサービスを中心にITインフラサービスを提供しています。 データセンターはこちらの写真にあるとおり、わりと大規模で展開しておりまして 国内9拠点に大規模なデータセンター設備を持ってサービス提供しています。 またクラウドサービスについてはこちらにあるIDCFクラウドをメインとして VMWare基盤を使って国内パブリッククラウド事業者としてがんばっております。