SlideShare une entreprise Scribd logo
1  sur  44
Télécharger pour lire hors ligne
Nutanix運用指南術
(ココだけは絶対に押さえよう!大事な情報の取り方・見方・読み解き方)
2021年6月30日
SB C&S株式会社
ICT事業本部 ICT事業戦略・技術本部
技術統括部 第3技術部2課
萩原 隆博
Version 1.0
Nutanix Meetup 2021.06
2
本ドキュメントの利用条件
本ドキュメントを利用される前に、以下の注意点をお読みいただき、
ご承諾いただいた上でご利用ください。
• 本ドキュメントの著作権はSB C&S株式会社(以下弊社)に帰属します。このため本ドキュメント全てまたは
その一部を著作権者の許可なく複製や再配布することは禁じられています。
• 本ドキュメントは利用条件や記載内容は予告なしに変更することがありますので、予めご了承ください。
• 本ドキュメントは、弊社にて把握、確認された内容を基に作成したものであり、お客さま環境や製品機能
の仕様や動作について担保・保証するものではありません。
• 本ドキュメントに記載内容は、本ドキュメント発行時点の情報であり、製品のバージョンアップ等による機
能拡張によって実際の操作手順や画面構成、機能動作等が変更される場合もございますので、予めご
了承ください。
• 本ドキュメントの利用に関し、トラブルが発生した場合、利用者又は第三者に損害が生じた場合であっ
ても、本ドキュメントは利用者の自己責任のもと利用されるものであることを鑑み、弊社は損害賠償その
他一切の責任を負いません。
5
Nutanixにおける運用
6
運用のコツ(かつ基礎)
いろいろ
気にしない
7
良くない運用術
トラフィック量やCPUのグラフを見ながら、
80%を超えたら騒ぎはじめる
ともかく何かの管理ステータスを見ておかないと
落ち着かない
スナップショットが取れているか、毎日
メール通知をしてほしい
8
Nutanix運用で見ないといけな場所
9
Nutanix運用で見ないといけな場所
10
一番大事なことは、冗長化が保たれているか?
Nutanixで稼動する各コンポーネントが、冗長化
されているが把握出来ます。
(数字の1は、耐障害性をさしている)
11
きちんと冗長化されていれば
それでOK!
12
Redundancy Factorの解説
Redundancy Factor 2
1台のノード障害までを許容。1ノード障害が発生してもNutanixクラスターは稼動し続ける
Redundancy Factor 3
2台のノード障害までを許容。2ノード障害が発生してもNutanixクラスターは稼動し続ける
13
Nutanixにおけるストレージの考え方
Nutanixのストレージは100%使ってはいけません。
3ノード構成の場合(1ノード当たり10TB利用可能)
10TB 10TB 10TB
利用できる容量は30TB
1台の障害を考慮すると20TB
(66.6666%)
14
Nutanixにおけるストレージの考え方
Nutanixのストレージは100%使ってはいけません。
4ノード構成の場合(1ノード当たり10TB利用可能)
10TB 10TB 10TB
利用できる容量は40TB
1台の障害を考慮すると30TB
(75%)
10TB
15
ざっくりと計算をしていましたが
正式なNutanixの利用できる容量の計算方法があります。
RF2 コンテナーを持つクラスターの推奨最大使用率
RF3使用するコンテナーを持つクラスターの推奨最大使用率
0.9 x(T-N1)
0.9 x(T- [N1 + N2])
T クラスターで使用可能な物理ストレージの合計容量
N1 最大のストレージ容量を持つノードのストレージ容量
N2 次に最大のストレージ容量を持つノードのストレージ容量
参考:Recommended guidelines for maximum storage utilization on a cluster
https://portal.nutanix.com/kb/1557
16
ノード数によって実質利用可能な
ストレージ容量の割合(%)が
異なる事に注意
17
AOS 5.20では、
18
AOS 5.20(LTS)では、
実質利用して良いストレージ容量が分かるように
閾値が見えるようになった
19
さらにAOS6.0からは
あらたな設定オプションが出来ました。
20
さらにAOS6.0からは
Reserve Rebuild Capacity有効
Reserve Rebuild Capacity無効
グラフ全体の表示は、クラスター全体容量が
表示されN+1の境界線が表示される
グラフ全体の表示は、N+1を考慮した容量に
最大値が変わっている
21
では、冗長化だけ見ておけばいいのか?
ハードウェアの状態とかは、大丈夫?
22
全体的な問題はNCCを活用しましょう。
23
全体的な問題はNCCを活用します
24
NCCとは
Nutanix Cluster Checkの略で、Nutanixクラスターの健全性を定期的に自動確認をおこな
てくれます。
25
NCCとは
チェックしている項目は、仮想マシン以外にもハードウェアの状態、Nutanixが提供する各種
機能動作状態、ストレージの利用状況やハイパーバイザーの設定情報(設定不備チェック)
など、多岐にわたります。
各チェックされる対象オブジェクト数と
状態が確認できる
26
NCCとは
チェック項目は、NCC2.4.1.4で、「719」項目をチェック!
27
NCCは自動で実行されます
NCCの実行間隔が設定できます。
28
NCCとAlert機能が連携して障害を通知します
29
アラートメールの設定を行いましょう
Nutanixに異常が発生したら
担当者及びクリティカルな物
は、Nutanixサポートで自動的
にCaseOpenされます。
ここに通知先のメールアドレスを設定 ※自動的にCaseOpenされるアラートは
KB:1959に記載されています。
Which Alerts Automatically Generate a Support Case with Nutanix Support?
https://portal.nutanix.com/kb/1959/
メール送信は、Nutanixの
Pules疎通が出来れば、
SMTPサーバーは不要です
※Pulseの疎通は
「insights.nutanix.com:443」の接続が必要
Insights Portal - Pulse Status and Troubleshooting
https://portal.nutanix.com/kb/5784/
30
アラートの内容がダイジェストで送られます
アラートが発生しない場合、既存のア
ラートは健全性のサマリーをダイジェ
ストメールで毎日送る機能がついて
います。
(実はメールがうまく送れていなかったというトラ
ブルに気づくことが出来ます)
31
NCCは常に最新を
NCC自体が、定期的に新しいバージョンが提供されます。仮にサポートに多く寄せられる傷
害時効から新たにNCCのチェック項目がふえることもあります。新しいNCCを利用することで
既知の障害を未然に防ぐことも可能になります。
常に新しいNCCを利用しましょう
32
今までの常識は
アップデートは、恐ろしい作業
失敗したら、大変なことになる
ただ、HCIであれ3Tierであれ、
本来はバージョンを上げないといけないのは事実
33
Nutanixにおけるアップデートは
Nutanixは、LCMを使ったファームウェア、ハイパーバイザー及びCVMのアップデートで
仮想マシンの停止を必要としません。
また、Nutanixは、N+1の構成で設計を行います。そのため、仮にアップデートで何らかの障害
が発生してもシステム停止などは発生しません。
Nutanixのアップグレードは
基本無停止で行えることを
改めて理解しましょう
34
AOSアップグレード
仮想マシンは一切停止せずにAOSのアップグレードが可能
• CVMをアップグレードしている際にはローカルディスクへのアクセスが出来なくなる
• ハイパーバイザに隣のCVMへのStatic Routingを追加することで、一時的に他のノードのCVMがI/Oを行う
• この機能は、利用するハイパーバイザーに関係なく行われる
35
ハイパーバイザー/ファームウェア アップグレード
仮想マシンは停止せずにハイパーバイザー・ファームウェアアップデートが可能
仮想マシンはライブマイグレーションされ、CVMシャットダウン後ハイパーバイザー/ファームウェアアップ
デート後ホストの再起動を行い、CVMが起動しクラスターメンバーに復帰後仮想マシンが再度ライブマイグ
レーションされ戻る。
ハイパーバイザー ハイパーバイザー ハイパーバイザー
36
アップデートを支援する機能
Life Cycle Manager
37
AOSのサポート期間
Nutanix AOSのサポート期間は、
「https://download.nutanix.com/misc/AOS_EOL/AOS_EOL.pdf」に記載があります。
ただし、Nutanixのサポートとしては
サポートが既に終えているAOSであっても
QA含めトラブル対応を受け付けてくれます。
ただ、AOSは無停止で簡単にアップデート
できますので、なるべくEOL前までにアップ
デート頂くことをおすすめします。
38
レプリケーション環境の場合のAOSアップデート
Nutanix間乗れプルケーションを構成している場合、LTSは、N-1までをサポート。STSは、N+2
バージョンまでサポート。最新のSTSは、サポート期間にあるLTSの全てのバージョンのレプリ
ケーションがサポートされます。
(同時にメイン・バックアップ同時にバージョンを上げないといけないわけではありません)
メインクラスター バックアップクラスター
Async or NearSync
AOS 5.20 AOS 5.15
AOS 5.15 AOS 5.18
AOS 5.15 AOS 6.0
AOS 5.20 AOS 6.0
サポートされる
組み合わせ
39
サポートの活用方法
40
どうしても困ったときは
Nutanixのサポートに頼もう
41
サポート契約は2種類
Production Support
Mission Critical
Support
Technical Support 24x7x365 24x7x365
重要度 1 1 hour 30 minutes
重要度 2 4 hours 2 hours
重要度 3 8 hours 4 hours
ソフトウェアサポート:メジャーおよびマイナーメンテナンス、パッチリ
リース、アップグレード
○ ○
シニアレベルのエンジニアへの直接対応 ○ ○
根本原因分析 ○ ○
Nutanix Insights ○ ○
自動サポート監視 ○ ○
契約ごとのサポート管理者の最大数 6 Unlimited
Nutanixのソフトウエアサポートは、いずれもP1は、24時間365日対応
42
サポートへのCaseOpenは、
サポートポータルからの依頼がおすすめ!!
シリアル番号を入れれば
Insightが繋がっている場合
自動でバージョン等が入力されます
43
ハードウェアの障害?ソフトウェアの障害?
切り分けが難しいときは、ハードメーカーもしくはNutanixのどちらに聞いてもらってもOK!
ハードウェアメーカー
Nutanix
情報連携
ハードがおかしいのかソフトが
おかしいのかイマイチ分からない…
HPE DX
DELL XC Core
LENOVO HX Certify Node
44
サポートへの依頼におけるコツ
24/365とはいえ、営業時間外は、P1以外の問い合わせは翌営業日対応
※P1は、クラスター停止や業務に甚大な影響が出ている状態
時間外でも、平日であれば英語でCaseOpenすれば、対応してくれる!
Google翻訳レベルの英語で問題ないです!
積極的にリモートサポートをお願いする
状態がよく分からないケースや緊急性を要さない場合、サポートはログ取得の依頼連絡が来る
直接Zoom経由でリモートで見て下さいとお願いすれば見てもらえます
直接Nutanixクラスターがインターネットに繋がっていなくても、Prism等を操作できる管理端末
だけがインターネットに繋がっていればOK
45
まとめ
46
まとめ
特定のパフォーマンス情報などを
気にせず、Nutanixにお任せする
アップグレードでもサービス
停止は起きないので積極的な
アップグレードを検討する
Nutanixを安定稼働を行うために

Contenu connexe

Tendances

インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門
Akihiro Kuwano
 
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
Hibino Hisashi
 

Tendances (20)

AnsibleによるInfrastructure as code入門
AnsibleによるInfrastructure as code入門AnsibleによるInfrastructure as code入門
AnsibleによるInfrastructure as code入門
 
コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門コンテナ未経験新人が学ぶコンテナ技術入門
コンテナ未経験新人が学ぶコンテナ技術入門
 
細かすぎて伝わらないかもしれない Azure Container Networking Deep Dive
細かすぎて伝わらないかもしれない Azure Container Networking Deep Dive細かすぎて伝わらないかもしれない Azure Container Networking Deep Dive
細かすぎて伝わらないかもしれない Azure Container Networking Deep Dive
 
root権限無しでKubernetesを動かす
root権限無しでKubernetesを動かす root権限無しでKubernetesを動かす
root権限無しでKubernetesを動かす
 
小規模環境におけるNutanix Filesの活用を考える
小規模環境におけるNutanix Filesの活用を考える小規模環境におけるNutanix Filesの活用を考える
小規模環境におけるNutanix Filesの活用を考える
 
Docker Compose入門~今日から始めるComposeの初歩からswarm mode対応まで
Docker Compose入門~今日から始めるComposeの初歩からswarm mode対応までDocker Compose入門~今日から始めるComposeの初歩からswarm mode対応まで
Docker Compose入門~今日から始めるComposeの初歩からswarm mode対応まで
 
コンテナにおけるパフォーマンス調査でハマった話
コンテナにおけるパフォーマンス調査でハマった話コンテナにおけるパフォーマンス調査でハマった話
コンテナにおけるパフォーマンス調査でハマった話
 
Dep005 azure ネットワーク設計
Dep005 azure ネットワーク設計Dep005 azure ネットワーク設計
Dep005 azure ネットワーク設計
 
速習!論理レプリケーション ~基礎から最新動向まで~(PostgreSQL Conference Japan 2022 発表資料)
速習!論理レプリケーション ~基礎から最新動向まで~(PostgreSQL Conference Japan 2022 発表資料)速習!論理レプリケーション ~基礎から最新動向まで~(PostgreSQL Conference Japan 2022 発表資料)
速習!論理レプリケーション ~基礎から最新動向まで~(PostgreSQL Conference Japan 2022 発表資料)
 
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
トランザクション処理可能な分散DB 「YugabyteDB」入門(Open Source Conference 2022 Online/Fukuoka 発...
 
YugabyteDBを使ってみよう - part2 -(NewSQL/分散SQLデータベースよろず勉強会 #2 発表資料)
YugabyteDBを使ってみよう - part2 -(NewSQL/分散SQLデータベースよろず勉強会 #2 発表資料)YugabyteDBを使ってみよう - part2 -(NewSQL/分散SQLデータベースよろず勉強会 #2 発表資料)
YugabyteDBを使ってみよう - part2 -(NewSQL/分散SQLデータベースよろず勉強会 #2 発表資料)
 
コンテナセキュリティにおける権限制御(OCHaCafe5 #3 Kubernetes のセキュリティ 発表資料)
コンテナセキュリティにおける権限制御(OCHaCafe5 #3 Kubernetes のセキュリティ 発表資料)コンテナセキュリティにおける権限制御(OCHaCafe5 #3 Kubernetes のセキュリティ 発表資料)
コンテナセキュリティにおける権限制御(OCHaCafe5 #3 Kubernetes のセキュリティ 発表資料)
 
大規模DCのネットワークデザイン
大規模DCのネットワークデザイン大規模DCのネットワークデザイン
大規模DCのネットワークデザイン
 
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
AWSとオンプレミスを繋ぐときに知っておきたいルーティングの基礎知識(CCSI監修!)
 
インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門インフラエンジニアのためのcassandra入門
インフラエンジニアのためのcassandra入門
 
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
わかる!metadata.managedFields / Kubernetes Meetup Tokyo 48
 
KubernetesバックアップツールVeleroとちょっとした苦労話
KubernetesバックアップツールVeleroとちょっとした苦労話KubernetesバックアップツールVeleroとちょっとした苦労話
KubernetesバックアップツールVeleroとちょっとした苦労話
 
昨今のストレージ選定のポイントとCephStorageの特徴
昨今のストレージ選定のポイントとCephStorageの特徴昨今のストレージ選定のポイントとCephStorageの特徴
昨今のストレージ選定のポイントとCephStorageの特徴
 
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
 
OpenStackで始めるクラウド環境構築入門
OpenStackで始めるクラウド環境構築入門OpenStackで始めるクラウド環境構築入門
OpenStackで始めるクラウド環境構築入門
 

Dernier

Dernier (11)

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

Nutanix運用指南術