Contenu connexe Similaire à Jtf2018 自律的運用に向けた第一歩 (20) Plus de Daisuke Ikeda (20) Jtf2018 自律的運用に向けた第一歩2. 自己紹介
TIS株式会社
IT基盤エンジニアリング第 1部 所属
い け だ だ い す け
池田 大輔
R&D部門での活動(社内システム運用とかやりつつ)を経て
OSSサポートビジネスのサポートエンジニア・プリセールス・マーケティングを実施。
現在は、システム運用改善を支援するためのサービス企画開発中
その他、Zabbixの書籍執筆等実施。
2@ike_dai ikedai ike-dai ike_dai
10. Case1 : Nginx error log
10
2018/07/20 14:20:00 ...(24: Too many open files) while accepting new connection...
$ ulimit -n
1024
$ cat /proc/sys/fs/file-max
816063
$ vi /etc/systemd/system/nginx.service.d/limits.conf
[Service]
LimitNOFILE=10000
$ systemctl daemon-reload
$ systemctl restart nginx.service
このような対応を行う可能性が xx%
11. Case2 : Zabbix Tuning
11
$ vi /etc/zabbix/zabbix_server.conf
StartPollers=20
Zabbix Pollerのbusy率が上昇 Zabbixの監視項目数が上昇
Zabbix Server全体の
CPU使用率には余裕あり
このような対応を行う可能性が xx%
17. 17
システム構成情報
サーバ構成
No ホスト名 IPアドレス OS 備考
1 web-server-01 192.168.111.11 RHEL7.3 web-server-02とのAct-Standby構成
2 web-server-02 192.168.111.12 RHEL7.3 web-server-01とのAct-Standby構成
3 db-server-01 192.168.111.31 RHEL7.3 db-server-02とのAct-Act(ReadReplica)構成
4 db-server-02 192.168.111.32 RHEL7.3 db-server-01とのAct-Act(ReadReplica)構成
5 db-lb-server-01 192.168.111.21 CentOS7 db-lb-server-02とのAct-Act構成
6 db-lb-server-02 192.168.111.22 CentOS7 db-lb-server-01とのAct-Act構成
SW/MW構成
No. ホスト SW/MW バージョン
1 web-server-01
web-server-02
nginx 1.14.0
2 pacemaker 1.1.18
3 zabbix-agent 3.0.19
4 db-server-01
db-server-02
PostgreSQL 9.6.5
5 JobScheduler Agent 1.12.0
これでは関係性とか評価が難しい ...
たとえ、構成を図で表現されていたとしても ...
19. 19
システム構成情報
Terraformの定義情報と構成グラフ
variable "count" {default = 2}
variable "hostnames" {
default = {
"0" = "example1.org"
"1" = "example2.net"
}
}
data "template_file" "web_init" {
count = "${length(var.hostnames)}"
template ="${file("templates/web_init.tpl")}"
vars {
hostname ="${var.hostnames[count.index]}"
}
}
resource "aws_instance" "web" {
count = "${length(var.hostnames)}"
user_data = "${data.template_file.web_init.*.rendered[count.index]}"
}
terraform graphコマンド
21. 21
システム構成情報
ノードグラフから媒介中心性を求めるクエリ(Neo4j cypher)
MATCH p = allShortestPaths((p1:Service)-[:connect*]-(p2:Service))
WHERE id(p1) < id(p2) AND length(p) > 1
UNWIND nodes(p)[1..-1] AS n
RETURN n, count(*) AS betweeness
ORDER BY betweeness DESC
n betweeness
Service C 5
Service B 3
Service A 3
25. Dashboard
25
データ集約基盤の提供
Core API
(Events & Config management)
Collector
Zabbix
Collector
ConfDiff
Collector
Command
Collector
・・・
Analyzer
Zabbix
Linux Server
監視統計データ集約
監視構成情報集約
設定パラメータ
コマンドヒストリ
設定パラメータ変更情報集約
コマンド実行情報集約