Cours - Supervision SysRes et Présentation de Nagios

La Supervision Systèmes et Réseaux
Présentation de l'outil Nagios

Par Erwan 'Labynocle' Ben Souiden (erwan@aleikoum.net @labynocle)
Durée de la présentation : 4 heures
Version du document : 0.5.3

Plan de la présenation
I.

Introduction

II.

Approche Théorique

III.

Présentation de SNMP

IV.


V.

Approche Pratique

VI.

Retours d'expérience

VII.

Conclusion

La Supervision Systèmes et Réseaux – Présentation de Nagios

2

I.

Introduction

II.

Approche Théorique

III.


IV.


V.

Approche Pratique

VI.


VII.

Conclusion


3

Introduction ::

Objectifs de cette présentation

Comprendre ce qu'est la supervision et ses enjeux
Connaître et comprendre les concepts et mécanismes des outils
qui permettent d'assurer la supervision

Avoir une vision des outils du marché
Présentation de l'outil Open Source majeur du marché : Nagios
Etude d'un cas pratique
Retour d'expérience dans 2 environnements différents


4

I.

Introduction

II.

Approche Théorique

III.


IV.


V.

Approche Pratique

VI.


VII.

Conclusion


5

Approche Théorique ::

 Définition

 Comment superviseton ?
Les concepts de polling versus hearbeat
Les outils existants

 Les apports de la supervision


6


 Définition

 Comment supervise t'on ?



7

Approche Théorique :: Définition

Que peut on superviser ?
A priori tout peut être supervisé à partir du moment où l'on peut déterminer un état
➔
➔
➔
➔

Diodes
Logs
Réponses
Activités

Dans un SI, cela signifie qu'on peut superviser
➔
➔
➔
➔

Le matériel (serveurs, équipements réseaux...)
Le réseau (trafic...)
Les services (web,mail, partage de fichiers...)
Les workflows (processus métier...)


8


Qu'est ce que la supervision ?

Définition du Petit Larousse 1991 : “superviser c'est contrôler et réviser un fait”
Définition sur Wikipédia : “la supervision est une technique de suivi et de
pilotage informatique de procédés de fabrication automatisés. La supervision
concerne l'acquisition de données (mesures, alarmes, retour d'etat de
fonctionnement) et des paramètres de commande des processus généralement
confiés à des automates programmables”

Finalement la supervision c'est la surveillance du bon fonctionnement d’un
système ou d’une activité


9


Que doit on superviser ?
La vraie question : est ce qu'un SI peut ne pas avoir de faille ?

Tout ce qui touche à la production d'un SI doit être
supervisé !

10


“Même si ton adversaire te semble une souris,
surveillele comme s'il était un lion.”
Luigi Manfredi
Ingénieur à l'Info Institute Of Medical Science and Technology


11


 Définition




12

Approche Théorique :: Comment superviseton ?

Rappel : l'objectif est de connaître les changements d'états

Polling

Heartbeat

Polling : sondage réalisé périodiquement par un superviseur

Heartbeat : signal émis par un équipement à chaque changement d'état

(images: xkcd.org)

13


 Polling – Description (1/2) – Exemple

(images: xkcd.org)

14


 Polling – Description (2/2) – Avantages et Inconvénients

 A l'initiative du demandeur
 Permet un véritable suivi

 Des échanges pour rien

 Temps de réaction

 Possibilité de ne pas voir certains changements


15


 Heartbeat – Description (1/2) – Exemple

(images: xkcd.org)

16


 Heartbeat – Description (2/2) – Avantages et Inconvénients

 Des échanges uniquement lorsque c'est nécessaire
 Temps de réaction
 Tous les changements d'états sont remontés
 Suivi moins complet
 A l'initiative de celui qui possède l'information


17


 Polling vs Heartbeat Conclusion

Quelle est la meilleure solution ?
Aucune, tout dépend :
du contexte
des objectifs
...

Ce ne sont que des concepts !


18

Approche Théorique :: Les outils existants

Un outil de supervision doit répondre aux critères suivants

Des mécanismes pour déterminer l'état d'une ressource/process

Une console / un dashboard de monitoring

 Remontée d'alertes


19

Approche Théorique :: Les outils existants

On distinguera 3 catégories
Les solutions propriétaires

Les solutions Open Source

Les protocoles réseaux


20


 Définition




21

Approche Théorique :: Les apports de la supervision

Rappel de l'objectif
Avoir de la visibilité sur l'état de son SI, de son activité ou de son architecture

La supervision permet d'aller au delà :
Pro activité
Dimensionnement
Contrôle qualité / Complément d'informations
Contrat de service
Crédibilité

22

Présentation de SNMP ::



Définition



Mode de fonctionnement



Bilan : Avantages et Limitations


23




Définition








24

Présentation de SNMP :: Définition

Spécifications dans la RFC 1157 (rendant obsolète les RFCs 1067 et 1098) datant
de Mai 1990 et proposée par J. Case, M. Fedor, M. Schoffstall, J. Davin.
Définition sur Wikipédia : “Simple Network Management Protocol (SNMP), est un
protocole de communication qui permet aux administrateurs réseau de gérer les
équipements du réseau, superviser et de diagnostiquer des problèmes réseaux,
matériels à distance”.
Plusieurs versions d'implémentation ( v1, v2, v3)
Comme c'est un protocole c'est indépendant de la plateforme (Unix, Linux,
Windows...) et du type de l'équipement (serveurs, switchs, routeurs, machines à
café...)


25




Définition








26

Présentation de SNMP :: Mode de fonctionnement

Ce protocole se base sur le principe d'une communication manageragent.
Le manager polle les agents pour avoir des informations.
Ces échanges se font en UDP sur le port 161.
Les agents peuvent d'eux mêmes envoyer des informations aux manager via SNMP.
Les échanges sont aussi en UDP et utilisent le port 162.


27


 Schéma des échanges SNMP (v1)

 Format des paquets SNMP (v1)


28

 Mais d'où proviennent ces informations ?

Des
La MIB est la Management Information Base
La MIB contient les informations d'un système ou d'un équipement dans une
base de données normalisée.
Cette base est organisée en arborescence et est accessible en lecture et en
écriture.
C'est l'agent spécifique à la plateforme qui fait la traduction entre les informations
SNMP et les MIBs.
Les entrées de cette base sont accessibles via des identifiants appelés OIDs.


29

Schéma d'une MIB

Les noms des catégories n'est qu'une représentation plus simple pour l'homme
Exemple d'OID d'une référence dans MIB2 : 1.3.6.1.2.1
La MIB2 décrite dans la RFC 1213 est déployée dans quasi tous les équipements
TCP/IP. On y retrouve les informations de bases sur le système, les interfaces, etc...

30




Définition








31

Présentation de SNMP :: Avantages et Limitations

Avantages

Limitations

  Protocole excessivement simple

 Aucun chiffrement

  Très largement répandu

 Pas d'acquittement sur les traps

  Léger pour les équipements

 Jeu de commandes pauvres

 Facilement extensible
 Gratuit


32

I.

Introduction

II.

Approche Théorique

III.


IV.


V.

Approche Pratique

VI.


VII.

Conclusion


33

Présentation de Nagios ::

 Définition / Généralités

 Mode de fonctionnement
 Nagios Core
 Le concept de plugins
 NRPE et SNMP
 Bilan : Avantages et Limitations

 Projets annexes


34



 Nagios Core
 NRPE et SNMP

 Projets annexes


35

Présentation de Nagios :: Définition / Généralités

Nagios est un outil de monitoring systèmes et réseaux
Designé pour Linux, il fonctionne sur tous les Unix like
Ecrit complètement en C (les CGIs aussi)
Les prérequis sont limités à un compilateur C et une configuration TCP/IP
Prérequis optionnels : un serveur web (Apache, Lighttp) et la librairie GD
Sous licence GNU GPL
Site officiel : www.nagios.org Auteur du premier projet Ethan Galstad


36

Surveillance des services réseaux (SMTP, POP3, HTTP, NNTP, ICMP (Ping), etc)

Surveillance des ressources des hôtes (charge processeur, utilisation des disques,
etc)

Système simple de plugins permettant aux utilisateurs de développer facilement
leurs propres vérifications de services.

Parallélisation de la vérification des services.

Possibilité de définir la hiérarchie du réseau en utilisant des hôtes "parents", ce qui
permet la détection et la distinction entre les hôtes qui sont à l'arrêt et ceux qui sont
injoignables.


37

Notifications des contacts quand un hôte ou un service a un problème

Possibilité de définir des gestionnaires d'évènements qui s'exécutent pour des
événements sur des hôtes ou des services, pour une résolution des problèmes pro
active

Rotation automatique des fichiers log

Support pour l'implémentation de la surveillance des hôtes de manière redondante

Interface web, pour voir l'état actuel du réseau, notification et historique des
problèmes, fichiers log, etc.


38

 Screenshot


39


 Historique


40

 Awards / Retour de la communauté
SourceForge Project of the month – 06/2005
SourceForge Community Awards “best or sysadmins tool” finalist – 2007
SourceForge Community Awards “best or sysadmins tool” – 2009
Définie Nagios comme un “must have tool” – 2006
Place Nagios comme une des applications OpenSource les plus importantes
de tous les temps – 2007
Members Choice Award – 2007
Meilleure application de monitoring – 2008
Dans le Top 5 des outils Open Source de sécurité – 2007

Meilleure application de monitoring – 2008 et 2009
Meilleure application de monitoring – 2009

41

 Communauté et quelques chiffres
Communauté mondiale : évaluée à + de 250 000 utilisateurs
Sites dédiés
http://community.nagios.org : news et annonces [EN]
http://wiki.nagios.org : best practice, documentations officielles [EN]
http://www.monitoringexchange.org : repository officiel de plugins [EN]
plus de 2100 projets recensés
http://forums.monitoringfr.org : forum de la communauté francaise [FR]
plus de 400 users
presque 40000 posts sur plus de 4000 threads


42

 Références


43

 Autres solutions Open Source


44



 Nagios Core
 NRPE et SNMP

 Projets annexes


45

Présentation de Nagios :: Mode de fonctionnement :: Nagios Core
 Nagios Core est
 un daemon Unix
juste un ordonnanceur de commandes...
… capable de réagir en fonction d'un comportement donné
 Nagios Core n'est pas
un système de contrôle de services réseaux ou systèmes


46

Présentation de Nagios :: Mode de fonctionnement :: Le concept de plugins
 Que sont les plugins ?

 des scripts stand alone qui permettent d'obtenir ou de contrôler
l'état d'un service ou d'une ressource
 écrits en C (cf les nagiosplugins officiels)
 ou en Perl/Shell/Python/Ruby (cf les plugins de la communauté)

Nagios Core + plugins = solution de monitoring


47

Présentation de Nagios :: Mode de fonctionnement :: Le concept de plugins


48

Présentation de Nagios :: Mode de fonctionnement :: NRPE et SNMP
 Comment peut on superviser des ressources locales d'une machine distante ?

2 possibilités
via un service réseaux


via un mécanisme dédié




49


 Nagios Remote Plugins Executor
 Composé de 2 éléments
un plugin : check_nrpe
un daemon Unix
 Porté sous Windows (sous le nom de NRPENT)
 Possibilité d'avoir les échanges over SSL
 Repose sur TCP et utilise nativement le port 5666


50



51



52



53

 SNMP ou NRPE ?

Ca dépend !

 protocole réseau standard indépendant
de la plateforme

 possibilité d'avoir le flux over SSL

 très peu gourmand en ressource

 potentiellement gourmand en ressource

 la supervision se limite au contenu des
MIBs

 pour chaque plateforme, une version
adaptée

 sécurité légère

54



 Nagios Core
 NRPE et SNMP

 Projets annexes


55

Présentation de Nagios :: Mode de fonctionnement :: Avantages et Inconvenients

Avantages

 Entièrement gratuit

Limitations

 Aucune !

 Se suffit à lui même
 Mécanisme simple
 Code ouvert


56

Présentation de Nagios :: Mode de fonctionnement :: Avantages et Inconvenients

“Limitations live only in our minds. But if we use our
imaginations, our possibilities become limitless.”
Jamie Paolinetti

Coureur cycliste professionnel


57



 Nagios Core
 NRPE et SNMP

 Projets annexes


58

Présentation de Nagios :: Projets annexes
NSCA : projet Nagios officiel, permet d'avoir un comportement heartbeat
NDOutils : projet Nagios officiel, permet de stocker toutes les données de
     Nagios dans une base de données MySQL
graph : développé par la communauté, permet de générer des graphs sur
les retours des plugins (approche de reporting)
: développé par la communauté, permet de réaliser une cartographie
  des hôtes supervisés
SMS Server Tool : développé par la communauté, permet d'envoyer des notifications
      par SMS
Nagdroid : développé par la communauté, permet de suivre les notifications de sa
      plateforme Nagios depuis son mobile Android

59


Nagdroid


60


graph


61


XI
Développé par l'équipe officielle Nagios, c'est un Nagios packagé avec plusieurs
projets afin d'avoir une solution clé en main
L'objectif est de faciliter les larges déploiements, d'offrir des outils de reporting et une
GUI plus aboutie: en faire un outil pour tous et pas qu'aux admins sys/res
A partir de 1200$/an (jusqu'à 2200$/an)
Architecture


62

I.

Introduction

II.

Approche Théorique

III.


IV.


V.

Approche Pratique

VI.


VII.

Conclusion


63

Approche Pratique ::



Etude d'un cas pratique



Mise en place et tests des plugins Nagios



Mise en place et tests de SNMP



Mise en place et tests de NRPE



Mise en place et intégration dans Nagios



Conclusion


64



















Conclusion


65

Approche Pratique :: Etude d'un cas pratique

 Soit la société Plop.com


66

 Avant de se lancer il faut se poser les bonnes questions

 quels sont les matériels concernés par la supervision ?
 pour chaque matériel, quelles sont les ressources ? et les services ?
 à partir de quel seuil estimeton qu'il y a un problème ? et au bout de combien

de temps ?
 qui doit on prévenir en cas de problème ?
 quel est le test qui va permettre de déterminer l'état de la ressource ou

du service ?


67



68


NRPE+SNMP+Plugins Nagios

Nagios Core


69



















Conclusion


70

Approche Pratique :: Mise en place et test des plugins Nagios
 Installation par package
$ sudo apt-get install nagios-plugins-basic nagios-plugins-standard

 Contenu du package
$ dpkg -L nagios-plugins-basic
$ dpkg -L nagios-plugins-standard

 Test des plugins
$
$
$
$
$
$

./check_ping --help
./check_http --help
./check_disk --help
./check_load --help
./check_cpu –-help
./check_mysqld --help


71



















Conclusion


72

Approche Pratique :: Mise en place et tests de SNMP
$ sudo apt-get install snmp snmpd

$ dpkg -L snmp
$ dpkg -L snmpd

 Configuration du daemon SNMP
$ sudo vim /etc/default/snmpd
$ sudo vim /etc/snmp/snmpd.conf

 Démarrage du daemon SNMP
$ sudo /etc/init.d/snmpd start

73

 Exemple de snmpd.conf
$ cat /etc/snmp/snmpd.conf
trapsink 127.0.0.1
trap2sink 127.0.0.1
informsink 127.0.0.1
# definition des access list
com2sec LocalNet
127.0.0.1
com2sec Mynetwork
10.0.0.0/24

public
public

# definition des groupes pour les access list
group
ROGroup
v1
LocalNet
group
ROGroup
v1
Mynetwork
# definition des vues
view
tout
included

.1

# association vue groupe
access ROGroup
""
v1 noauth

exact tout

none

none
74

 Test des commandes SNMP
$ snmpwalk -c $COMMUNITY -v1 $HOST
$ snmpget -c $COMMUNITY -v1 $HOST $OID

 Plugins SNMP
$ ./check_snmp --help
$ ./check_snmp_load.pl --help


75



















Conclusion


76

Approche Pratique :: Mise en place et tests de NRPE
 Installation par package côté hôte de supervision
$ sudo apt-get -O APT::Install-Recommends=0 install nagios-nrpe-plugin

$ dpkg -L nagios-nrpe-plugin

 Installation par package côté hôte à superviser
$ sudo apt-get -O APT::Install-Recommends=0 install nagios-nrpe-server

$ dpkg -L nagios-nrpe-server


77

 Côté de l'hôte à superviser – configuration de NRPE
$ sudo vim /etc/nagios/nrpe.cfg
$ sudo vim /etc/nagios/nrpe_local.cfg
$ sudo vim /etc/default/nagios-nrpe-server

 Côté de l'hôte à superviser – démarrage du daemon NRPE
$ sudo /etc/init.d/nagios-nrpe-server start

 Côté de l'hôte superviseur – utilisation de check_nrpe
$ ./check_nrpe -H $HOST -c $COMMANDE -a $ARGS


78

 Exemple de /etc/nagios/nrpe.cfg
$ cat nagios/nrpe.cfg | grep -v "^#" | grep -v "^$”
log_facility=daemon
pid_file=/var/run/nrpe.pid
server_port=5666
nrpe_user=nagios
nrpe_group=nagios
allowed_hosts=127.0.0.1
dont_blame_nrpe=1
debug=0
command_timeout=60
connection_timeout=300
include=/etc/nagios/nrpe_local.cfg


79

 Exemple de /etc/nagios/nrpe_local.cfg
$ cat nagios/nrpe_local.cfg
# check de MySQL
# -------------# retrouver le script sur :
# http://www.monitoringexchange.org/inventory/Check-Plugins/Database/MySQL/check_mysqld
command[check_mysqld]=/usr/lib/nagios/plugins-perso/check_mysqld.pl -H 127.0.0.1 -u
"monitoring" -p 'monitoringpassword'
# check de la LOAD
# ---------------command[check_load]=/usr/lib/nagios/plugins/check_load -w 2,1.5,1.25 -c 3,2.5,2.1
# check DISK
# ---------command[check_disk_data]=/usr/lib/nagios/plugins/check_disk -w 10% -c 5% -p /data
command[check_disk_boot]=/usr/lib/nagios/plugins/check_disk -w 10% -c 5% -p /boot
command[check_disk_root]=/usr/lib/nagios/plugins/check_disk -w 10% -c 5% -p /
#command[check_disk_arg]=/usr/lib/nagios/plugins/check_disk -w 99% -c 5% -p $ARG1$
command[check_disk_arg]=/usr/lib/nagios/plugins/check_disk -w 10% -c 5% -p $ARG1$


80



















Conclusion


81

Approche Pratique :: Mise en place et intégration dans Nagios
$ sudo apt-get install nagios3

$ dpkg -L nagios3

 Configuration générale de Nagios
$
$
$
$
$

sudo
sudo
sudo
sudo
sudo

vim
vim
vim
vim
vim

/etc/default/nagios3
/etc/nagios3/nagios.cfg
/etc/nagios3/cgi.cfg
/etc/nagios3/commands.cfg
/etc/nagios3/resource.cfg


82

Approche Pratique :: Mise en place et intégration dans Nagios
 Configuration avancée de Nagios
$ sudo vim /etc/nagios3/conf.d/*

 Tester la configuration de Nagios
$ /usr/sbin/nagios3 -v /etc/nagios3/nagios.cfg

 Configuration du serveur Web pour l'interface de monitoring
$ sudo ln -s /etc/nagios3/apache2.conf /etc/apache2/site-available/nagios
$ sudo a2ensite nagios
$ sudo /etc/init.d/apache2 reload

 Démarrage du daemon Nagios
$ sudo /etc/init.d/nagios3 start


83



















Conclusion


84

I.

Introduction

II.

Approche Théorique

III.


IV.


V.

Approche Pratique

VI.


VII.

Conclusion


85

I.

Introduction

II.

Approche Théorique

III.


IV.


V.

Approche Pratique

VI.


VII.

Conclusion


86

Conclusion ::
 Ce qu'il faut retenir

 Les outils de supervision sont donc aujourd'hui des outils indispensables à tout SI

 Ce sont des outils qui doivent évoluer en même temps que l'architecture

 Il n'y a jamais de solution de supervision toute faite, seules les méthodes d'approches

restent identiques

 Nagios est un outil qui peut aller au delà de la supervision et du reporting... cela ne

tient qu'à votre imagination et votre capacité à scripter

 Les concepts de remontée de l'information polling et heartbeat

 Les mécanismes de SNMP, la notion de MIBs et d'OID


87

Conclusion ::
 Pour aller plus loin

 Les configurations évoquées pour le use case plop.com sont disponibles sur github
https://github.com/labynocle/talktd_tp/

 Les mises à jour de ce cours seront disponibles sur slideshare
http://www.slideshare.net/labynocle/courssupervisionsysresetprsentationdenagios


88

Conclusion ::
 Ce qu'il faut retenir

Don't believe me try it yourself!

(images: The Big Bang Theory TV Show)

89

Conclusion ::

Questions ?

(images: xkcd.org)

90

Cours - Supervision SysRes et Présentation de Nagios

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

Similaire à Cours - Supervision SysRes et Présentation de Nagios

Similaire à Cours - Supervision SysRes et Présentation de Nagios (13)

Dernier

Dernier (19)

Cours - Supervision SysRes et Présentation de Nagios

Notes de l'éditeur