O documento discute o Nagios, uma ferramenta de código aberto para monitoramento de redes corporativas. O Nagios monitora hosts e serviços, alertando sobre problemas e resoluções. Ele foi criado originalmente como Netsaint e é mantido por Ethan Galstad e outros desenvolvedores. O documento também discute os objetivos do monitoramento de redes como detecção de falhas, monitoramento de hosts e tráfego, de acordo com o modelo de gerenciamento de rede da ISO.
3. Nagios
• Nagios é uma popular aplicação de monitoração de rede
de código aberto distribuída sob a licença GPL. Ele pode
monitorar tanto hosts quanto serviços, alertando-o quando
ocorrerem problemas e também quando os problemas forem
resolvidos.
• O Nagios foi originalmente criado sob o nome de Netsaint, foi
escrito e é atualmente mantido por Ethan Galstad, junto com
uma equipe de desenvolvedores que ativamente mantém
plugins oficiais e não-oficiais.
• Nagios primeiramente foi escrito para o sistema
operacional Linux, mas pode rodar em outros Unixes também.
4. Motivação
Crescimento das redes:
• Número de equipamentos;
Diversidade de tecnologias
Diversidade de ambientes operacionais
Extensão/Dispersão da rede
• Garantir a qualidade no serviço;
Clientes mais exigentes
Competitividade
Outages
• Novos dispositivos/protocolos/arquiteturas de rede;
Virtualização
Computação na Nuvem
5. Motivação
Complexidade das redes modernas
Migração de tecnologias legadas para redes de dados
Telefonia
TV (Streaming / GVT / Netflix / PS3)
Telemetria
Vigilância
Múltiplos fornecedores
Ausência de recursos suficientes para administrar/monitorar a
rede
6. Motivação
“O administrador de rede deve monitorar,
gerenciar e controlar ativamente o sistema do
qual está encarregado.”
Kurose e Ross
7. Objetivos
Detecção de falhas
Falhas em interfaces de rede, Computadores/Servidores, roteadores, etc
Através do monitoramento de tráfego ou ainda contadores de performance
Monitoração de Hospedeiro
Acompanhar a disponibilidade dos hosts da rede
Realizar gerência proativa na ocorrência de uma falha
Monitoração de Tráfego
A rede pode ser otimizada
Gargalos resolvidos
Novas contratações podem ser iniciadas antes da exaustão do recursos
8. Objetivos
Detecção de Mudanças rápidas em tabelas de roteamento
Quando muito frequentes, podem indicar instabilidade em um roteador mal
configurado ou intermitência em links de comunicação
Monitoração de SLA's (Service level Agreement) - Acordo de
nível de serviço
Seja garantido o nível de serviço contratado
É necessário que seja especificado no contrato
9. Objetivos
Detecção de Intrusos
• Filtragem de tráfego
• Notificação de eventos suspeitos
Aumento de consumo de banda repentino
Aumento de pacotes TCP SYN direcionados a um único hospedeiro
Conexões a portas de acesso remoto
Autenticações inválidas
10. Modelo de Gerenciamento
de redes da ISO
A ISO (International Organization for Standarization) criou um
modelo de gerenciamento de rede mais estruturado, baseado
em 5 áreas de gerenciamento:
Gerenciamento de Desempenho
Gerenciamento de Falhas
Gerenciamento de Configurações
Gerenciamento de Contabilização
Gerenciamento de Segurança
11. Gerenciamento de Desempenho
Quantificar, medir, analisar, informar, analisar e controlar o
desempenho de diferentes componentes/recursos de rede.
Sejam ativos de rede, links, servidores ou ainda hosts.
SNMP desempenha um papel fundamental neste
gerenciamento.
13. Gerenciamento de Desempenho
Utilizado no planejamento da rede:
• Dimensionamento
• Identificação de gargalos
• Resolução de problemas de performance
• Relocação de recursos
• Ampliações programadas
14. Gerenciamento de Desempenho
Exemplos:
• Utilização de CPU dos servidores é considerada OK até 60%, entre 61-
85% deve-se iniciar processo de upgrade, acima de 86% é considerado
crítico
• Ocupação dos links da rede devem ser observados, ao chegar a 70%,
deve-se solicitar ampliação, se links forem redundantes/load balance,
um link não deve ultrapassar 40% de sua capacidade, pois em
situação de falha, receberá a carga do outro link.
15. Gerenciamento de Desempenho
Exemplos:
• Utilização de CPU dos servidores é considerada OK até 60%, entre 61-
85% deve-se iniciar processo de upgrade, acima de 86% é considerado
crítico
• Ocupação dos links da rede devem ser observados, ao chegar a 70%,
deve-se solicitar ampliação, se links forem redundantes/load balance,
um link não deve ultrapassar 40% de sua capacidade, pois em
situação de falha, receberá a carga do outro link.
16. Gerenciamento de Falhas
Procedimentos:
• Determinar e isolar o ponto de falha;
• Reconfigurar a rede para diminuir o impacto;
• Reparar a falha e voltar para à situação normal de funcionamento.
Falha ≠ Erro
17. Gerenciamento de Falhas
Como evitar e minimizar essas falhas:
• Utilizar ferramentas e funções de gerenciamento rápido e confiáveis;
• Utilizar redundância de rotas e equipamentos para minimizar o impacto
das falhas;
• Utilizar uma técnica de gerenciamento de falhas redundante.
18. Gerenciamento de Contabilidade
Sua função:
• Contabilizar a utilização dos recursos de rede por parte dos usuários,
como evitar a sobrecarga da rede resultante do acesso privilegiado e
garantir a utilização eficiente dos recursos da rede.
O que deve ser especificado:
• Quais informações vão fazer parte do projeto;
• A frequência de registros das informações especificadas;
• Algoritmos de cálculos de cargas e relatórios de contabilidade.
19. Gerenciamento de Segurança
• Geração, armazenamento e distribuição de chaves criptográficas e de
senhas.
• Monitoramento de acesso à rede e as informações nela contida.
• Proteção de recursos da rede e de informações dos usuários.