Gerência de Redes: Monitoramento e Controle

Gerência de Redes

Introdução a
Gerência de Redes

Frederico Madeira
LPIC1, LPIC2, CCNA
fred@madeira.eng.br
www.madeira.eng.br

O que é gerenciamento
de rede ?

“Gerenciamento de rede inclui o oferecimento, a
integração e a coordenação de elementos de
hardware, software e humanos, para
monitorar, testar, consultar, configurar, analisar,
avaliar e controlar os recursos da rede, e de
elementos, para satisfazer às exigências
operacionais, de desempenho e de qualidade de
serviço em tempo real a um custo razoável.”

Tuncay Saydam em
From networks and network management into service and service
management

Exemplos de sistemas de
controle área de energia

Sala de Controle da Usina de Itaipu

controle área de energia

controle na aviação

MOTIVAÇÃO
➔
O Administrador/piloto pode monitorar os
diversos componentes da usina/aeronave e
analisar os dados

➔
Realizar a gerência reativa
➔
Fazendo ajustes em resposta a modificações
ocorridas no sistema

➔
Realizar a gerência proativa
➔
Detecção de tendências ou comportamentos
anômalos
➔
Execução de ações antes que ocorram
problemas de maior proporção

controle

Nas redes de computadores
existe alguma motivação
diferente ?

MOTIVAÇÃO
➔
Crescimento das redes:
➔
Número de equipamentos
➔
Diversidade de tecnologias
➔
Diversidade de ambientes operacionais
➔
Extensão/Dispersão da rede

➔
Garantir a qualidade no serviço;
➔
Clientes mais exigentes
➔
Competitividade
➔
Outages

➔
Novos dispositivos/protocolos/arquiteturas de
rede;
➔
Virtualização
➔
Computação na Nuvem

MOTIVAÇÃO
➔
Complexidade das redes modernas

➔
Migração de tecnologias legadas para redes de
dados
➔
Telefonia
➔
TV (Streaming / GVT / Netflix / PS3)
➔
Telemetria
➔
Vigilância

➔
Múltiplos fornecedores

➔
Ausência de recursos suficientes para
administrar/monitorar a rede

gerência de rede

controle

“O administrador de rede deve
monitorar, gerenciar e controlar
ativamente o sistema do qual está
encarregado.”
Kurose e Ross

OBJETIVOS
➔
Detecção de falhas
➔
Falhas em interfaces de rede,
Computadores/Servidores, Roteadores, etc
➔
Através do monitoramento de tráfego ou ainda
contadores de performance
➔
Monitoração de Hospedeiro
➔
Acompanhar a disponibilidade dos hosts da
rede
➔
Realizar gerência proativa na ocorrência de
uma falha
➔
Monitoração de Tráfego
➔
A rede pode ser otimizada
➔
Gargalos resolvidos
➔
Novas contratações podem ser iniciadas antes
da exaustão do recurso

OBJETIVOS
➔
Detecção de Mudanças rápidas em tablas de
roteamento
➔
Quando muito frequentes, podem indicar
instabilidade em um roteador mal configurado
ou intermitência em links de comunicação

➔
Monitoração de SLA's (Service level
Agreement)
➔
Seja garantido o nível de serviço contratado
➔
Alguns indicadores: Disponibilidade, latência,
throughput, notificação de eventos/atividades
planejadas
➔
É necessário que seja especificado no contrato

OBJETIVOS
➔
Detecção de Intrusos
➔
Filtragem de tráfego
➔
Notificação de eventos suspeitos
➔
Aumento de consumo de banda repentino
➔
Aumento de pacotes TCP SYN direcionados
a um único hospedeiro
➔
Conexões a portas de acesso remoto
➔
Autenticações inválidas

Modelo de
Gerenciamento de redes
da ISO
A ISO (International Organization for Standarization)
criou um modelo de gereciamento de rede mais
estruturado, baseado em 5 áreas de gerenciamento:

➔
Gerencimaneto de Desempenho

➔
Gerenciamento de Falhas

➔
Gerenciamento de Configurações

➔
Gerenciamento de Contabilização

➔
Gerenciamento de Segurança

Gerenciamento de
Desempenho
➔
Quantificar, medir, analisar, informar, analisar e
controlar o desempenho de diferentes
componentes/recursos de rede
➔
Sejam ativos de rede, links, servidores ou ainda
hosts
➔
SNMP desempenha um papel fundamental neste
gerenciamento
➔
Controlar as variáveis da rede para atingir o nível
de desempenho especificado:
➔
Capacidade de Utilização e Quantidade de
Tráfego;
➔
Vazão dos Dados e Tempo de Resposta.
➔
Definição de indicadores de rede

Gerenciamento de
Desempenho
➔
Utilizado no planejamento da rede:

➔
Dimensionamento
➔
Identificação de gargalos
➔
Resolução de problemas de performance
➔
Relocação de recursos
➔
Ampliações programadas

Gerenciamento de
Desempenho
Exemplos:

➔
Utilização de CPU dos servidores é considerada
OK até 60%, entre 61-85% deve-se iniciar
processo de upgrade, acima de 86% é
considerado crítico

➔
Ocupação dos links da rede devem ser
observados, ao chegar a 70%, deve-se solicitar
ampliação, se links forem redundantes/load
balance, um link não deve ultrapassar 40% de
sua capacidade, pois em situação de falha,
receberá a carga do outro link.

➔
Registrar, detectar e reagir a condições de falha
da rede
➔
Gerenciamento de falha é o tratamento imediato,
já o gerenciamento de desempenho é a longo
prazo
➔
Requer constante observação do funcionamento
dos dispositivos de forma que se possa identificar
rapidamente o problema e resolvê-lo
➔
Gerência proativa de falhas
➔
Determinar e isolar o ponto de falha;
➔
Reconfigurar a rede para diminuir impacto da
falha;
➔
Reparar a falha e voltar à situação normal de
funcionamento

➔
Registrar, detectar e reagir a condições de falha
da rede
➔
Gerenciamento de falha é o tratamento imediato,
já o gerenciamento de desempenho é a longo
prazo


Exemplos de eventos a serem monitorados

➔
Interfaces de rede down
➔
Serviços parados em servidores
➔
Links de comunicação fora
➔
Taxa de erro em links de comunicação
➔
Ocupação de disco acima de um dado
threshold


Meios para atingir estes objetivos

➔
Utilizar ferramentas e funções de
gerenciamento rápidas e confiáveis;

➔
Utilizar redundância de rotas e
equipamentos para minimizar o impacto
das falhas;

➔
Utilizar uma estratégia de gerenciamento
de falhas redundante.

Gerenciamento de
Configuração
➔
Permite ao administrador saber quais dispositivos
fazem parte da rede administrada

➔
Lidam com a instalação, inicialização, partida,
modificação e registro de parâmetros de
configuração ou opções de hardware e software
de rede.
➔
manter um inventário atualizado e produzir
relatórios baseados nesse inventário.

➔
Reconfigurar a rede em função do desempenho,
expansão ou recuperação de falhas;

➔
RFC-3139 oferece uma visão geral de
gerenciamento de requisitos e de configurações

Gerenciamento de
Configuração
RFC 3139 - Requirements for Configuration
Management of IP-based Networks

➔
Policy Based Management: define um serviço
específico em todos os devices da rede, incluindo
comandos para múltiplos vendors.
➔
SNMP não é aplicado a este nível de gerência
➔
A rede deve ser especificada de forma abstrata em uma
uma network-wide configuration
➔
Existência de tradutores da política network-wide
configuration para configurações específicas de cada
vendor/device

Gerenciamento de
Contabilização
➔
Permite ao administrador da rede que
especifique, registre e controle o acesso de
usuários e dispositivos a recursos da rede.

➔
Monitoração de quanto dos recursos estão sendo
utilizados por usuários ou grupos de usuários

➔
Quotas de utilização
➔
Limitação de uso dos recursos por usuários ou
grupos de usuários

➔
Cobrança por utilização

➔
Alocação de acesso privilegiado a recursos

Gerenciamento de
Segurança
➔
Controlar o acesso aos recursos da rede de
acordo com alguma política definida. Controla o
acesso aos recursos da rede através do uso de
técnicas de autenticação e políticas de
autorização.

➔
Geração, distribuição e armazenamento de
chaves criptográficas e de senhas;

➔
Registro dos logs de Segurança

➔
Proteção dos recursos da rede e das informações
dos usuários

Exemplo de Soluções

FUNCIONALIDADE APLICAÇÃO FABRICANTE
Gerência de desempenho Netclarity Lanquest

Gerência de faltas Spectrum's alarm Aprisma
managers
Manipulação de alarmes Trap exploder Empire
technologies
Gerência de segurança Boks Securix

Gerência de bens Assetview Hp
Configuração Netbuilder 3com
Configuração Cisco works Cisco

Exemplo de Soluções

Detecção de problemas com conectividade:

➔
Traceroute
➔
Ping
➔
Route
➔
Netstat
➔
Ifconfig(linux) / ipconfig(windows)
➔
Iperf (linux)
➔
Iftop (linux)
➔
MTR

Rede sem Gerência

Principais problemas de redes sem gerência

➔
Congestionamento
➔
Má utilização de recursos
➔
Recursos sobrecarregados
➔
Problemas com segurança
➔
Indisponibilidade
➔
Outros ?

Tipos de Gerência
Gerência Reativa

➔
Administrador da rede limita-se a reagir aos
problemas que surgem

➔
Se utiliza de padrões e ferramentas de gerência
para ser alertado de um problema

Tipos de Gerência
Gerência Pró-ativa
➔
Administrador da Rede procura, rotineiramente,
por informações que possam revelar com
antecedência a possibilidade de um problema na
rede

➔
Concentra esforços nos estudos dos avisos
(warnings), que são registros da ocorrência de
uma situação anormal, porém não crítica

➔
Utiliza históricos, estatísticas e o monitoramento
frequente dos eventos relevantes da rede

➔
Mais difícil de ser efetuada que a reativa.
Entretanto, resulta em tempos menores de
parada e economia geral de operação da rede

Métricas

➔
Disponibilidade

➔
MTTR

➔
Tempo de Resposta

➔
Taxa de Erros

➔
Latência

➔
Vazão (Throughput)

➔
Utilização

Métricas
Disponibilidade

“Um sistema de alta disponibilidade é um sistema
informático resistente a falhas de software e
energia, cujo objectivo é manter os serviços
disponibilizados o máximo de tempo possível.”

(Fonte: Wikipedia)

Métricas
Disponibilidade

Níveis de Alta Disponibilidade

Quanto maior a disponibilidade, maior a
Quanto maior a disponibilidade, maior a
redundância e custo das soluções: tudo
redundância e custo das soluções: tudo
depende do tipo de serviço que se pretende
depende do tipo de serviço que se pretende
disponibilizar
disponibilizar

Métricas
Disponibilidade

Cálculo da Disponibilidade

Métricas
MTTR

É o espaço de tempo (médio) que decorre entre a
ocorrência da falha e a total recuperação do sistema
ao seu estado operacional.

(Fonte: Wikipedia)

Métricas
Tempo de Resposta
➔
Tempo decorrido entre a requisição de uma ação
ao sistema e a resposta completa à sua
requisição
➔
Medição Complexa
➔
Depende de diversas variáveis e suas interações

Métricas
Taxa de Erro

➔
Relaciona a quantidade de pacotes, recebidos ou
enviados por uma interface de rede, cujo
conteúdo (em bits) apresenta erro em relação ao
total de pacotes nessa mesma interface.

➔
Normalmente, essa taxa é medida em valores
percentuais dentro do período de monitoramento.

➔
É de difícil detecção e pode ser a causadora de
muitos problemas que serão detectados
posteriormente

Métricas
Latência

➔
Tempo que um pacote leva para ir de um ponto a
outro da rede
➔
Normalmente medido em milisegundos
➔
Quanto menor a latência, melhor o tempo de
resposta da rede

round-trip
delay time

Métricas
Vazão (Throughput)

Throughput (ou taxa de transferência) é a
quantidade de dados transferidos de um lugar a
outro, tem como unidades básicas de medidas o
Kbps, o Mbps e o Gbps. O throughput pode ser
traduzido como a taxa de transferência efetiva de
um sistema. A taxa de transferência efetiva de um
determinado sistema (uma rede de roteadores por
exemplo) pode ser menor que a taxa de entrada
devido às perdas e atrasos no sistema.

(Fonte: Wikipedia)

Throughput é diferente da largura de banda
Throughput é diferente da largura de banda
nominal.
nominal.

Métricas
Utilização
➔
É a quantidade em uso de um determinado
recurso (porcentagem), em relação à sua
capacidade total de atendimento

➔
Auxilia na avaliação e detecção de gargalos, uma
vez que influenciam diretamente no tempo de
resposta da rede e das aplicações envolvidas

➔
Monitorando-se a utilização, ao longo de um
determinado período de tempo, é possível
observar os intervalos de pico na utilização de um
serviço ou recurso

➔
Exemplos: memória disponível, leitura/escrita em
disco, processador (CPU), largura de banda da
rede.

Gerência de Redes: Monitoramento e Controle

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Gerência de Redes: Monitoramento e Controle

Similaire à Gerência de Redes: Monitoramento e Controle (20)

Plus de Frederico Madeira

Plus de Frederico Madeira (20)

Gerência de Redes: Monitoramento e Controle