O documento discute a importância da gerência de redes para monitorar, controlar e garantir o desempenho e funcionamento adequado das redes de computadores. A gerência de redes cobre áreas como desempenho, falhas, configuração, contabilidade e segurança. Métricas como disponibilidade, tempo médio de recuperação, taxa de erros e latência são utilizadas para avaliar a rede.
1. Gerência de Redes
Introdução a
Gerência de Redes
Frederico Madeira
LPIC1, LPIC2, CCNA
fred@madeira.eng.br
www.madeira.eng.br
2. O que é gerenciamento
de rede ?
“Gerenciamento de rede inclui o oferecimento, a
integração e a coordenação de elementos de
hardware, software e humanos, para
monitorar, testar, consultar, configurar, analisar,
avaliar e controlar os recursos da rede, e de
elementos, para satisfazer às exigências
operacionais, de desempenho e de qualidade de
serviço em tempo real a um custo razoável.”
Tuncay Saydam em
From networks and network management into service and service
management
3. Exemplos de sistemas de
controle área de energia
Sala de Controle da Usina de Itaipu
6. MOTIVAÇÃO
➔
O Administrador/piloto pode monitorar os
diversos componentes da usina/aeronave e
analisar os dados
➔
Realizar a gerência reativa
➔
Fazendo ajustes em resposta a modificações
ocorridas no sistema
➔
Realizar a gerência proativa
➔
Detecção de tendências ou comportamentos
anômalos
➔
Execução de ações antes que ocorram
problemas de maior proporção
7. Exemplos de sistemas de
controle
Nas redes de computadores
existe alguma motivação
diferente ?
8. MOTIVAÇÃO
➔
Crescimento das redes:
➔
Número de equipamentos
➔
Diversidade de tecnologias
➔
Diversidade de ambientes operacionais
➔
Extensão/Dispersão da rede
➔
Garantir a qualidade no serviço;
➔
Clientes mais exigentes
➔
Competitividade
➔
Outages
➔
Novos dispositivos/protocolos/arquiteturas de
rede;
➔
Virtualização
➔
Computação na Nuvem
9. MOTIVAÇÃO
➔
Complexidade das redes modernas
➔
Migração de tecnologias legadas para redes de
dados
➔
Telefonia
➔
TV (Streaming / GVT / Netflix / PS3)
➔
Telemetria
➔
Vigilância
➔
Múltiplos fornecedores
➔
Ausência de recursos suficientes para
administrar/monitorar a rede
12. Exemplos de sistemas de
controle
“O administrador de rede deve
monitorar, gerenciar e controlar
ativamente o sistema do qual está
encarregado.”
Kurose e Ross
13. OBJETIVOS
➔
Detecção de falhas
➔
Falhas em interfaces de rede,
Computadores/Servidores, Roteadores, etc
➔
Através do monitoramento de tráfego ou ainda
contadores de performance
➔
Monitoração de Hospedeiro
➔
Acompanhar a disponibilidade dos hosts da
rede
➔
Realizar gerência proativa na ocorrência de
uma falha
➔
Monitoração de Tráfego
➔
A rede pode ser otimizada
➔
Gargalos resolvidos
➔
Novas contratações podem ser iniciadas antes
da exaustão do recurso
14. OBJETIVOS
➔
Detecção de Mudanças rápidas em tablas de
roteamento
➔
Quando muito frequentes, podem indicar
instabilidade em um roteador mal configurado
ou intermitência em links de comunicação
➔
Monitoração de SLA's (Service level
Agreement)
➔
Seja garantido o nível de serviço contratado
➔
Alguns indicadores: Disponibilidade, latência,
throughput, notificação de eventos/atividades
planejadas
➔
É necessário que seja especificado no contrato
15. OBJETIVOS
➔
Detecção de Intrusos
➔
Filtragem de tráfego
➔
Notificação de eventos suspeitos
➔
Aumento de consumo de banda repentino
➔
Aumento de pacotes TCP SYN direcionados
a um único hospedeiro
➔
Conexões a portas de acesso remoto
➔
Autenticações inválidas
16. Modelo de
Gerenciamento de redes
da ISO
A ISO (International Organization for Standarization)
criou um modelo de gereciamento de rede mais
estruturado, baseado em 5 áreas de gerenciamento:
➔
Gerencimaneto de Desempenho
➔
Gerenciamento de Falhas
➔
Gerenciamento de Configurações
➔
Gerenciamento de Contabilização
➔
Gerenciamento de Segurança
17. Gerenciamento de
Desempenho
➔
Quantificar, medir, analisar, informar, analisar e
controlar o desempenho de diferentes
componentes/recursos de rede
➔
Sejam ativos de rede, links, servidores ou ainda
hosts
➔
SNMP desempenha um papel fundamental neste
gerenciamento
➔
Controlar as variáveis da rede para atingir o nível
de desempenho especificado:
➔
Capacidade de Utilização e Quantidade de
Tráfego;
➔
Vazão dos Dados e Tempo de Resposta.
➔
Definição de indicadores de rede
19. Gerenciamento de
Desempenho
➔
Utilizado no planejamento da rede:
➔
Dimensionamento
➔
Identificação de gargalos
➔
Resolução de problemas de performance
➔
Relocação de recursos
➔
Ampliações programadas
20. Gerenciamento de
Desempenho
Exemplos:
➔
Utilização de CPU dos servidores é considerada
OK até 60%, entre 61-85% deve-se iniciar
processo de upgrade, acima de 86% é
considerado crítico
➔
Ocupação dos links da rede devem ser
observados, ao chegar a 70%, deve-se solicitar
ampliação, se links forem redundantes/load
balance, um link não deve ultrapassar 40% de
sua capacidade, pois em situação de falha,
receberá a carga do outro link.
21. Gerenciamento de Falhas
➔
Registrar, detectar e reagir a condições de falha
da rede
➔
Gerenciamento de falha é o tratamento imediato,
já o gerenciamento de desempenho é a longo
prazo
➔
Requer constante observação do funcionamento
dos dispositivos de forma que se possa identificar
rapidamente o problema e resolvê-lo
➔
Gerência proativa de falhas
➔
Determinar e isolar o ponto de falha;
➔
Reconfigurar a rede para diminuir impacto da
falha;
➔
Reparar a falha e voltar à situação normal de
funcionamento
22. Gerenciamento de Falhas
➔
Registrar, detectar e reagir a condições de falha
da rede
➔
Gerenciamento de falha é o tratamento imediato,
já o gerenciamento de desempenho é a longo
prazo
23. Gerenciamento de Falhas
Exemplos de eventos a serem monitorados
➔
Interfaces de rede down
➔
Serviços parados em servidores
➔
Links de comunicação fora
➔
Taxa de erro em links de comunicação
➔
Ocupação de disco acima de um dado
threshold
24. Gerenciamento de Falhas
Meios para atingir estes objetivos
➔
Utilizar ferramentas e funções de
gerenciamento rápidas e confiáveis;
➔
Utilizar redundância de rotas e
equipamentos para minimizar o impacto
das falhas;
➔
Utilizar uma estratégia de gerenciamento
de falhas redundante.
25. Gerenciamento de
Configuração
➔
Permite ao administrador saber quais dispositivos
fazem parte da rede administrada
➔
Lidam com a instalação, inicialização, partida,
modificação e registro de parâmetros de
configuração ou opções de hardware e software
de rede.
➔
manter um inventário atualizado e produzir
relatórios baseados nesse inventário.
➔
Reconfigurar a rede em função do desempenho,
expansão ou recuperação de falhas;
➔
RFC-3139 oferece uma visão geral de
gerenciamento de requisitos e de configurações
26. Gerenciamento de
Configuração
RFC 3139 - Requirements for Configuration
Management of IP-based Networks
➔
Policy Based Management: define um serviço
específico em todos os devices da rede, incluindo
comandos para múltiplos vendors.
➔
SNMP não é aplicado a este nível de gerência
➔
A rede deve ser especificada de forma abstrata em uma
uma network-wide configuration
➔
Existência de tradutores da política network-wide
configuration para configurações específicas de cada
vendor/device
27. Gerenciamento de
Contabilização
➔
Permite ao administrador da rede que
especifique, registre e controle o acesso de
usuários e dispositivos a recursos da rede.
➔
Monitoração de quanto dos recursos estão sendo
utilizados por usuários ou grupos de usuários
➔
Quotas de utilização
➔
Limitação de uso dos recursos por usuários ou
grupos de usuários
➔
Cobrança por utilização
➔
Alocação de acesso privilegiado a recursos
28. Gerenciamento de
Segurança
➔
Controlar o acesso aos recursos da rede de
acordo com alguma política definida. Controla o
acesso aos recursos da rede através do uso de
técnicas de autenticação e políticas de
autorização.
➔
Geração, distribuição e armazenamento de
chaves criptográficas e de senhas;
➔
Registro dos logs de Segurança
➔
Proteção dos recursos da rede e das informações
dos usuários
29. Exemplo de Soluções
FUNCIONALIDADE APLICAÇÃO FABRICANTE
Gerência de desempenho Netclarity Lanquest
Gerência de faltas Spectrum's alarm Aprisma
managers
Manipulação de alarmes Trap exploder Empire
technologies
Gerência de segurança Boks Securix
Gerência de bens Assetview Hp
Configuração Netbuilder 3com
Configuração Cisco works Cisco
30. Exemplo de Soluções
Detecção de problemas com conectividade:
➔
Traceroute
➔
Ping
➔
Route
➔
Netstat
➔
Ifconfig(linux) / ipconfig(windows)
➔
Iperf (linux)
➔
Iftop (linux)
➔
MTR
31. Rede sem Gerência
Principais problemas de redes sem gerência
➔
Congestionamento
➔
Má utilização de recursos
➔
Recursos sobrecarregados
➔
Problemas com segurança
➔
Indisponibilidade
➔
Outros ?
32. Tipos de Gerência
Gerência Reativa
➔
Administrador da rede limita-se a reagir aos
problemas que surgem
➔
Se utiliza de padrões e ferramentas de gerência
para ser alertado de um problema
33. Tipos de Gerência
Gerência Pró-ativa
➔
Administrador da Rede procura, rotineiramente,
por informações que possam revelar com
antecedência a possibilidade de um problema na
rede
➔
Concentra esforços nos estudos dos avisos
(warnings), que são registros da ocorrência de
uma situação anormal, porém não crítica
➔
Utiliza históricos, estatísticas e o monitoramento
frequente dos eventos relevantes da rede
➔
Mais difícil de ser efetuada que a reativa.
Entretanto, resulta em tempos menores de
parada e economia geral de operação da rede
34. Métricas
➔
Disponibilidade
➔
MTTR
➔
Tempo de Resposta
➔
Taxa de Erros
➔
Latência
➔
Vazão (Throughput)
➔
Utilização
35. Métricas
Disponibilidade
“Um sistema de alta disponibilidade é um sistema
informático resistente a falhas de software e
energia, cujo objectivo é manter os serviços
disponibilizados o máximo de tempo possível.”
(Fonte: Wikipedia)
36. Métricas
Disponibilidade
Níveis de Alta Disponibilidade
Quanto maior a disponibilidade, maior a
Quanto maior a disponibilidade, maior a
redundância e custo das soluções: tudo
redundância e custo das soluções: tudo
depende do tipo de serviço que se pretende
depende do tipo de serviço que se pretende
disponibilizar
disponibilizar
38. Métricas
MTTR
É o espaço de tempo (médio) que decorre entre a
ocorrência da falha e a total recuperação do sistema
ao seu estado operacional.
(Fonte: Wikipedia)
39. Métricas
Tempo de Resposta
➔
Tempo decorrido entre a requisição de uma ação
ao sistema e a resposta completa à sua
requisição
➔
Medição Complexa
➔
Depende de diversas variáveis e suas interações
40. Métricas
Taxa de Erro
➔
Relaciona a quantidade de pacotes, recebidos ou
enviados por uma interface de rede, cujo
conteúdo (em bits) apresenta erro em relação ao
total de pacotes nessa mesma interface.
➔
Normalmente, essa taxa é medida em valores
percentuais dentro do período de monitoramento.
➔
É de difícil detecção e pode ser a causadora de
muitos problemas que serão detectados
posteriormente
41. Métricas
Latência
➔
Tempo que um pacote leva para ir de um ponto a
outro da rede
➔
Normalmente medido em milisegundos
➔
Quanto menor a latência, melhor o tempo de
resposta da rede
round-trip
delay time
42. Métricas
Vazão (Throughput)
Throughput (ou taxa de transferência) é a
quantidade de dados transferidos de um lugar a
outro, tem como unidades básicas de medidas o
Kbps, o Mbps e o Gbps. O throughput pode ser
traduzido como a taxa de transferência efetiva de
um sistema. A taxa de transferência efetiva de um
determinado sistema (uma rede de roteadores por
exemplo) pode ser menor que a taxa de entrada
devido às perdas e atrasos no sistema.
(Fonte: Wikipedia)
Throughput é diferente da largura de banda
Throughput é diferente da largura de banda
nominal.
nominal.
43. Métricas
Utilização
➔
É a quantidade em uso de um determinado
recurso (porcentagem), em relação à sua
capacidade total de atendimento
➔
Auxilia na avaliação e detecção de gargalos, uma
vez que influenciam diretamente no tempo de
resposta da rede e das aplicações envolvidas
➔
Monitorando-se a utilização, ao longo de um
determinado período de tempo, é possível
observar os intervalos de pico na utilização de um
serviço ou recurso
➔
Exemplos: memória disponível, leitura/escrita em
disco, processador (CPU), largura de banda da
rede.