Successfully reported this slideshow.
Haute disponibilité
Haute disponibilité et Tolérance de
Panne
Date 13 Octobre 2009
Groupe 14
Auteur(s) BOUKHOBZA Elior
Res...
Haute disponibilité
Plan
I. Définitions
II. Clustering
III. Load Balancing
IV. Redondance
V. Réplication des données
VI. C...
Haute disponibilité
Introduction
What is the High Availability?
o A Highly Available material is a material
providing full...
Haute disponibilité
Introduction
Why high availability?
o In a company, the information system requires to be
fully availa...
Haute disponibilité
DÉFINITIONS
23/07/2015 5Groupe 14: Boukhobza Elior
Haute disponibilité
Définitions
Plan
1. Critères DICP
2. Indicateurs de disponibilité
3. Classification en Tiers
23/07/201...
Haute disponibilité
Définitions
Critères DICP
Critères DICP-R
o On classifie la sécurité d’un système grâce aux « Critères...
Haute disponibilité
Définitions
Indicateurs de disponibilité (1/3)
MTTF, MTBF, MTTR, MUT, MDT
o MTTF: Mean Time To Failure...
Haute disponibilité
Définitions
Indicateurs de disponibilité (2/3)
o MDT: Mean Down Time (Temps Moyen
d’indisponibilité)
...
Haute disponibilité
Définitions
Indicateurs de disponibilité (3/3)
Taux de disponibilité Durée d’indisponibilité sur un an...
Haute disponibilité
Définitions
Classification en Tier (1/3)
Classification en Tier:
o Une autre définition de la disponib...
Haute disponibilité
Définitions
Classification en Tier (2/3)
•1 alimentation électrique/refroidissement
•Pas de redondance...
Haute disponibilité
Définitions
Classification en Tier (3/3)
23/07/2015 Groupe 14: Boukhobza Elior 13
Classification en Ti...
Haute disponibilité
CLUSTERING
23/07/2015 Groupe 14: Boukhobza Elior 14
Haute disponibilité
Clustering
Plan
1. Définition
2. Fonctionnalités
3. Types de clusters
4. Architectures en cluster
5. D...
Haute disponibilité
Clustering
Définition (1/2)
Cluster = Grappe de serveurs ou Ferme de serveurs.
Le principe d’un cluste...
Haute disponibilité
Clustering
Définition (2/2)
23/07/2015 Groupe 14: Boukhobza Elior 17
Simple architecture en cluster
Haute disponibilité
Clustering
Fonctionnalités
Les fonctionnalités que doit offrir un cluster sont:
o Basculement de servi...
Haute disponibilité
Clustering
Types de clusters
On distingue plusieurs types de clusters, selon les
fonctionnalités:
o Cl...
Haute disponibilité
Clustering
Architectures en cluster (1/5)
Configuration « Actif/Passif »:
o Cluster de deux nœuds.
o L...
Haute disponibilité
Clustering
Architectures en cluster (2/5)
23/07/2015 Groupe 14: Boukhobza Elior 21
Cluster et basculem...
Haute disponibilité
Clustering
Architectures en cluster (3/5)
Principe:
o Le client entre l’@IP virtuelle 192.168.X.254
o ...
Haute disponibilité
Clustering
Architectures en cluster (4/5)
Configuration Actif/Actif:
o Les deux nœuds sont actifs et s...
Haute disponibilité
Clustering
Architectures en cluster (5/5)
Configuration N to 1:
o A la différence du N+1, lorsque le n...
Haute disponibilité
Clustering
Détection de pannes
Détection de pannes :
o Requêtes Push:
 Le nœud actif envoie des signa...
Haute disponibilité
Clustering
Outils (1/3)
Heartbeat: Outil de surveillance des systèmes.
Outil implémentant la surveilla...
Haute disponibilité
Clustering
Outils (2/3)
MON: Service Monitory Daemon
C’est un démon de supervision des services.
Il pe...
Haute disponibilité
Clustering
Outils (3/3)
FailSafe: Outil similaire à Heartbeat, de la
marque SGI.
Permet de supporter j...
Haute disponibilité
LOAD BALANCING
23/07/2015 Groupe 14: Boukhobza Elior 29
Haute disponibilité
Load Balancing
Plan
1. Définitions
2. Architectures de répartition de charge
3. Algorithmes de réparti...
Haute disponibilité
Load Balancing
Définitions
Load Balancing : Equilibre de charge ou répartition
de charge.
Il consiste ...
Haute disponibilité
Load Balancing
Architectures (1/4)
Schéma classique d’une architecture load-balancée :
o Un cluster de...
Haute disponibilité
Load Balancing
Architectures (2/4)
Principe:
o Le client s’adresse au load-balancer actif via
l’@IP vi...
Haute disponibilité
Load Balancing
Architectures (3/4)
Si le load-balancer agit
comme une passerelle:
o Utilisation du NAT...
Haute disponibilité
Load Balancing
Architectures (4/4)
Si le load-balancer est
sur le même cluster
que les serveurs:
o Le ...
Haute disponibilité
Load Balancing
Algorithmes de répartition (1/2)
Round-Robin:
o Distribution de la charge équitablement...
Haute disponibilité
Load Balancing
Algorithmes de répartition (2/2)
Least Connection:
o Envoie les requêtes au serveur gér...
Haute disponibilité
Load Balancing
Gestion des sessions (1/4)
Contexte:
o Dans certaines applications, une session peut se...
Haute disponibilité
Load Balancing
Gestion des sessions (2/4)
Plusieurs solutions pour gérer les états des sessions:
o L’é...
Haute disponibilité
Load Balancing
Gestion des sessions (3/4)
2 solutions:
o Gestion centralisée.
o Gestion asynchrone.
Ge...
Haute disponibilité
Load Balancing
Gestion des sessions (4/4)
Gestion centralisée Gestion asynchrone
23/07/2015 Groupe 14:...
Haute disponibilité
Load Balancing
Outils (1/2)
LVS: Linux Virtual Server
C’est un serveur virtuel agissant comme load bal...
Haute disponibilité
Load Balancing
Outils (2/2)
23/07/2015 Groupe 14: Boukhobza Elior 43
LVS par NAT LVS par Tunnel IP
Haute disponibilité
REDONDANCE
23/07/2015 Groupe 14: Boukhobza Elior 44
Haute disponibilité
Redondance
Plan
1. Concepts
2. Redondance bas niveau
3. Redondance couche liaison
1. STP, RSTP, MST
2....
Haute disponibilité
Redondance
Concepts
Procédé qui consiste à multiplier les éléments afin
d’assurer les fonctions en cas...
Haute disponibilité
Redondance
Redondance bas niveau (1/2)
Redondance bas niveau = redondance au niveau matériel et
câblag...
Haute disponibilité
Redondance
Redondance bas niveau (2/2)
23/07/2015 Groupe 14: Boukhobza Elior 48
Exemple de matériel ha...
Haute disponibilité
Redondance liaison
Spanning Tree Protocol (1/3)
STP: Spanning Tree Protocol (802.1D)
C’est un protocol...
Haute disponibilité
Redondance liaison
Spanning Tree Protocol (2/3)
23/07/2015 Groupe 14: Boukhobza Elior 50
Le Protocole ...
Haute disponibilité
Redondance liaison
Spanning Tree Protocol (3/3)
Evolutions de STP:
o RSTP (Rapid STP, 802.1w) version ...
Haute disponibilité
Redondance liaison
LACP, EtherChannel (1/2)
LACP: Link Aggregation Control Protocol (802.3ad)
Protocol...
Haute disponibilité
Redondance liaison
LACP, EtherChannel (2/2)
23/07/2015 Groupe 14: Boukhobza Elior 53
Cisco EtherChannel
Haute disponibilité
Redondance réseau
VRRP, HSRP (1/2)
VRRP: Virtual Router Redundancy Protocol (RFC 3768)
Protocole perme...
Haute disponibilité
Redondance réseau
VRRP, HSRP (2/2)
23/07/2015 Groupe 14: Boukhobza Elior 55
VRRP - HSRP
Haute disponibilité
Redondance réseau
GLBP
GLBP: Gateway Load Balancing Protocol
Protocole propriétaire Cisco qui ajoute d...
Haute disponibilité
Redondance
Redondance applicative (1/3)
Redonder les éléments
actifs: Serveur web, base de
données, ER...
Haute disponibilité
Redondance
Redondance applicative (2/3)
Teaming: Permet de regrouper plusieurs interfaces
réseau en un...
Haute disponibilité
Redondance
Redondance applicative (3/3)
Autre solution pour mettre de la
redondance: Virtualisation.
D...
Haute disponibilité
RÉPLICATION DES DONNÉES
23/07/2015 Groupe 14: Boukhobza Elior 60
Haute disponibilité
Réplication des données
Plan
1. Concepts
2. Réplication matérielle
1. RAID
2. DRBD
3. ENBD
3. Systèmes...
Haute disponibilité
Réplication des données
Concepts (1/3)
Ajouter de la redondance ne suffit pas à assurer la
haute dispo...
Haute disponibilité
Réplication des données
Concepts (2/3)
Solution de stockage des données: le NAS (Network
Attached Stor...
Haute disponibilité
Réplication des données
Concepts (3/3)
Autre dispositif de stockage: le SAN (Storage Area
Network). C’...
Haute disponibilité
Réplication matérielle
RAID (1/4)
RAID: Redundant Array of Inexpensive Disks.
Technologie permettant d...
Haute disponibilité
Réplication matérielle
RAID (2/4)
•Répartit les données sur l’ensemble des disques
•Vitesse de transfe...
Haute disponibilité
Réplication matérielle
RAID (3/4)
•Comme le RAID 3 mais des blocs à la place des bits
•Meilleure gesti...
Haute disponibilité
Réplication matérielle
RAID (4/4)
Avantages du RAID:
o La sécurité: RAID 1 et RAID 5 offrent un niveau...
Haute disponibilité
Réplication matérielle
DRBD
DRBD (Distributed Replicated Block Device)
Logiciel de réplication distant...
Haute disponibilité
Réplication matérielle
ENBD
ENBD: Enhanced Network Block Device
Evolution de Linux NBD.
Permet d’accéd...
Haute disponibilité
Réplication des données
Systèmes de fichiers (1/2)
Intérêt: disposer au sein du disque un système de f...
Haute disponibilité
Réplication des données
Systèmes de fichiers (2/2)
Tableau présentant quelques systèmes de
fichiers et...
Haute disponibilité
CONCLUSION
23/07/2015 Groupe 14: Boukhobza Elior 73
Haute disponibilité
Conclusion
La HD dans les faits (1/2)
En utilisant toutes les connaissances acquises dans cet état de ...
Haute disponibilité
Conclusion
La HD dans les faits (2/2)
Dans cette architecture:
o Tous les éléments sont redondés: rout...
Haute disponibilité
Conclusion
Les acteurs de la HD (1/2)
Concrètement, il existe des solutions de
serveurs offrant de la ...
Haute disponibilité
Conclusion
Les acteurs de la HD (2/2)
23/07/2015 Groupe 14: Boukhobza Elior 77
Magic Quadrant of HA ve...
Haute disponibilité
Conclusion
Exemple
L’architecture de Wikipedia
23/07/2015 Groupe 14: Boukhobza Elior 78
Haute disponibilité
Conclusion
Nowadays, many solutions provide high availability and
fault tolerance to IS architectures ...
Haute disponibilité
Questions?
23/07/2015 Groupe 14: Boukhobza Elior 80
Prochain SlideShare
Chargement dans…5
×

Haute Disponibilité et Tolérance de Panne

2 895 vues

Publié le

  • Soyez le premier à commenter

Haute Disponibilité et Tolérance de Panne

  1. 1. Haute disponibilité Haute disponibilité et Tolérance de Panne Date 13 Octobre 2009 Groupe 14 Auteur(s) BOUKHOBZA Elior Responsable Mr. Alain Stephan Promo TCOM 2010
  2. 2. Haute disponibilité Plan I. Définitions II. Clustering III. Load Balancing IV. Redondance V. Réplication des données VI. Conclusion 23/07/2015 2Groupe 14: Boukhobza Elior
  3. 3. Haute disponibilité Introduction What is the High Availability? o A Highly Available material is a material providing full-time availability even when failures occurs. What is the Fault Tolerance? o The Fault Tolerance is the capacity of a material to ensure the data availability in case of a failure occurs. It provides full-time checking and redundancy devices to perform high availability. 23/07/2015 3Groupe 14: Boukhobza Elior
  4. 4. Haute disponibilité Introduction Why high availability? o In a company, the information system requires to be fully available 100% (or most) of the time. o If a failure occurs in the system (device crash, human error…), or in the building (fire, flooding…), or even in the region (earthquake, war…), the IS needs to be available and functional otherwise it would be fatal for the company. o That’s why having a material fully available is vital for a company to ensure its business without fear of failures or disasters in the IS. 23/07/2015 4Groupe 14: Boukhobza Elior
  5. 5. Haute disponibilité DÉFINITIONS 23/07/2015 5Groupe 14: Boukhobza Elior
  6. 6. Haute disponibilité Définitions Plan 1. Critères DICP 2. Indicateurs de disponibilité 3. Classification en Tiers 23/07/2015 Groupe 14: Boukhobza Elior 6
  7. 7. Haute disponibilité Définitions Critères DICP Critères DICP-R o On classifie la sécurité d’un système grâce aux « Critères DICP », c’est-à-dire: o D: Disponibilité  C’est-à-dire que le système doit pouvoir être disponible à toute heure. o I: Intégrité  C’est la capacité au système d’assurer que les informations sont exactes. o C: Confidentialité  C’est la capacité au système d’assurer que les données ne peuvent être accédées que par les personnes ayant accès. o P: Preuve  La preuve concerne la non répudiation, c’est-à-dire l’impossibilité de nier avoir effectué telle ou telle action. o On parle aussi de DICP-R, R pour règlementation. Ce sont les règles que le système doit respecter. 23/07/2015 Groupe 14: Boukhobza Elior 7
  8. 8. Haute disponibilité Définitions Indicateurs de disponibilité (1/3) MTTF, MTBF, MTTR, MUT, MDT o MTTF: Mean Time To Failure (Temps Moyen Avant Panne)  C’est le temps moyen avant l’apparition d’une panne d’un composant du système. On souhaite que cet indicateur soit le plus grand possible. o MTBF: Mean Time Between Failures (Temps Moyen Inter- pannes)  C’est le temps moyen entre deux pannes survenant sur un composant du système. Plus cet indicateur est grand, plus le système est considéré comme fiable. o MTTR: Mean Time To Repair (Temps Moyen de Réparation)  C’est le temps moyen nécessaire à la réparation d’un composant survenu lors d’une panne. A l’inverse, on souhaite que cet indicateur soit le plus petit possible. o MTBF = MTTF + MTTR. 23/07/2015 Groupe 14: Boukhobza Elior 8
  9. 9. Haute disponibilité Définitions Indicateurs de disponibilité (2/3) o MDT: Mean Down Time (Temps Moyen d’indisponibilité)  C’est le temps moyen d’indisponibilité d’un composant lors d’une panne quelconque. o MUT: Mean Up Time (Temps Moyen de disponibilité)  C’est le temps moyen de disponibilité du composant après sa réparation avant qu’il ne retombe en panne. o MTBF = MUT + MDT o Disponibilité = MTTF / MTBF 23/07/2015 Groupe 14: Boukhobza Elior 9
  10. 10. Haute disponibilité Définitions Indicateurs de disponibilité (3/3) Taux de disponibilité Durée d’indisponibilité sur un an 97% 11 jours 98% 7 jours 99% 3 jours et 15 heures 99,9% 8 heures et 48 minutes 99,99% 53 minutes 99,999% 5 minutes 99,9999% 32 secondes 23/07/2015 Groupe 14: Boukhobza Elior 10 Source: Wikipedia
  11. 11. Haute disponibilité Définitions Classification en Tier (1/3) Classification en Tier: o Une autre définition de la disponibilité est la classification en Tier, créé par l’Uptime Institute. o Permet de classifier les datacenter selon un niveau de disponibilité entre 99% et 100%. o Plus le matériel a un niveau de Tier élevé, plus il est coûteux, mais aura un meilleur taux de disponibilité. 23/07/2015 Groupe 14: Boukhobza Elior 11
  12. 12. Haute disponibilité Définitions Classification en Tier (2/3) •1 alimentation électrique/refroidissement •Pas de redondance des composants •Taux de disponibilité de 99,671% Tier I: •1 alimentation électrique/refroidissement •Redondance des composants •Taux de disponibilité de 99,741% Tier II: •Redondance électrique/refroidissement mais 1 seul actif •Redondance des composants •Taux de disponibilité de 99,982% Tier III: •Redondance électrique/refroidissement, tous actifs •Redondance des composants •Taux de disponibilité de 99,995% Tier IV: 23/07/2015 Groupe 14: Boukhobza Elior 12
  13. 13. Haute disponibilité Définitions Classification en Tier (3/3) 23/07/2015 Groupe 14: Boukhobza Elior 13 Classification en Tiers de l’Uptime Institute
  14. 14. Haute disponibilité CLUSTERING 23/07/2015 Groupe 14: Boukhobza Elior 14
  15. 15. Haute disponibilité Clustering Plan 1. Définition 2. Fonctionnalités 3. Types de clusters 4. Architectures en cluster 5. Détection de pannes 6. Outils 23/07/2015 Groupe 14: Boukhobza Elior 15
  16. 16. Haute disponibilité Clustering Définition (1/2) Cluster = Grappe de serveurs ou Ferme de serveurs. Le principe d’un cluster est de regrouper plusieurs serveurs indépendants appelés nœuds en un seul et même serveur, de façon transparente pour le client. Ainsi, si l’un des nœuds du cluster tombe, le service continue, assurant ainsi la disponibilité des services. Les nœuds n’ont pas besoin d’être proches physiquement. Il suffit qu’ils soient interconnectés entre eux par un ou plusieurs réseaux (LAN, WAN…) pour en faire un cluster. 23/07/2015 Groupe 14: Boukhobza Elior 16
  17. 17. Haute disponibilité Clustering Définition (2/2) 23/07/2015 Groupe 14: Boukhobza Elior 17 Simple architecture en cluster
  18. 18. Haute disponibilité Clustering Fonctionnalités Les fonctionnalités que doit offrir un cluster sont: o Basculement de service: Lors d’une panne, le service est transféré sur un nœud fonctionnel: Fail Over Service. o Détection de pannes: Guetter les pannes pour basculer le service sans interruption. Elles sont en général couplées à d’autres fonctionnalités pour assurer la disponibilité: o Distribution de charge o Réplication des données o Intégrité des données… 23/07/2015 Groupe 14: Boukhobza Elior 18
  19. 19. Haute disponibilité Clustering Types de clusters On distingue plusieurs types de clusters, selon les fonctionnalités: o Clusters de haute disponibilité o Clusters de calcul o Clusters d’équilibrage de charge o Clusters d’applications… Différentes configurations selon le type de services: o Actif/Actif o Actif/Passif o N+1 o N+M o N to 1 o N to N 23/07/2015 Groupe 14: Boukhobza Elior 19
  20. 20. Haute disponibilité Clustering Architectures en cluster (1/5) Configuration « Actif/Passif »: o Cluster de deux nœuds. o Le nœud principal (ou nœud maître) exécutant les services. o Le nœud secondaire (ou nœud esclave), de secours. o Un ou plusieurs liens dédiés entre les deux nœuds pour le basculement de service. Adressage IP: o Chaque nœud a sa propre adresse IP réelle. o Au cluster est associée une adresse IP virtuelle (ou alias IP), qui va pointer sur le nœud actif (NAT). o Si le nœud actif tombe, l’alias IP pointe sur le nœud de secours. 23/07/2015 Groupe 14: Boukhobza Elior 20
  21. 21. Haute disponibilité Clustering Architectures en cluster (2/5) 23/07/2015 Groupe 14: Boukhobza Elior 21 Cluster et basculement de service
  22. 22. Haute disponibilité Clustering Architectures en cluster (3/5) Principe: o Le client entre l’@IP virtuelle 192.168.X.254 o Cette adresse pointe vers le nœud principal A. o Le nœud A tombe, B détecte que A est tombé. o Grâce au lien dédié, le service bascule vers B. o L’adresse IP virtuelle pointe alors sur B. o Lorsque A est réparé, le service bascule vers A et l’@IP virtuelle pointe vers A. o Le client ne détecte aucun changement. 23/07/2015 Groupe 14: Boukhobza Elior 22
  23. 23. Haute disponibilité Clustering Architectures en cluster (4/5) Configuration Actif/Actif: o Les deux nœuds sont actifs et se répartissent la charge. o Si l’un des nœuds tombe, le service est basculé sur le nœud restant. o Lorsque le nœud défaillant fonctionne, la charge est à nouveau répartie entre les deux nœuds. Configuration N+1: o Architectures de N nœuds, et un nœud de secours. o Si l’un des nœuds tombe, le service est basculé sur le nœud de secours. o Lorsque le nœud est rétabli, il devient le nœud de secours. o SPOF si plusieurs nœuds tombent en même temps. Configuration N+M: o N nœuds actifs et M nœuds de secours. o Le nombre de nœuds de secours dépend du degré de disponibilité requis pour assurer le service. 23/07/2015 Groupe 14: Boukhobza Elior 23
  24. 24. Haute disponibilité Clustering Architectures en cluster (5/5) Configuration N to 1: o A la différence du N+1, lorsque le nœud défaillant est rétabli, le service bascule vers ce nœud. o Deux basculements de service. Configuration N to N: o Pas de nœuds de secours. o Si un des nœuds tombe, la charge est redistribuée sur les N-1 nœuds restants. o Lorsque le nœud est rétabli, la charge est redistribuée en conséquence. o Nécessite des nœuds à plus grande capacité. 23/07/2015 Groupe 14: Boukhobza Elior 24
  25. 25. Haute disponibilité Clustering Détection de pannes Détection de pannes : o Requêtes Push:  Le nœud actif envoie des signaux au nœud passif à intervalles réguliers.  Si le nœud passif ne reçoit pas de signaux au bout d’un certain temps, il détermine qu’il y’a panne et active le basculement de service. o Requêtes Pull:  Le nœud passif envoie des signaux au nœud actif à intervalles réguliers.  Si il ne reçoit pas de réponse, il continue d’émettre des signaux car ca peut provenir d’un problème sur le lien.  Au bout d’un certain nombre de tentatives, il détermine qu’il y’a panne et active le basculement de service. o C’est communément appelé « Heartbeat ». 23/07/2015 Groupe 14: Boukhobza Elior 25
  26. 26. Haute disponibilité Clustering Outils (1/3) Heartbeat: Outil de surveillance des systèmes. Outil implémentant la surveillance et le basculement de services à l’aide de scripts. Caractéristiques: o Les services (applications) sont démarrés avec Heartbeat sur le nœud actif. o Il permet d’arrêter et de démarrer les services manuellement, dans ce cas les services sont basculés sur le nœud de secours. o Cet outil permet de détecter les pannes matérielles et réseau et d’exécuter des scripts de basculement en cas de panne. o Utilisé avec l’outil « Mon », on peut désormais faire de la surveillance applicative. o Heartbeat permet aussi le contrôle d’une application « STONITH » (« Shoot The Other Node In The Head »), procédé qui consiste à désactiver le nœud à distance en cas de problème. Logiciel sous licence GPL, du projet « Linux-HA ». 23/07/2015 Groupe 14: Boukhobza Elior 26
  27. 27. Haute disponibilité Clustering Outils (2/3) MON: Service Monitory Daemon C’est un démon de supervision des services. Il permet de détecter des défaillances applicatives et de les arrêter/redémarrer manuellement. Caractéristiques: o Marche/arrêt de serveurs o Marche/arrêt de services o Consultation de l’état des services o Surveillance des ressources o Envoi de tests (traps) pour tester l’état d’un service/serveur. Il est utilisé avec Heartbeat pour faire de la surveillance applicative. Sous licence GPL. 23/07/2015 Groupe 14: Boukhobza Elior 27
  28. 28. Haute disponibilité Clustering Outils (3/3) FailSafe: Outil similaire à Heartbeat, de la marque SGI. Permet de supporter jusqu’à des clusters de 16 nœuds. 23/07/2015 Groupe 14: Boukhobza Elior 28
  29. 29. Haute disponibilité LOAD BALANCING 23/07/2015 Groupe 14: Boukhobza Elior 29
  30. 30. Haute disponibilité Load Balancing Plan 1. Définitions 2. Architectures de répartition de charge 3. Algorithmes de répartition de charge 4. Gestion des états de sessions 5. Outils 23/07/2015 Groupe 14: Boukhobza Elior 30
  31. 31. Haute disponibilité Load Balancing Définitions Load Balancing : Equilibre de charge ou répartition de charge. Il consiste à distribuer la charge aux nœuds d’un cluster. Un load-balancer est un serveur qui dispose de différents algorithmes d’équilibrage de charge. Dans les architectures communes, ce serveur est redondé pour éviter les SPOF. Le load-balancing permet d’équilibrer le trafic réseau et d’assurer la disponibilité des services en dirigeant les requêtes vers les nœuds actifs. 23/07/2015 Groupe 14: Boukhobza Elior 31
  32. 32. Haute disponibilité Load Balancing Architectures (1/4) Schéma classique d’une architecture load-balancée : o Un cluster de services. o Un cluster de load-balancers: un actif et un passif o Un lien dédié entre les deux load-balancers pour le basculement de service. 23/07/2015 Groupe 14: Boukhobza Elior 32
  33. 33. Haute disponibilité Load Balancing Architectures (2/4) Principe: o Le client s’adresse au load-balancer actif via l’@IP virtuelle qui lui est fournie. o Le load-balancer actif relaye la requête vers le ou les nœuds du cluster de services. o Pour la réponse, plusieurs solutions sont possibles, dépendant de l’architecture. 23/07/2015 Groupe 14: Boukhobza Elior 33
  34. 34. Haute disponibilité Load Balancing Architectures (3/4) Si le load-balancer agit comme une passerelle: o Utilisation du NAT pour translater l’@IP virtuelle vers l’@IP réelle du serveur actif. o Le serveur actif retourne la réponse au load- balancer. o Le load-balancer renvoie alors la réponse au client. o Le cluster de services est inaccessible directement. 23/07/2015 Groupe 14: Boukhobza Elior 34
  35. 35. Haute disponibilité Load Balancing Architectures (4/4) Si le load-balancer est sur le même cluster que les serveurs: o Le load-balancer s’occupe toujours de relayer vers le serveur actif. o Mais la réponse est renvoyée directement au client. o Inconvénient: Le cluster de services n’est plus privé. 23/07/2015 Groupe 14: Boukhobza Elior 35
  36. 36. Haute disponibilité Load Balancing Algorithmes de répartition (1/2) Round-Robin: o Distribution de la charge équitablement à chaque serveur. o Avantages :  Très simple à mettre en place et très rapide. o Inconvénients :  Ne tient pas compte de facteurs extérieurs tels que le nombre de connexions ou le temps de réponse.  Un serveur surchargé continuera de recevoir des requêtes pendant que d’autres serveurs n’utiliseront que peu de leurs ressources. Weighted Round-Robin: o Chaque serveur est assigné d’un « poids » qui détermine le taux de sollicitation du serveur. o Avantages:  Aussi rapide que Round-Robin  Tient compte des facteurs extérieurs. o Inconvénients:  Peu intéressant pour des serveurs de même type. 23/07/2015 Groupe 14: Boukhobza Elior 36
  37. 37. Haute disponibilité Load Balancing Algorithmes de répartition (2/2) Least Connection: o Envoie les requêtes au serveur gérant le moins de connexions entrantes. o Avantages:  Les requêtes sont équitablement réparties o Inconvénients:  Ne tient pas compte des capacités de la machine Weighted Least Connection o La variante pondérée de Least Connection Load Based: o Envoie les requêtes aux serveurs ayant la charge la plus faible. o Avantages:  Meilleure répartition de la charge o Inconvénients  Ne tient pas compte des capacités de la machine 23/07/2015 Groupe 14: Boukhobza Elior 37
  38. 38. Haute disponibilité Load Balancing Gestion des sessions (1/4) Contexte: o Dans certaines applications, une session peut se dérouler en plusieurs étapes, qu’on appelle « états de session ». o Chaque étape ne s’active que lorsque l’étape précédente est validée. o Par exemple, un achat sur Internet se fait en 3 étapes: le choix de l’article, le remplissage des informations utilisateur et le remplissage des coordonnées bancaires. o Les applications situées dans les serveurs distants doivent pouvoir suivre le changement d’état de session pour assurer la continuité. 23/07/2015 Groupe 14: Boukhobza Elior 38
  39. 39. Haute disponibilité Load Balancing Gestion des sessions (2/4) Plusieurs solutions pour gérer les états des sessions: o L’état est stocké chez le client. o L’état est stocké sur le serveur distant. o L’état est stocké sur un serveur intermédiaire. Si l’état est stocké chez le client: o Le client envoie les requêtes de chaque état avec les informations de la session. o Le ou les serveurs traitent ces requêtes unitairement. Si l’état est stocké sur le serveur distant: o le load-balancer redirige toutes les requêtes propres à la session sur le serveur en question. o Problème: Si le serveur en question tombe au cours de la session, le client perd toutes les informations relatives aux états précédents. Solution: Une gestion habile des sessions. 23/07/2015 Groupe 14: Boukhobza Elior 39
  40. 40. Haute disponibilité Load Balancing Gestion des sessions (3/4) 2 solutions: o Gestion centralisée. o Gestion asynchrone. Gestion centralisée: o Les états sont stockés sur un serveur à un niveau différent des serveurs d’application. o Lors de la réception d’une requête, le serveur d’application récupère l’état de session du serveur d’états. Gestion asynchrone: o Chaque serveur diffuse aux autres serveurs l’état de la session lorsque celui-ci change. o Chacun d’eux peut donc traiter une requête propre à un état de session. Si l’un d’eux tombe, un autre prendra le relais. o Plus économique que la gestion centralisée, mais plus complexe à mettre en place. 23/07/2015 Groupe 14: Boukhobza Elior 40
  41. 41. Haute disponibilité Load Balancing Gestion des sessions (4/4) Gestion centralisée Gestion asynchrone 23/07/2015 Groupe 14: Boukhobza Elior 41
  42. 42. Haute disponibilité Load Balancing Outils (1/2) LVS: Linux Virtual Server C’est un serveur virtuel agissant comme load balancer sur un cluster. Supporte 3 types de routage des requêtes: o Routage par NAT o Routage par tunneling IP o Routage direct Supporte les algorithmes de répartition de charge: o Round Robin o Weighted Round Robin o Least Connection o Weighted Least connection o Autres algorithmes (Load Based, etc…) Sous licence GPL Quelques interfaces graphiques disponibles: UltraMonkey, Piranha 23/07/2015 Groupe 14: Boukhobza Elior 42
  43. 43. Haute disponibilité Load Balancing Outils (2/2) 23/07/2015 Groupe 14: Boukhobza Elior 43 LVS par NAT LVS par Tunnel IP
  44. 44. Haute disponibilité REDONDANCE 23/07/2015 Groupe 14: Boukhobza Elior 44
  45. 45. Haute disponibilité Redondance Plan 1. Concepts 2. Redondance bas niveau 3. Redondance couche liaison 1. STP, RSTP, MST 2. LACP, EtherChannel 4. Redondance couche réseau 1. VRRP, HSRP 2. GLBP 5. Redondance couche applicative 23/07/2015 Groupe 14: Boukhobza Elior 45
  46. 46. Haute disponibilité Redondance Concepts Procédé qui consiste à multiplier les éléments afin d’assurer les fonctions en cas de défaillance de l’élément principal. Principes clés pour mettre en place de la redondance dans un système: o Trouver le moyen pour que les éléments de secours puissent remplacer automatiquement les éléments défaillants. o Dispersion géographique des éléments redondés pour éviter les SPOF en cas de défaillance sur tout le site. On trouve de la redondance à tous les niveaux: de la couche physique à la couche applicative. 23/07/2015 Groupe 14: Boukhobza Elior 46
  47. 47. Haute disponibilité Redondance Redondance bas niveau (1/2) Redondance bas niveau = redondance au niveau matériel et câblage. Techniques de base: o Redondance des équipements: brancher les serveurs sur plusieurs switchs, routeurs, etc… o Redondance des interfaces: Disposer de plusieurs interfaces sur les équipements. o Redondance électrique: Brancher les équipements sur des alimentations électriques distinctes… o Redondance de la sécurité: Multiplier les éléments de sécurité: Firewalls, IPS, etc… Plus le degré de redondance est élevé, plus la disponibilité est haute, mais c’est plus cher et plus lent… Il faut donc estimer le degré de disponibilité en fonction du besoin de l’entreprise. 23/07/2015 Groupe 14: Boukhobza Elior 47
  48. 48. Haute disponibilité Redondance Redondance bas niveau (2/2) 23/07/2015 Groupe 14: Boukhobza Elior 48 Exemple de matériel hautement disponible: HP BladeSystem P-Class Blade Server.
  49. 49. Haute disponibilité Redondance liaison Spanning Tree Protocol (1/3) STP: Spanning Tree Protocol (802.1D) C’est un protocole qui permet de modifier la topologie d’un réseau sans boucle en cas de défaillance d’un lien. Il permet de détecter et de désactiver les boucles dans un réseau et fournit une hiérarchie des liens sous forme d’arbre. Principe: o Election d’un « root bridge », c’est-à-dire le lien (port) ayant l’id le plus petit et la priorité la plus faible. o Détermination du plus court chemin entre deux nœuds du réseau pour déterminer quel lien utiliser. o Désactivation des liens non utilisés. o En cas de défaillance d’un lien, le processus est relancé et une nouvelle topologie est créée. o Le temps de convergence est d’environ 40s, ce qui est très lent. 23/07/2015 Groupe 14: Boukhobza Elior 49
  50. 50. Haute disponibilité Redondance liaison Spanning Tree Protocol (2/3) 23/07/2015 Groupe 14: Boukhobza Elior 50 Le Protocole STP
  51. 51. Haute disponibilité Redondance liaison Spanning Tree Protocol (3/3) Evolutions de STP: o RSTP (Rapid STP, 802.1w) version plus rapide de STP (1 s en moyenne) o PVSTP (Per VLAN STP) de Cisco, qui consiste à appliquer STP sur plusieurs VLAN. o MST (Mutliple STP), la version normée de PVSTP. o Autres protocoles de Spanning Tree propriétaires. 23/07/2015 Groupe 14: Boukhobza Elior 51
  52. 52. Haute disponibilité Redondance liaison LACP, EtherChannel (1/2) LACP: Link Aggregation Control Protocol (802.3ad) Protocole permettant d’agréger des liens ou des ports afin d’améliorer la vitesse de transfert et d’avoir de la redondance niveau 2. Une autre version très connue de ce protocole: Cisco EtherChannel (agrégation de liens Ethernet) Autres versions du protocole: o Cisco PAgP (Port Aggregation Protocol) o Nortel MLT (Multi Link Trunking) o 3COM DTP (Dynamic Trunking Protocol) o … 23/07/2015 Groupe 14: Boukhobza Elior 52
  53. 53. Haute disponibilité Redondance liaison LACP, EtherChannel (2/2) 23/07/2015 Groupe 14: Boukhobza Elior 53 Cisco EtherChannel
  54. 54. Haute disponibilité Redondance réseau VRRP, HSRP (1/2) VRRP: Virtual Router Redundancy Protocol (RFC 3768) Protocole permettant d’avoir de la redondance au niveau routage. Principe: o On met deux ou plusieurs routeurs dans un même groupe VRRP. o Dans ce groupe, un routeur va être élu comme routeur actif, celui ayant la plus forte priorité. Les autres seront en standby. o Le routeur actif sera accessible à partir d’une adresse IP virtuelle. o Les routeurs s’envoient des messages (hello paquets) à intervalles réguliers pour vérifier qu’il n’y a pas de panne (heartbeat) o Si le routeur actif tombe, un nouveau routeur sera élu comme actif et sera disponible via le même adresse virtuelle. Protocole standardisé. Basé sur le protocole HSRP (Hot Standby Router Protocol) de Cisco. Une version libre de ce protocole: CARP (Common Address Redundancy Protocol) sous OpenBSD. 23/07/2015 Groupe 14: Boukhobza Elior 54
  55. 55. Haute disponibilité Redondance réseau VRRP, HSRP (2/2) 23/07/2015 Groupe 14: Boukhobza Elior 55 VRRP - HSRP
  56. 56. Haute disponibilité Redondance réseau GLBP GLBP: Gateway Load Balancing Protocol Protocole propriétaire Cisco qui ajoute de la répartition de charge à HSRP. Principe: o En plus d’affecter une priorité aux routeurs du groupe, on affecte aussi un poids. o Election d’une AVG (Active Virtual Gateway) qui est le routeur actif du groupe. o La charge est alors répartie en Round Robin ou Weighted Round Robin. 23/07/2015 Groupe 14: Boukhobza Elior 56
  57. 57. Haute disponibilité Redondance Redondance applicative (1/3) Redonder les éléments actifs: Serveur web, base de données, ERP… Répartir efficacement la charge. Assurer la synchronisation des données entre les éléments actifs et passifs. Gérer efficacement les états de session. Exemple: o Serveur web LAMP redondé et load balancé. o Base de données MySQL redondée et synchronisée. 23/07/2015 Groupe 14: Boukhobza Elior 57
  58. 58. Haute disponibilité Redondance Redondance applicative (2/3) Teaming: Permet de regrouper plusieurs interfaces réseau en une seule vue par le système. Redondance au niveau de l’OS (couche 7) Type de comportement dépend du constructeur: o Fail Over Service: Une interface est active, une autre est en standby o Load Balancing: Les flux réseau sont distribués sur les interfaces. o Switch-assisted: Pour plus d’efficacité dans le basculement de service ou l’équilibre de charge. 23/07/2015 Groupe 14: Boukhobza Elior 58
  59. 59. Haute disponibilité Redondance Redondance applicative (3/3) Autre solution pour mettre de la redondance: Virtualisation. Disposer de plusieurs machines virtuelles au sein d’une même machine permet d’avoir de la redondance à plus faible coût (financier et énergétique). 23/07/2015 Groupe 14: Boukhobza Elior 59
  60. 60. Haute disponibilité RÉPLICATION DES DONNÉES 23/07/2015 Groupe 14: Boukhobza Elior 60
  61. 61. Haute disponibilité Réplication des données Plan 1. Concepts 2. Réplication matérielle 1. RAID 2. DRBD 3. ENBD 3. Systèmes de fichiers 23/07/2015 61Groupe 14: Boukhobza Elior
  62. 62. Haute disponibilité Réplication des données Concepts (1/3) Ajouter de la redondance ne suffit pas à assurer la haute dispo si il n’y a pas de sauvegarde de données derrière. Il faut qu’en cas de défaillance du système actif, le système qui prend le relais assure la continuité de service. Il faut donc prévoir un mécanisme de synchronisation des données entre les éléments redondés: c’est la réplication. La réplication peut être matérielle (copie des données entre les disques, entre les BDD…), ou bien directement au sein du système de fichiers (cache mémoire, partage…). 23/07/2015 Groupe 14: Boukhobza Elior 62
  63. 63. Haute disponibilité Réplication des données Concepts (2/3) Solution de stockage des données: le NAS (Network Attached Storage). o Espace de stockage attaché au réseau de l’entreprise qui gère l’ensemble des données de l’entreprise. o C’est un serveur à part entière contenant plusieurs disques indépendants ainsi que son propre OS et de son propre système de fichiers. 23/07/2015 Groupe 14: Boukhobza Elior 63
  64. 64. Haute disponibilité Réplication des données Concepts (3/3) Autre dispositif de stockage: le SAN (Storage Area Network). C’est un réseau de stockage à part entière. o Il contient plusieurs périphériques de stockage reliés à des switchs en Fiber channel ou iSCSI. o Le trafic de stockage est alors séparé du trafic métier et la capacité de stockage est quasi illimitée. 23/07/2015 Groupe 14: Boukhobza Elior 64
  65. 65. Haute disponibilité Réplication matérielle RAID (1/4) RAID: Redundant Array of Inexpensive Disks. Technologie permettant de regrouper plusieurs disques en un seul (grappe). Permet d’augmenter la vitesse de transfert et d’assurer une haute dispo des données. Il existe plusieurs niveaux de RAID, chaque niveau décrivant la manière dont sont stockées les données sur les disques. RAID est de la réplication locale. 23/07/2015 Groupe 14: Boukhobza Elior 65
  66. 66. Haute disponibilité Réplication matérielle RAID (2/4) •Répartit les données sur l’ensemble des disques •Vitesse de transfert élevée •Pas de tolérance de panne. RAID 0 (Striping) •Duplication des données sur les disques •Amélioration de la vitesse de lecture •Haute disponibilité des données •Solution onéreuse car une partie du stockage est réservée au backup RAID 1 (Mirroring) •Stockage des données sous forme d’octets sur chaque disque •Un disque est dédié au stockage d’un bit de parité •Permet la reconstitution des données en cas de défaillance. RAID 3 (Disk Array With Bit Interleaved Data) 23/07/2015 Groupe 14: Boukhobza Elior 66
  67. 67. Haute disponibilité Réplication matérielle RAID (3/4) •Comme le RAID 3 mais des blocs à la place des bits •Meilleure gestion de la capacité de stockage •Le disque de contrôle doit avoir un débit égal à la somme des débits des autres disques. RAID 4 (Disk Array With Block Interleaved Data) •Comme le RAID 4 mais la parité est stockée sur tous les disques •Performances élevées •Très Haute disponibilité des données •Très intéressant lorsqu’on possède beaucoup de disques. RAID 5 (disk array with block- interleaved distributed parity) •Comme le RAID 5 •Plusieurs fonctions de parité pour augmenter la redondance •Nécessite d’avoir au moins 4 disques. RAID 6 (disk array with block- interleaved distributed parity ) 23/07/2015 Groupe 14: Boukhobza Elior 67
  68. 68. Haute disponibilité Réplication matérielle RAID (4/4) Avantages du RAID: o La sécurité: RAID 1 et RAID 5 offrent un niveau de sécurité élevée, mais RAID 1 est une copie conforme là où RAID 5 est un entrelacement. o Performances : RAID 0 et RAID 5 offrent de fortes performances en lecture/écriture. o Coût: Le RAID 1 est onéreux car il n’offre que 50% de la quantité de stockage, alors que RAID 5 arrive à offrir jusqu’à 90% tout en assurant la réplication des données. Conclusion: o RAID 1 utilisé pour redonder les données d’un serveur. o RAID 5 utilisé dans de grands espaces de stockage. 23/07/2015 Groupe 14: Boukhobza Elior 68
  69. 69. Haute disponibilité Réplication matérielle DRBD DRBD (Distributed Replicated Block Device) Logiciel de réplication distante pour répliquer les données entre deux serveurs distants. Technique de mirroring des données comme en RAID 1. Solution Linux souvent déployée avec Heartbeat. Conserve une copie locale des données. La version 8 permet de supporter le partage de charge. 23/07/2015 Groupe 14: Boukhobza Elior 69
  70. 70. Haute disponibilité Réplication matérielle ENBD ENBD: Enhanced Network Block Device Evolution de Linux NBD. Permet d’accéder aux données distantes comme si elles étaient locales. Une authentification est nécessaire pour disposer des droits de lecture/écriture. Associé à du RAID 1, assure une haute disponibilité des données « over the Net ». 23/07/2015 Groupe 14: Boukhobza Elior 70
  71. 71. Haute disponibilité Réplication des données Systèmes de fichiers (1/2) Intérêt: disposer au sein du disque un système de fichiers offrant de la redondance mais aussi assurant l’intégrité des données. Deux types de systèmes de fichiers: o Locaux (Ext3, XFS…) o Partagés (NFS, OpenGFS…) Fonctionnalités intéressantes: o Journalisation des données pour récupération en cas de crash. o Vitesse de lecture/écriture o Partage des données sur plusieurs disques. o Sécurité de l’accès aux données o Clustering des données o Etc… 23/07/2015 Groupe 14: Boukhobza Elior 71
  72. 72. Haute disponibilité Réplication des données Systèmes de fichiers (2/2) Tableau présentant quelques systèmes de fichiers et leurs fonctionnalités: 23/07/2015 Groupe 14: Boukhobza Elior 72 File system Partage Ressource Réseau En local Gestion du clustering de données Journalisé ReiserFS Oui Oui Ext 3 Oui Oui XFS Oui Oui NFS Oui Oui Oui GFS Oui Oui Oui Oui Oui CodaFS Oui Oui Oui Oui Intermezzo Oui Oui Oui Oui Lustre Oui Oui Oui Oui
  73. 73. Haute disponibilité CONCLUSION 23/07/2015 Groupe 14: Boukhobza Elior 73
  74. 74. Haute disponibilité Conclusion La HD dans les faits (1/2) En utilisant toutes les connaissances acquises dans cet état de l’art, voici un exemple d’une architecture hautement disponible: 23/07/2015 Groupe 14: Boukhobza Elior 74
  75. 75. Haute disponibilité Conclusion La HD dans les faits (2/2) Dans cette architecture: o Tous les éléments sont redondés: routeurs, firewall, proxy, serveurs. o Chaque couche d’équipements est connectée à sa voisine en utilisant une Switch Zone dédiée, avec des switchs implémentant du Spanning Tree. o Les routeurs et les firewall utilisent de l’HSRP ou du GLBP, les proxy implémentent du CARP, les load balancers et les serveurs sont clusterisés et font de la redondance applicative (Teaming). o Enfin les bases de données sont partagées via du RAID 5 localement et en ENBD avec les autres sites. Une architecture particulièrement onéreuse mais qui offre un degré de disponibilité très élevé. En ajoutant en plus de la virtualisation, on peut offrir une haute disponibilité tout en réduisant considérablement les coûts. 23/07/2015 Groupe 14: Boukhobza Elior 75
  76. 76. Haute disponibilité Conclusion Les acteurs de la HD (1/2) Concrètement, il existe des solutions de serveurs offrant de la HD (RAID, Heartbeat, etc…) Gartner a réalisé une étude en 2003 des acteurs du marché de la haute disponibilité. En leaders: Fujitsu Technologies, HP, IBM, Stratus & Unisys. 23/07/2015 Groupe 14: Boukhobza Elior 76
  77. 77. Haute disponibilité Conclusion Les acteurs de la HD (2/2) 23/07/2015 Groupe 14: Boukhobza Elior 77 Magic Quadrant of HA vendors
  78. 78. Haute disponibilité Conclusion Exemple L’architecture de Wikipedia 23/07/2015 Groupe 14: Boukhobza Elior 78
  79. 79. Haute disponibilité Conclusion Nowadays, many solutions provide high availability and fault tolerance to IS architectures and materials. The rate of high availability is proportional to the investment deployed. The more money is invested for HA, the more secured the IS will be, making a difference between simple reliability and high availability. That’s why nowadays, it’s vital for companies to ensure its high availability in order to fully exercise its core business without fearing system failures or natural disasters. The coming of the virtualization is the best way to provide HA to systems at a lesser cost. 23/07/2015 Groupe 14: Boukhobza Elior 79
  80. 80. Haute disponibilité Questions? 23/07/2015 Groupe 14: Boukhobza Elior 80

×