1. Technologie RAID.doc édition du 25/10/2014 Page 1 sur 3
Technologie RAID
Sources :
- Compendium des technologies de l’information (Bjoern Gruner, Transtec AG)
- Linux sécurité (Franck Huet, ENI éditions)
- CommentCaMarche.Net (Jean-François Pillou) et divers autres sites internet
Présentation
La technologie RAID (Redundant Array of Inexpensive1 Disks) permet de constituer une unité de
stockage à partir de plusieurs disques durs, avec une grande tolérance aux pannes (haute dispo-
nibilité). La répartition des données sur plusieurs disques durs permet d'en augmenter la sécurité
et de fiabiliser les services associés.
Cette technologie a été mise au point en 1987 par trois chercheurs (Patterson, Gibson et Katz) à
l'Université de Californie (Berkeley). Depuis 1992 c'est le RAID Advisory Board qui gère ces spécifi-
cations. Elle consiste à constituer un disque de grosse capacité (coûteux) à l'aide de plus petits
disques (peu onéreux).
Les disques assemblés selon la technologie RAID peuvent être utilisés de différentes façons, appe-
lées Niveaux RAID. Chacun d'entre eux décrit la manière par laquelle les données sont réparties
sur les disques :
Les niveaux simples :
• Niveau 0: appelé striping
• Niveau 1: appelé mirroring, shadowing ou duplexing
• Niveau 2: appelé striping with parity
• Niveau 3: appelé disk array with bit-interleaved data
• Niveau 4: appelé disk array with block-interleaved data
• Niveau 5: appelé disk array with block-interleaved distributed parity
• Niveau 6: appelé disk array with block-interleaved distributed parity
Les niveaux combinés :
• Niveau 1+0, niveau 3+0, niveau 5+0 qui combinent la sécurité (1, 3, 5) et la vitesse (0)…
en théorie.
Dans tous les cas, depuis l’Explorateur disque, le système est vu comme un seul disque.
Niveau 0
Le niveau Raid 0, appelé striping (entrelacement ou agrégat par bande) consiste à stocker les
données en les répartissant sur l'ensemble des disques de la grappe. Les données sont écrites par
"bandes" (stripes).
Le but est d’obtenir une vitesse de transfert élevée. Par contre, il n'y a pas de redondance. On ne
peut donc pas parler de tolérance aux pannes. En effet en cas de défaillance de l'un des disques,
l'intégralité des données réparties sur les disques sera perdue.
Disque 1
Bande 1
Bande 4
Bande 7
Disque 2
Bande 2
Bande 5
Bande 8
Disque 3
Bande 3
Bande 6
Bande 9
1
« Inexpensive » était l’idée initiale, transformée en « Independent » au fil du temps.
Il est recommandé d'utiliser des disques de
même taille pour faire du RAID-0 car dans le
cas contraire le disque de plus grande capacité
ne sera pas pleinement exploité.
Il existe d’autres
niveaux « pro-
priétaires » créés
par des cons-
tructeurs : 7, H,
Orthogonal 5…
2. Technologie RAID.doc édition du 25/10/2014 Page 2 sur 3
Niveau 1
Le niveau Raid 1 a pour but de dupliquer les données d’un disque sur un autre disque, on parle
de disque miroir (mirroring, shadowing) pour désigner ce procédé.
Seul le disque 1 est visible, et lors d’une lecture de donnée, c’est le seul utilisé. Par contre, lors
d’une écriture, les 2 disques sont exploités en parallèle.
Disque1
Bande 1
Bande 2
Bande 3
Disque2
Bande 1
Bande 2
Bande 3
La technologie Raid 1 est considérée comme onéreuse étant donné que seule la moitié de la capa-
cité de stockage n'est effectivement utilisée.
Niveau 2
Le niveau Raid 2 est désormais obsolète.
Niveau 3
Le niveau Raid 3 nécessite au moins 3 disques. Les données sont stockées sous forme d'octets
sur les premiers disques, et le dernier disque sert au stockage de données de parité.
Disque 1
Octet 1
Octet 4
Octet 7
Disque 2
Octet 2
Octet 5
Octet 8
Disque 3
Octet 3
Octet 6
Octet 9
Disque 4
Parité 1+2+3
Parité 4+5+6
Parité 7+8+9
Si l'un des disques (ici : 1, 2 ou 3) tombe en panne, il est possible de reconstituer l'information à
partir du disque de parité et des autres disques. Après "reconstitution" le contenu du disque dé-
faillant est de nouveau intègre.
Niveau 4
Le niveau Raid 4 est très proche du niveau 3 mais gère les données par secteur et non plus par
octet.
Les niveaux 3 et 4 sont délaissés car ils créent un goulot d’étranglement au niveau du disque de
parité (disque de réparation : spare disk), ce disque étant sollicité autant que tous les autres réu-
nis.
Si le disque 1 tombe en panne, on opère une manipulation
pour que le disque 2 soit rendu accessible (« casser le miroir »).
Une fois le disque 1 remplacé, on forme de nouveau le miroir
en recopiant le disque 2 sur le disque 1.
3. Technologie RAID.doc édition du 25/10/2014 Page 3 sur 3
Niveau 5
Le niveau Raid 5 reprend le principe de données de parité calculée au niveau d'un secteur, mais
répartit ces données sur l'ensemble des disques de la grappe.
Disque 1
Bloc 1
Bloc 4
Parité 7+8+9
Disque 2
Bloc 2
Parité 4+5+6
Bloc 7
Disque 3
Bloc 3
Bloc 5
Bloc 8
Disque 4
Parité 1+2+3
Bloc 6
Bloc 9
Le mode Raid 5 assure une tolérance aux pannes élevée, tout en ménageant les performances
globales de la grappe, c'est la raison pour laquelle c'est la technologie la plus employée.
L'espace disque utile sur une grappe de n disques étant égal à n-1 disques, il est intéressant
d'avoir un grand nombre de disques pour "rentabiliser" le Raid 5.
Niveau 6
Le niveau Raid 6 définit l'utilisation de 2 fonctions de parité, et donc leur stockage sur deux
disques dédiés. Ce niveau permet ainsi d'assurer la redondance en cas d'avarie simultanée de
deux disques. Cela signifie qu'il faut au moins 4 disques pour mettre en oeuvre un système RAID-
6.
Conclusion
Le choix d'une solution RAID est lié à trois critères :
• la sécurité : RAID 1 et 5 offrent tous les deux un niveau de sécurité élevé, toutefois la mé-
thode de reconstruction des disques varie entre les deux solutions. En cas de panne du
système, RAID 5 reconstruit le disque manquant à partir des informations stockées sur les
autres disques, tandis que RAID 1 opère une copie disque à disque.
• Les performances : RAID 1 offre de meilleures performances que RAID 5 en lecture, mais
souffre lors d'importantes opérations d'écriture.
• Le coût : le coût est directement lié à la capacité de stockage devant être mise en oeuvre
pour avoir une certaine capacité effective. La solution RAID 5 offre un volume utile repré-
sentant 66% à 90% du volume alloué, selon le nombre de disques mobilisés. La solution
RAID 1 n'offre par contre qu'un volume disponible représentant 50 % du volume total.
Le tableau suivant résume l’essentiel des arguments techniques :
Technologie Avantage Inconvénient
Raid 0 Performances en Lecture / Ecriture Pas de tolérance des pannes
Raid 1 Performances en Lecture Perte d'espace disque de 50 %
Raid 3 Performances en Lecture / Ecriture
Conseillé lors de l'accès à des fichiers
de grande taille (Imagerie numérique).
Nécessite l'utilisation d'un disque très
solide pour le contrôle de parité
Raid 5 Performances en Lecture / Ecriture
Possibilité de changer un disque dé-
fectueux à chaud
Conseillé lors d'accès simultanés à
des fichiers de petite taille (Base de
données).
Dégradation des performances lors de la
reconstitution du disque défectueux.
Raid 6 Sécurité étendue à la défaillance si-
multanée de 2 disques
Ecriture ralentie (calculs de parité plus
nombreux).
De cette façon, Raid 5 amé-
liore grandement l'accès aux
données (aussi bien en lecture
qu'en écriture) car l'accès aux
bits de parité est réparti sur
les différents disques.