RAID signifie Redondant Array of Indepedant Disk, soit, en français, grappe redondante de disques indépendants. L'acronyme date de la fin des années 80, mais le concept est plus ancien et est toujours utilisé de nos jours. Il s'agit d'utiliser plusieurs disques durs pour constituer un volume plus performant, plus fiable ou les deux à la fois. Ce volume est géré logiciellement ou matériellement. Dans ce cas, on parle de contrôleurs RAID. Ils sont intégrés à la carte-mère (bas de gamme) ou sur une carte fille (haut de gamme).
Il existe plusieurs niveaux de RAID. Les plus répandus sont le RAID 0, le RAID 1, le RAID 5 et le RAID 6 (le RAID 2, le RAID 3 et le RAID 4 ne sont plus utilisés).
- RAID 0
Le RAID 0 ne vise qu'à améliorer les performances. Pour cela, les disques physiques sont découpés en bandes de secteurs de taille égale (multiple d'une puissance de 2). Ces bandes sont agglomérées les unes après les autres pour constituer le disque vu par le système. Puisqu'un petit dessin vaut mieux qu’un long discours, voici un schéma illustrant le principe d'un RAID 0 avec deux disques :
Si l'un des disques est défaillant, tout le volume est inaccessible.
- RAID 1
Le RAID 1 ne vise qu'à améliorer la fiabilité. Pour cela, toutes les données sont intégralement écrites sur chaque disque de la grappe. Ainsi, tous les disques contiennent tous les mêmes données et tant qu'il y en a un qui fonctionne, le volume n'est pas impacté.
- RAID 5
Le RAID 5 vise à améliorer les performances et la fiabilité. Pour cela, on utilise le même principe de découpage en bande du RAID 0 auquel on ajoute une bande de parité distribuée. Le calcul de cette dernière repose sur un XOR (OU EXCLUSIF) dont les propriétés mathématiques permettent de perdre n'importe quel disque sans impacter le système. Voici 4 schémas illustrant les différentes possibilités de RAID 5, à savoir :
- gauche asynchrone (la parité se déplace vers la gauche et la numérotation recommence sur le premier disque)
- gauche synchrone (la parité se déplace vers la gauche et la numérotation recommence après la parité)
- droite asynchrone (la parité se déplace vers la droite et la numérotation recommence sur le premier disque)
- droite synchrone (la parité se déplace vers la droite et la numérotation recommence après la parité)
Certains constructeurs, HP en particulier, introduisent un délai sur la parité, c'est-à-dire qu'elle ne se déplace pas à gauche ou à droite à chaque bande, mais toutes les 4, 8 ou 16 bandes.
- RAID 6
Le RAID 6 vise également à améliorer les performances et la fiabilité. Le principe est le même que pour le RAID 5, mais avec deux bandes de parité. La première repose, comme pour le RAID 5, sur un XOR. La seconde repose sur les corps finis et est beaucoup plus complexe. Du fait des deux bandes de parité, on peut perdre deux disques sans impacter le volume. Voici un schéma illustrant une configuration (gauche synchrone) RAID 6 :
Les faiblesses
Les systèmes RAID ne sont pas infaillibles. Tout d'abord, comme tous les autres systèmes informatiques, ils ne sont pas insensibles aux facteurs externes que sont les risques naturels (incendie, inondation, surcharge électrique), les risques humains (vol, dégradation) et les risques informatiques (virus, malware). Ensuite, il n'est pas impossible que plusieurs disques tombent en panne en même temps. En effet, les disques d'une grappe sont souvent issus de la même série. Dans ce cas, le MTBF (Mean Time Between Failures ou temps moyen entre pannes) est très sensiblement identique et donc les chances que plusieurs disques faillissent en même temps sont importantes. Enfin, ils ne protègent pas contre les suppressions accidentelles de fichiers ou toutes les autres erreurs humaines, souvent induites par excès de confiance dans le système, ce qui constitue finalement sa principale faiblesse.
De ce fait, il ne faut pas leur faire entièrement confiance et mettre en place un système de sauvegardes périodiques déportées et régulièrement vérifier qu'elles fonctionnent comme attendu.