Redundant Array of Independent Disks (RAID)

Théorie

Une métrique intéressante pour un disque est le temps moyen de défaillance, Mean Time Between Failures (MTBF).
Elle indique la fiabilité attendue des disques durs dans un environnement avec de nombreux lecteurs. Par exemple: une MTBF de 1.25 millions d’heures, soit environ 135 ans, indique que si on a 135 disques, on peut s’attendre à une panne de lecteur une fois par an.

Dans un environnement de stockage avec un grand nombre de disques, il est donc quasi-certain que des pannes de disques arriverons, et des disques de rechange doivent être préparés à l’avance. Ça souligne également l’importance des techniques de redondance de disque, tel que le RAID (Redundant Array of Independent Disks).
RAID consiste à placer plusieurs disques durs sur un même serveur, et sauvegarder les données a plusieurs endroits: si un disque est endommagé, il est toujours possible de récupérer les données perdues sur un autre disque. Cela permet d’une part de se protéger des pertes de données en cas de panne d’un des disques durs, et d’autre part peut permettre de gagner en performance puisque plusieurs opérations d’entrée-sortie peuvent être effectuées en même temps.

Un RAID0, ou stripped array, est un groupe de disque que Linux considère comme une seule zone de stockage: l’espace total utilisable est égal à la somme de tous les périphérique. Par exemple, on peut prendre 2 disques de 1T et les coller ensemble pour obtenir un seul stockage de 2T. Ce type de RAID est risqué à utiliser car si un disque tombe en panne, les données de l’ensemble du RAID son perdues. Le niveau 0 n’est pas redondant, les autres niveaux le sont.

Un RAID1, ou mirrored array, consiste à répéter les mêmes données sur tous les disques. Si on a 3 disques dans un RAID, lorsqu’on écrit un fichier sur ce RAID, le fichier est cloné sur les 3 disques. Ainsi, si on a 3 disques de 1T, on a un stockage de 1T.

Un RAID5, ou distributed parity, utilise une technique connue sous le nom de parité. La parité est une information supplémentaire calculée et stockée avec les données que l’utilisateur souhaite écrire sur le disque. Cette information peut être utilisée pour vérifier l’intégrité des données stockées et pour calculer les données perdues si une partie des données manque. Un RAID5 nécessite au minimum 3 disques.

Pour comprendre le principe: imaginons qu’on ait une équation telle que “9 = X + 4.” X est une donnée inconnue qui a été précédemment stockée sur le disque A qui est tombé en panne. Le 4 est une donnée stockée sur le disque B, et le 9 est une donnée de parité stockée sur le disque C, calculée au préalable à des fins de redondance. En résolvant X, on peut reconstituer les données perdues du disque A: 5.

Cela permet d’avoir une redondance sans stocker une copie complète des données (9 et 5), et ainsi d’économiser de l’espace disque. En pratique, RAID5 utilise la fonction mathématique “XOR”.

Un RAID6, ou dual parity, est similaire à RAID5 mais utilise deux disques au lieu d’un seul pour la parité. Ça permet de supporter la perte de deux disque. Un RAID6 nécessite au minimum 4 disques.

Avec RAID5, en cas de perte d’un disque, le temps nécessaire pour reconstituer les données manquantes n’est pas négligeable — pour un disque de 1TB, une dizaine d’heures. De plus, lorsqu’un disque vient à défaillir les disques restants sont plus fortemment sollicités, et il y a donc plus de risque de perdre un second disque dès lors qu’un premier vient de lâcher. Un RAID6 offre une plus grande redondance au détriment de l’espace de stockage.

Pour créer un RAID, on utilise MDA-DM (pour multiple devices administration - Mirror Disk):
```
sudo mdadm --create /dev/md0 --level=0 --raid-devices=3 /dev/vd{c,d,e}
```
Ici on crée un fichier virtuel /dev/md0 qui permet d’accéder à un RAID0 contenant 3 disques — vdc, vdd et vde
Pour créer un système de fichier dessus:
```
sudo mkfs.ext4 /dev/md0
```

Pour ajouter un disque à un RAID existant:

sudo mdadm --manage /dev/md0 --add /dev/vde

Pour retirer un disque d’un RAID:

sudo mdadm --manage /dev/md0 --remove /dev/vde

This site is open source. Improve this page.