Aller au contenu

RAID fiable ou dangereux


Messages recommandés

Bonjour,

J'ai été assez violemment pris à partie dans les commentaires pour mon commentaire sur le RAID. J'ai l'habitude d'être un peu provocant dans mes commentaires, mais les réponses qui m'ont été données (INcompétent et quelques smiley genre :transpi: +:n'importe quoi: + :rire:) m'incitent à en rajouter une couche.

Les faits : PC INpact a été OFF à cause d'un système RAID.

Mon commentaire : le RAID augmente sous certains aspect les risques, et ne protège pas de très nombreux risques.

Réaction des gens : le "RAID", rien que ce nom est censé susciter l'effroi et le respect, ça sonne comme un corps d'élite de la police, ça coute cher, c'est les pros qui s'en servent et ça a l'air fichtrement complexe avec des codes et tout. Quelqu'un qui dit que c'est pas bien dit forcément n'importe quoi.

Une technologie vieille de 20 ans n'est pas forcément la panacée. Ne réagissez pas avec vos idées reçues et PENSEZ.

Déjà c'est pas "n'importe quoi" ou "il est fou". La preuve vous l'avez devant les yeux: PC inpact a été arrêté à cause de ça. Donc déjà, la preuve, vous l'avez devant les yeux. Oui, le RAID peut causer des pannes. Ah déjà, si vous avez compris que la réalité peut prendre le pas sur une idée fausse, vous avez fait la moitié du chemin.

Si je tiens à vous apprendre à vous méfier du RAID, c'est que j'ai de bonnes raisons. Moi aussi, j'avais fait confiance dans le RAID pour augmenter la fiabilité d'un de mes systèmes. En Mirroring. Pour ceux qui savent que le RAID mirroring est faible, passez au chapitre suivant. Les autres, lisez. Oh, le système RAID me signale que le disque 0 a des secteurs défectueux. Super, hé bin changeons le disque 0 et remplaçons le par un neuf; et récréons la grappe à partir du disque sain. Oh, il y a aussi des secteurs défectueux. Pourquoi? Des disques durs qui ont eu une durée d'utilisation similaire, des opérations similaires ont eu une durée de vie similaire. moralité : deux disques abimés; et un enfer pour récupérer des données. Des backups, oui, j'en ai. Donc, c'est les backups qui protègent les données, pas le RAID.

Alors, certains me diront : le raid 5, ça c'est solide et sur. Alors j'ai vécu le cas suivant : super système raid 5, carte contrôleur dédiée très chère, top marque. Un disque pourrait flancher; on le change. C'est super le RAID 5. Sauf que le nouveau disque, à priori pour une raison électrique, s'est mis à tirer trop de courant sur le contrôleur, qui a perdu deux disques sur une grappe de quatre. Arrêt du système. Pas grave, on remplace par un nouveau disque neuf. Sauf que le système RAID est alors incapable de reconstruire une grappe où deux disques sont considérés comme défaillants. Et que les données sont alors illisibles sur un système normal. Ce fut un enfer pour trouver un logiciel capable de relire les données sur les différents disques, de façon compatible avec le hardware. Moralité : des problèmes qui ne seraient jamais survenus sans système RAID.

Donc, étant donné que le RAID ne protège pas des pannes courantes (bug, malveillance, effacement accident et autres accidents logiciels; cambriolage, incendie et autres catastrophes physiques), qu'il rajoute des composants et des sources de panne, quel est sont intérêt? Et bien, il est plus mince que certains ne le pensent. Il est même dangereux puisqu'il peut donner une illusion de sécurité. Faites des backups, testez les, et conservez les loin de votre ordinateur, c'est la seule bonne solution.

Et si vous devez concevoir des systèmes fail-safe, prenez deux PC et un load balancer + fail over; et une architecture adaptée.

Maintenant, si vous avez des expériences ou le RAID vous a aidé à maintenir un système en bonne marche, faites m'en part parce qu'en 25 ans d'informatique, pour moi ou pour les gens que je côtoie, le bilan n'est pas brillant.

Lien vers le commentaire
Partager sur d’autres sites

Je pense qu'il ne faut pas forcement cracher sur le raid mais sur l'achitecture des serveurs.

Je ne sais pas comment est fait celle de PCI mais tout porte a croire que le site (ou la base) était (est ?) herbergé sur une seule et unique machine. Pas de load balancing, pas de cluster, rien

donc forcement quand un élément de cette machine vient a lacher, cela se produit ce qui vient de se passer.

A en croire ce que j'ai lu dans les commentaires de PA, ceci va bientot changer.

En ce qui concerne le raid, effectivement tu soulèves des points justes, d'ou l'interet des backups. Je pense que pas mal de personne s'en mordent encore les doigts de n'avoir jamais rien backupé le jour ou cela arrive.

De mémoire, on dit toujours qu'il faut backuper sur plusieurs supports et à plusieurs endroit différents : l'un pour éviter qu'un support ne lache avec le temps (DD, cassette, bande, clé, etc...) et l'autre pour avoir un backup distant autre part que chez soi (cambriolage, feu, etc...)

Personnellement je backup énormement et j'ai aussi un RAID1 qui trainent sur deux DD de 160go pour mes données persos

ces mêmes données qui sont aussi backupée sur un dd externe (malheuresement jamais backupé autre part que chez moi)

Lien vers le commentaire
Partager sur d’autres sites

Maintenant, si vous avez des expériences ou le RAID vous a aidé à maintenir un système en bonne marche, faites m'en part parce qu'en 25 ans d'informatique, pour moi ou pour les gens que je côtoie, le bilan n'est pas brillant.

De ma maigre expérience (< 5 ans), je dirais que mes conclusions ne sont guère brillantes, j'ai plus souvent des problèmes de contrôleur de disque plutôt que des problèmes de disque dans le cadre d'un RAID. J'ai pu constater que deux machines sont un minimum en matière de haute dispo, sans parler de double attachement réseau, répartition sur sites différents ou RAID. Je n'ai jamais travaillé avec du RAID 5, mais mes lectures sur le sujet ne sont pas à son avantage.

De manière plus générale, il y a des SPOF partout, on ne peut pas atteindre 100% de disponibilité sauf avec de la chance. Une fois cette donnée acquise, comprise et intégrée, de même que la dimension financière, on se rend compte que la sauvegarde est obligatoire et les bonnes questions arrivent :

- combien cela coute-t-il d'avoir XX% de dispo?

- quel temps d'indispo par semaine/mois/trimestre/an est acceptable?

- quelle doit être ma fréquence de sauvegarde?

- puis-je me permettre de perdre les données entre deux sauvegardes?

- quelle somme dois-je investir dans ces sauvegardes?

Après, je ne connais pas la réflexion au sein de l'équipe PCI, mais j'aurais tendance à dire que perdre une journée de commentaires n'est pas grave, et que 24 heures d'indispo par trimestre peut s'avérer être une perte acceptable (j'avoue que je ne tiens pas compte des revenus générés grâce à la publicité et de la situation financière de la société). Un seul serveur de base de données sauvegardé (système ET bases de données, et sauvegardes externalisées) suffit peut-être à remplir cet objectif (totalement fictif puisque je connais pas l'infrastructure et les décisions de l'équipe).

Au final, la haute disponibilité n'est qu'une affaire de compromis et d'argent :transpi:

Lien vers le commentaire
Partager sur d’autres sites

Maintenant, si vous avez des expériences ou le RAID vous a aidé à maintenir un système en bonne marche, faites m'en part parce qu'en 25 ans d'informatique, pour moi ou pour les gens que je côtoie, le bilan n'est pas brillant.

De ma maigre expérience (< 5 ans), je dirais que mes conclusions ne sont guère brillantes, j'ai plus souvent des problèmes de contrôleur de disque plutôt que des problèmes de disque dans le cadre d'un RAID. J'ai pu constater que deux machines sont un minimum en matière de haute dispo, sans parler de double attachement réseau, répartition sur sites différents ou RAID. Je n'ai jamais travaillé avec du RAID 5, mais mes lectures sur le sujet ne sont pas à son avantage.

De manière plus générale, il y a des SPOF partout, on ne peut pas atteindre 100% de disponibilité sauf avec de la chance. Une fois cette donnée acquise, comprise et intégrée, de même que la dimension financière, on se rend compte que la sauvegarde est obligatoire et les bonnes questions arrivent :

- combien cela coute-t-il d'avoir XX% de dispo?

- quel temps d'indispo par semaine/mois/trimestre/an est acceptable?

- quelle doit être ma fréquence de sauvegarde?

- puis-je me permettre de perdre les données entre deux sauvegardes?

- quelle somme dois-je investir dans ces sauvegardes?

Après, je ne connais pas la réflexion au sein de l'équipe PCI, mais j'aurais tendance à dire que perdre une journée de commentaires n'est pas grave, et que 24 heures d'indispo par trimestre peut s'avérer être une perte acceptable (j'avoue que je ne tiens pas compte des revenus générés grâce à la publicité et de la situation financière de la société). Un seul serveur de base de données sauvegardé (système ET bases de données, et sauvegardes externalisées) suffit peut-être à remplir cet objectif (totalement fictif puisque je connais pas l'infrastructure et les décisions de l'équipe).

Au final, la haute disponibilité n'est qu'une affaire de compromis et d'argent :oops:

En somme, des calculs sont à effectuer au cas par cas avant d'adopter la meilleure solution technique :chinois:

Lien vers le commentaire
Partager sur d’autres sites

Le RAID est fait pour améliorer la fiabilité et/ou les perfs (surtout les prfs d'ailleurs).

C'est clair que certains cas ne peuvent pas être résolu par du RAID (destruction du serveur) donc pour ça il faut des backups.

Les problèmes de dépendance au contrôleur peut être résolu par un moyen simple : le RAID software qui est utilisable sur n'importe quel contrôleur et qui est bien plus souple.

La principale chose à éviter c'est de perdre plusieurs disques en même temps là c'est vrai que l'utilisation identique de disques identiques c'est pas le top.

Il faut vraiment avoir la possibilité de changer vite le disque avant qu'un autre tombe en panne histoire de réduire le temps où le problème risque d'arriver.

Une solution serait d'utiliser des disques différents, ça réduits les perfs et il ne faut pas que le contrôleur hardware y soit sensible.

J'ai un RAID 1 sur un vieil ordi (fin 2001) reconverti en serveur de fichiers avec une carte SATA et 2 disques de marque différentes : une fois il y a eu un pépin visiblement avec un câble mais tout est rentré dans l'ordre (retrait du disque, changement du câble (PC éteint), puis remis dans le RAID).

A noter aussi que de nouveaux systèmes de fichiers (ZFS, BetterFS) ont une sorte de système RAID intégré je connais pas trop mais ça semble intéressant.

Lien vers le commentaire
Partager sur d’autres sites

Archivé

Ce sujet est désormais archivé et ne peut plus recevoir de nouvelles réponses.

×
×
  • Créer...