Bonjour à tous,
@monsieur N, je tenterais d'apporter ma pierre à l'édifice pour ce qui est du choix de DD, en particulier ta question concernant les WD RED en tant que des DD conçus pour des NAS. J'espère que tu auras la patience de lire jusqu'au bout
Chaque DD de bureau procède à une correction des erreurs comme, par ex., la possibilité de gérer des erreurs d'écriture et de réallouer des mauvais secteurs. Durant cette correction le DD ne répond pas à des commandes et ne génère pas de messages d'erreur. Leur design présume que là il n'y a pas de contrôleur RAID qui pourrait intervenir et apporter de l'aide durant la récupération de l'erreur.
La difficulté qui se produit c'est que lorsque la correction de l'erreur prend plus de 8 secondes le contrôleur RAID présume que le DD qui ne répond pas a sauté et pour cette raison il l'évacue du volume RAID. Les cartes RAID vont normalement attendre 8 secondes pour que le DD réponde et s'il ne répond pas les cartes RAID sont programmées à prendre des mesures.
Donc le manque de coordination c'est que d'une part le DD de bureau est programmé à prendre en charge toute la récupération d'erreurs et, en même temps, les cartes RAID le sont aussi …
Une fois le DD «évacué» de l'ensemble RAID le volume RAID tourne en mode dégradé jusqu'à ce qu'un DD de remplacement ne soit fourni. Une fois le DD remplacé, le volume RAID doit être reconstruit. Lorsque le volume RAID fonctionne en mode dégradé le travail effectué par les disques est très dur. Si un autre DD échoue durant la reconstruction tout le contenu du volume est perdu.
Les DD destinés aux serveurs sont conçus avec l'idée qu'il y a un contrôleur RAID et qu'une coordination de la gestion des erreurs doit être établie. Cette gestion coordonnée des erreurs est introduite avec TLER (reprise après erreur limitée dans le temps).
Les DD disposant de TLER effectuent la récupération d'erreurs normale et arprès la 7-ème seconde ils avertissent le contrôleur RAID via un message d'erreur et reporter la tâche de récupération de l'erreur. Grâce à la gestion coordonée de l'erreur le DD ne sera pas évacué de la grappe RAID, ceci évitant la récupéraiton du RAID entier, remplacement, reconstruction.
Grâce à la gestion coordonnée des erreurs TLER prévient tout nouveau échec de la récupération de l'erreur en limitant le temps que le DD investit pour récupérer cette erreur.
… et voili voilou
Bon vendredi et merci d'avoir lu jusqu'au bout