h3ge3406
Goto Top

WD Red IO Retry - Storage Pool

Hallo,

ich kämpfe seit zwei Wochen mit einem ungewöhnlichen Problem bei meinem Fileserver (Server 2012 R2)

6x WD Red 6TB sind per Intel Onboard Controller (Sata3) verbunden, ich verwende Windows Storage Spaces, hatte bisher noch nie Probleme damit.
Seit einiger Zeit erhalte ich immer häufiger Fehlermeldungen in dem Format.

The IO operation at logical block address X for Disk Y (PDO name: \Z) was retried.
Etwa zwölf Stunden nachdem der Server frisch gestartet wurde, wird die Festplatte vom Windows StoragePool mit "Stale Metadata" angezeigt, die Smartwerte sind allerdings vollständig in Ordnung, auch ein zusätzlicher Test hat nichts gebracht.

Das betrifft 4/6 Festplatten, ich kann und will aber nicht davon ausgehen, dass tatsächlich alle 4 Festplatten anfangen kaputt zu gehen...


Was ich bereits getan habe:

  • Betroffene Platten auf einen anderen Hot-Swap Slot gewechselt
  • Von internen Sata Controller zu dezidiertem Controller gewechselt
  • Storage Pool aufgelöst und neu erstellt
  • Eine betroffene Festplatte aus dem Pool entfernt und mit Daten befüllt
  • Bios / Treiberupdate

Außer das ich die Festplatten austausche weiß ich leider nicht mehr weiter daher bitte ich um Vorschläge, was ich noch überprüfen könnte.

Content-ID: 301968

Url: https://administrator.de/contentid/301968

Ausgedruckt am: 23.11.2024 um 16:11 Uhr

keine-ahnung
keine-ahnung 15.04.2016 um 23:26:45 Uhr
Goto Top
Moin,
was ist das für ein fileserver?
Was ist das für ein Windows?

LG, Thomas
broecker
broecker 16.04.2016 um 09:05:08 Uhr
Goto Top
Moin,
"nach 12 Stunden" klingt nach Einschlaf-Funktionen der Platten-Firmware,
ich würde im SMART den Releasestand aller 6 Platten vergleichen und das spezielle Modell googlen, wie man eine automatische Abschaltung verhindert.
HG
Mark
114757
114757 16.04.2016 aktualisiert um 14:50:43 Uhr
Goto Top
Moin,
mit den Konsumer WD RED Platten konnte ich auch schon mal negative Erfahrungen in umfunktionierten "Servern" feststellen, die sind eigentlich für kleine NAS geeignet und sind weniger Fehlertolerant als normale Desktop-Platten weil sie meist in RAIDs laufen.
Wenn deine Platten dann noch aus der selben Charge stammen kann sowas durchaus passieren.
Je nach Nutzung der Platten hat die Serie oft das Problem das die Ihre Köpfe sehr oft in eine Parkposition fahren, das kann je nach Nutzung des Servers zu einer hohen LCC und höherem Verschleiß führen.
Der Timer lässt sich aber mit einem WD Tool an eigene Bedürfnisse anpassen.

Das Powermanagement würde ich wie Broecker schon sagt, mal testweise
z.B. mit ChrystalDiscInfo komplett abschalten.

Gruß jodel32
H3GE3406
H3GE3406 18.04.2016 um 18:17:27 Uhr
Goto Top
Ich habe jetzt sämtliche Platten aus dem Server entfernt und bei mir am PC angesteckt -> Es läuft alles einwandfrei! (mal abgesehen davon, dass ich mir aus Unachtsamkeit mein Raid zerschossen habe und die Daten gerade wieder herstellen muss...)

Womit auch die Platten ausgeschlossen sein dürften.

Für mich bleiben jetzt die Treiber und irgendwelche Bios Einstellungen. - Ich habe versuchshalber mal den Server frisch aufgesetzt, auch dort die gleichen Probleme
H3GE3406
H3GE3406 18.04.2016 aktualisiert um 18:32:47 Uhr
Goto Top
Sorry, aber kann ich nicht nachvollziehen - es handelt sich um einen privaten Server auf dem eine Menge Daten liegen, die aber großteils nur gelesen werden.
Sämtliche VMs und wirklich wichtigen Daten liegen auf Enterprise SSDs.
WD selbst gibt an, dass sich die WD Red für Raids mit 8 Platten eignen.
broecker
broecker 18.04.2016 um 19:06:32 Uhr
Goto Top
NICHT Treiber oder BIOS, sondern die Firmware der Platten ist vermutlich das Problem, die Elektronik weiß, daß sie sich nach 5 Stunden schlafen legen soll, der (RAID-)Controller rechnet aber nicht damit und meldet schon nach 1 sek statt nach 5 sek Timeout.
Das ist nur durch ein Spezialtool einstellbar, schade, daß Du die Platten schon einzeln draußen hattest, die relevanten Schritte aber nicht gemacht hast...
HG
Mark