bloodstix
Goto Top

Nach wie vielen BadBlock-Meldungen Festplatte tauschen?

Hallo zusammen,

ich habe ein RAID 10 mit 10 Platten SEAGATE Model ST3300657SS. Da wurden jetzt für eine Festplatte in den letzten 4 Monaten 11 BadBlocks gemeldet.
Wie sind eure Erfahrungen? Wann sollte man die Platte vorsorglich tauschen? Oder tauscht ihr erst wenn die Meldung kommt das eine Festplatte
defekt ist?

Greetings
bloody

Content-ID: 600110

Url: https://administrator.de/contentid/600110

Printed on: October 11, 2024 at 15:10 o'clock

Lochkartenstanzer
Solution Lochkartenstanzer Aug 28, 2020 at 08:24:53 (UTC)
Goto Top
Zitat von @bloodstix:

Wie sind eure Erfahrungen? Wann sollte man die Platte vorsorglich tauschen? Oder tauscht ihr erst wenn die Meldung kommt das eine Festplatte
defekt ist?

Nach dem ersten bad Block, wenn die Platte wichtige Daten hat. Wenn die Daten nicht wichtig sind, kannst Du natürlich warten, bis sie die Grätsche macht.

lks
SonArc
Solution SonArc Aug 28, 2020 at 08:26:36 (UTC)
Goto Top
Bei uns werden die getauscht, sobald ein erstes Anzeichen einer Erkrankung vorliegt.
Demnach hätten wir die Platte vor 4 Monaten schon getauscht.
StefanKittel
Solution StefanKittel Aug 28, 2020 at 08:38:59 (UTC)
Goto Top
Zitat von @bloodstix:
Nach wie vielen BadBlock-Meldungen Festplatte tauschen?
1
bloodstix
bloodstix Aug 28, 2020 at 08:40:26 (UTC)
Goto Top
Hi ihr,

hätte jetzt nicht gedacht, das ihr da so rigoros seid *g*.
Dann werd ich mal Ersatz ordern ;).

Grüße
bloody
LeeX01
LeeX01 Aug 28, 2020 at 08:58:22 (UTC)
Goto Top
Schnell tauschen, die wird nicht besser, ist normal ein Garantiefall. Wir haben eine andere Serie da sterben die SIE_GEHT Platten gerade wie die Fliegen, gestern die letzte.
Lochkartenstanzer
Lochkartenstanzer Aug 28, 2020 at 09:07:04 (UTC)
Goto Top
Zitat von @bloodstix:

Hi ihr,

hätte jetzt nicht gedacht, das ihr da so rigoros seid *g*.

Weil wir die Erfahrung gemacht haben, daß dann gleich noch weitere Fehler hinzukommen und die Platte jederzeit von jetzt auf nachher die Grätsche machen kann (aber nciht muß).

Ein weiterer Aspekt ist, daß, wenn die Fehler auftauchen, an den Stellen die Platte meistens auch gebremst wird, weil sie u.U. mehrmals die gleiche Stelle lesen muß. d.h. die Zugriffszeit wird auf jeden Fall größer und wenn Du Pech hast, zerreisst es Dir das Raid, weil die Platte sich nicht rechtzeitig gemeldet hat.

Jedenfalls sollte sie nicht für wichtige daten verwendet werden, wenn sie weiterhin in Gebrauch bleibt.

Dann werd ich mal Ersatz ordern ;).

Besser ist das. Noch besser ist es, den Ersatz auf Lager (oder als hot-standby) schon dazuhaben, damit man im Fall des Falles schnell das RAID wieder produktiv hat.

lks
Ex0r2k16
Ex0r2k16 Aug 28, 2020 at 09:07:36 (UTC)
Goto Top
Das ist halt wien Reifen mitm Nagel drinn, wo langsam die Luft rausgeht. face-wink
lcer00
lcer00 Aug 28, 2020 at 09:31:40 (UTC)
Goto Top
Hallo,
Zitat von @bloodstix:

ich habe ein RAID 10 mit 10 Platten
Da ist dann ja nur eine Platte Toleranz da, wenn eine kaputt ist. Wenn diese auch Fehler macht ist die Gefahr groß, dass Dir die Platten beim Rebuilt um die Ohren fliegen.

Grüße

lcer
117471
117471 Aug 28, 2020 at 10:24:35 (UTC)
Goto Top
Hallo,

normalerweise haben Platten Ersatzblöcke - die scheinen bereits aufgebraucht zu sein.

Sprich: Sobald der erste Bad Block auftaucht, fährst Du bereits „auf Reserve“.

Abgesehen davon hängt die Antwort auch von der Qualität der Datensicherung und den Anforderungen an die Verfügbarkeit ab.

Gruß,
Jörg
Lochkartenstanzer
Lochkartenstanzer Aug 28, 2020 at 10:32:51 (UTC)
Goto Top
Zitat von @117471:

Hallo,

normalerweise haben Platten Ersatzblöcke - die scheinen bereits aufgebraucht zu sein.

Sprich: Sobald der erste Bad Block auftaucht, fährst Du bereits „auf Reserve“.


Ich denke eher, daß die Platte "unrecoverable read error" oder "reallocation events" gemeldet hat. Sonst wäre ihnen das Raid schon um die Ohren geflogen.

lks
Ex0r2k16
Ex0r2k16 Aug 28, 2020 at 11:46:17 (UTC)
Goto Top
Naja. Er hat ja für jede (!) der 5 Raid 0 Platten eine Ersatzplatte. Sprich da können 5 HDDs zeitgleich ausfallen und passiert nix. Klar dann wird der Rebuild natürlich heftig.
lcer00
lcer00 Aug 28, 2020 at 12:12:37 (UTC)
Goto Top
Hallo,
Zitat von @Ex0r2k16:

Naja. Er hat ja für jede (!) der 5 Raid 0 Platten eine Ersatzplatte. Sprich da können 5 HDDs zeitgleich ausfallen und passiert nix. Klar dann wird der Rebuild natürlich heftig.
Also bevor das hier falsch gedeutet wird: im allergünstigsten Fall verträgt das System den Ausfall von 5 Platten. Im dümmsten Fall ist nach der 2. bereits Schluss. Erfahrungsgemäß trifft oft der dümmste Fall ein.

Grüße

lcer
Ex0r2k16
Ex0r2k16 Aug 28, 2020 at 12:14:35 (UTC)
Goto Top
Zitat von @lcer00:

Hallo,
Zitat von @Ex0r2k16:

Naja. Er hat ja für jede (!) der 5 Raid 0 Platten eine Ersatzplatte. Sprich da können 5 HDDs zeitgleich ausfallen und passiert nix. Klar dann wird der Rebuild natürlich heftig.
Also bevor das hier falsch gedeutet wird: im allergünstigsten Fall verträgt das System den Ausfall von 5 Platten. Im dümmsten Fall ist nach der 2. bereits Schluss. Erfahrungsgemäß trifft oft der dümmste Fall ein.

Grüße

lcer

Das is ja das spannende an unsrem Job. Mal hat man Glück, mal hat man Pech face-wink
Lochkartenstanzer
Lochkartenstanzer Aug 28, 2020 at 15:54:41 (UTC)
Goto Top
Zitat von @Ex0r2k16:

Naja. Er hat ja für jede (!) der 5 Raid 0 Platten eine Ersatzplatte. Sprich da können 5 HDDs zeitgleich ausfallen und passiert nix. Klar dann wird der Rebuild natürlich heftig.

Es reicht, wenn die zwei richtigen ausfallen.

lks
DGI-SysAdm
DGI-SysAdm Aug 28, 2020 updated at 16:01:57 (UTC)
Goto Top
BadBlocks - welches S.M.A.R.T-Event soll das sein? Du meinst bestimmt "Reallaocated Sectors" ...

Wir haben diverse 10TB Seagate Exos im Einsatz (als RAID Z2 - also RAID 6, das beruhigt schon mal etwas).
Bisher sind bei uns in vergangenen 12 Monaten 2 Platten ausgetauscht worden. Nach Aussage von Seagate sind "Reallaction Events" kein "Beinbruch", dafür stehen ja "Ersatzblöcke" bereit. Bei unserem Modell tauscht Seagate ab "200 Reallocated Sectors" aus - wobei da noch Luft ist, denn die Platte ging relativ fix von 128 auf 224 Sektoren hoch, lief aber immer noch ohne Probleme.
Das Wichtigste ist die Platte im Auge zu behalten. Bei "echten RAID-Controllern" passt schon der Controller auf uns nimmt die Platte aus dem Raid mit entsprechendem Alarm - aber das scheint bei Dir nicht gegeben (bei uns auch nicht, da FreeNAS mit ZFS).

Einfach bei Seagate-Support (wenn man die mal erreicht) nachfragen, ab wann sie kostenlos tauschen und bitten, Dir die Info auch schriftlich zu geben (was sie bei mir problemlos gemacht haben). Bei der RMA einfach den Auszug der Smartwerte mitsenden.

Gruß,
Robert
bloodstix
bloodstix Sep 01, 2020 at 09:41:07 (UTC)
Goto Top
Hi,

weil die Frage mehrfach aufkam, was das genau für ein Event sei.
Die Meldung von Controller sieht wie folgt aus:
======================================================================================

			ADAPTEC BY PMC EMAIL NOTIFICATION MANAGER (Instant)

======================================================================================

Event Type		: Warning
Event Source		: email@domäne.tld
Date			: 08/15/2020
Time			: 11:08:33 PM CEST

-----------------------------------------------------------------------------------------------------------------------------------------
					Event(s) List With Description
-----------------------------------------------------------------------------------------------------------------------------------------
Bad Block discovered: controller 1 ( Adaptec ASR71605E #3A33133D9D1 Physical Slot: 3 ) (222b3000).
-----------------------------------------------------------------------------------------------------------------------------------------

**[Note]:	This message was generated by the maxView Storage Manager Agent.
		Please do not reply to this message.

Grüße
bloody