maddig
Goto Top

HP DL380 G7 - SmartArray P410i - RAID5 zwei Platten defekt

Hallo zusammen,

ich betreibe noch einen HP DL380 G7 (ja ich weiß, uralt) mit einem internen SmartArray P410i RAID Controller.
Vorhin bei dem Unwetter hat irgendwo der Blitz eingeschlagen und der Strom war für ne Sekunde unterbrochen.
Davor habe ich keine USV -> alles hat sich zwangshaft neugestartet.

Jetzt das Problem: Ich habe 8 Platten á 4x500GB und 4x300GB im RAID5 als logisches Volume für ESXi konfiguriert. Die Platte in Bay2 hat irgendwie schon immer ein wenig gezickt, wie das immer so ist, nicht weiter beachtet.... Jetzt nach dem Zwangsneustart, schaue ich in ESXi und der Datastore wird nicht mehr verbunden. In die Speichergeräte geschaut und kein p410i logical volume mehr da.
In die Hardwarestats reingeschaut mit dem Ergebnis: Bay2 und Bay8 Platten defekt -> RAID5 -> große Kacke...

Danach habe ich die Kiste nochmal durchgebootet und siehe da, Bay2 wieder da und als OK angezeigt, Bay8 als FAILED. Neue 300GB SAS Platte gesteckt, das logical Volume bleibt aber immer noch auf FAILED.

Ich habe mal ein Bild hinzugefügt, was kommt, wenn man den Server startet.

img_0779

Meine Frage: Die Platte 2 war als defekt angezeigt, ist sie ja aber anscheinend nicht (mehr) bzw. hat die einfach einen Drücker, die Daten sind aber evtl. da. Gibt es eine Möglichkeit (CLI oä.) das zu forcen, dass der Rebuild trz wieder anläuft? Ich habe nicht wirklich was gefunden.

Ich denke mal wenn ich bei der Meldung F2 drücke, macht er einmal einen kompletten Reset des logical Volumens. Das will ich eig vermeiden.

Vielen Dank für die Hilfe.

Content-ID: 8182165299

Url: https://administrator.de/contentid/8182165299

Ausgedruckt am: 22.11.2024 um 01:11 Uhr

Lochkartenstanzer
Lochkartenstanzer 17.08.2023 aktualisiert um 22:58:50 Uhr
Goto Top
Moin,

Am besten tauschst Du alle Platten aus und machst ein Desaster-Recovery auis dem Backup. Wenn zwei Platten "weg" waren, sind die Daten inkonsistent, und selbst wenn nach einem "Rebuild alles wieder in Ordnung scheint, sind mit großer Whrscheinlichkeit Daten kaputt. Ich würde da alles plattmachen, "teil-"defekte Platten austauschen und dann aus dem Backup einen Restore fahren. Alles andere ist zeitverschwendung und russisch Roulette mit defekten Dateien.

Sprich Es ist egal was du drückst, weil Deine daten eh kaputt sind und Du sie aus dem Backup zurückspielen solltest, nachdem Du die betreffenden Platten ausgetauscht hast.

lks

PS: Oder sind das jeweils eine Platte aus jeweils einem RAID5? Dann könnte ein Rebuild funktionieren, Aber Du solltest schnellstens ein Backup ziehen, wenn das noch nciht geschehen ist. Und dann die "defekten" Platten (oder gleich den ganzen Server) austauschen.
maretz
maretz 18.08.2023 um 05:57:05 Uhr
Goto Top
Ich vermute mal nicht das es nen "Force Rebuild" gibt - da der Befehl an sich halt schon sinnlos wäre. WENN die Platte erkennbar ist wird der Raid nen Rebuild machen (und wenn die Platten eh schon alle recht alt sind dir vermutlich noch 1-2 andere Platten zerlegen während du die ganze Last drauf hast....).

Wenn aber eine Platte simpel nicht mehr anläuft (und is ja nett das die Firmware der Platte noch sagt das die da ist - nur blöd wenn die Platte selbst sich schon zerlegt hat) ODER die Schäden an den Daten einfach zu gross sind - wie soll ein "Force Rebuild" dann funktionieren? Stellst du dir da so vor:
Du: Hey Raid, mach nen Rebuild
Raid: Aber ich habe 2 Platten nicht, ich kann nix wieder herstellen
Du: Hey, ich WILL aber das du nen Rebuild machst
Raid: Ok, wenn das so ist denke ich mir halt den Inhalt der zwei Platten und stells wieder her...

Ganz ehrlich - spar dir die Zeit. Baue mind. 2 vernünftige Platten ein, hau das Backup rüber, fertig... Solltest du kein Backup haben, einen Server ohne USV betreiben bei dem wissentlich eine Platte schon länger defekt ist und du selbst DANN nicht aktiv wirst kann man nur sagen: Alles dafür getan das du selbst schuld bist... Viel mehr geht dann wirklich nich mehr....
beidermachtvongreyscull
beidermachtvongreyscull 18.08.2023 um 07:17:58 Uhr
Goto Top
Moin,

es wird wahrscheinlich nicht funktionieren. Selbst wenn die Daten konsistent sind, so weichen die RAID-Köpfe jetzt von einander ab. Auch daran erkennt der Controller, dass es mit dem RAID hinüber ist.

Tausche den Plattenstapel aus und spiel ein Backup zurück. Dann bist Du sicher.

Gruß
bdmvg
silent-daniel
silent-daniel 18.08.2023 aktualisiert um 08:09:50 Uhr
Goto Top
F2 drücken, Datenstand prüfen, sonst-> Backup wiederherstellen.

Wenn eine Platte in einem Raid5 zickt, warum tauscht du die nicht gleich aus?
Hattest du keine Hot Spare?

gruß sd