HP DL380 G7 - SmartArray P410i - RAID5 zwei Platten defekt
Hallo zusammen,
ich betreibe noch einen HP DL380 G7 (ja ich weiß, uralt) mit einem internen SmartArray P410i RAID Controller.
Vorhin bei dem Unwetter hat irgendwo der Blitz eingeschlagen und der Strom war für ne Sekunde unterbrochen.
Davor habe ich keine USV -> alles hat sich zwangshaft neugestartet.
Jetzt das Problem: Ich habe 8 Platten á 4x500GB und 4x300GB im RAID5 als logisches Volume für ESXi konfiguriert. Die Platte in Bay2 hat irgendwie schon immer ein wenig gezickt, wie das immer so ist, nicht weiter beachtet.... Jetzt nach dem Zwangsneustart, schaue ich in ESXi und der Datastore wird nicht mehr verbunden. In die Speichergeräte geschaut und kein p410i logical volume mehr da.
In die Hardwarestats reingeschaut mit dem Ergebnis: Bay2 und Bay8 Platten defekt -> RAID5 -> große Kacke...
Danach habe ich die Kiste nochmal durchgebootet und siehe da, Bay2 wieder da und als OK angezeigt, Bay8 als FAILED. Neue 300GB SAS Platte gesteckt, das logical Volume bleibt aber immer noch auf FAILED.
Ich habe mal ein Bild hinzugefügt, was kommt, wenn man den Server startet.
Meine Frage: Die Platte 2 war als defekt angezeigt, ist sie ja aber anscheinend nicht (mehr) bzw. hat die einfach einen Drücker, die Daten sind aber evtl. da. Gibt es eine Möglichkeit (CLI oä.) das zu forcen, dass der Rebuild trz wieder anläuft? Ich habe nicht wirklich was gefunden.
Ich denke mal wenn ich bei der Meldung F2 drücke, macht er einmal einen kompletten Reset des logical Volumens. Das will ich eig vermeiden.
Vielen Dank für die Hilfe.
ich betreibe noch einen HP DL380 G7 (ja ich weiß, uralt) mit einem internen SmartArray P410i RAID Controller.
Vorhin bei dem Unwetter hat irgendwo der Blitz eingeschlagen und der Strom war für ne Sekunde unterbrochen.
Davor habe ich keine USV -> alles hat sich zwangshaft neugestartet.
Jetzt das Problem: Ich habe 8 Platten á 4x500GB und 4x300GB im RAID5 als logisches Volume für ESXi konfiguriert. Die Platte in Bay2 hat irgendwie schon immer ein wenig gezickt, wie das immer so ist, nicht weiter beachtet.... Jetzt nach dem Zwangsneustart, schaue ich in ESXi und der Datastore wird nicht mehr verbunden. In die Speichergeräte geschaut und kein p410i logical volume mehr da.
In die Hardwarestats reingeschaut mit dem Ergebnis: Bay2 und Bay8 Platten defekt -> RAID5 -> große Kacke...
Danach habe ich die Kiste nochmal durchgebootet und siehe da, Bay2 wieder da und als OK angezeigt, Bay8 als FAILED. Neue 300GB SAS Platte gesteckt, das logical Volume bleibt aber immer noch auf FAILED.
Ich habe mal ein Bild hinzugefügt, was kommt, wenn man den Server startet.
Meine Frage: Die Platte 2 war als defekt angezeigt, ist sie ja aber anscheinend nicht (mehr) bzw. hat die einfach einen Drücker, die Daten sind aber evtl. da. Gibt es eine Möglichkeit (CLI oä.) das zu forcen, dass der Rebuild trz wieder anläuft? Ich habe nicht wirklich was gefunden.
Ich denke mal wenn ich bei der Meldung F2 drücke, macht er einmal einen kompletten Reset des logical Volumens. Das will ich eig vermeiden.
Vielen Dank für die Hilfe.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 8182165299
Url: https://administrator.de/contentid/8182165299
Ausgedruckt am: 22.11.2024 um 01:11 Uhr
4 Kommentare
Neuester Kommentar
Moin,
Am besten tauschst Du alle Platten aus und machst ein Desaster-Recovery auis dem Backup. Wenn zwei Platten "weg" waren, sind die Daten inkonsistent, und selbst wenn nach einem "Rebuild alles wieder in Ordnung scheint, sind mit großer Whrscheinlichkeit Daten kaputt. Ich würde da alles plattmachen, "teil-"defekte Platten austauschen und dann aus dem Backup einen Restore fahren. Alles andere ist zeitverschwendung und russisch Roulette mit defekten Dateien.
Sprich Es ist egal was du drückst, weil Deine daten eh kaputt sind und Du sie aus dem Backup zurückspielen solltest, nachdem Du die betreffenden Platten ausgetauscht hast.
lks
PS: Oder sind das jeweils eine Platte aus jeweils einem RAID5? Dann könnte ein Rebuild funktionieren, Aber Du solltest schnellstens ein Backup ziehen, wenn das noch nciht geschehen ist. Und dann die "defekten" Platten (oder gleich den ganzen Server) austauschen.
Am besten tauschst Du alle Platten aus und machst ein Desaster-Recovery auis dem Backup. Wenn zwei Platten "weg" waren, sind die Daten inkonsistent, und selbst wenn nach einem "Rebuild alles wieder in Ordnung scheint, sind mit großer Whrscheinlichkeit Daten kaputt. Ich würde da alles plattmachen, "teil-"defekte Platten austauschen und dann aus dem Backup einen Restore fahren. Alles andere ist zeitverschwendung und russisch Roulette mit defekten Dateien.
Sprich Es ist egal was du drückst, weil Deine daten eh kaputt sind und Du sie aus dem Backup zurückspielen solltest, nachdem Du die betreffenden Platten ausgetauscht hast.
lks
PS: Oder sind das jeweils eine Platte aus jeweils einem RAID5? Dann könnte ein Rebuild funktionieren, Aber Du solltest schnellstens ein Backup ziehen, wenn das noch nciht geschehen ist. Und dann die "defekten" Platten (oder gleich den ganzen Server) austauschen.
Ich vermute mal nicht das es nen "Force Rebuild" gibt - da der Befehl an sich halt schon sinnlos wäre. WENN die Platte erkennbar ist wird der Raid nen Rebuild machen (und wenn die Platten eh schon alle recht alt sind dir vermutlich noch 1-2 andere Platten zerlegen während du die ganze Last drauf hast....).
Wenn aber eine Platte simpel nicht mehr anläuft (und is ja nett das die Firmware der Platte noch sagt das die da ist - nur blöd wenn die Platte selbst sich schon zerlegt hat) ODER die Schäden an den Daten einfach zu gross sind - wie soll ein "Force Rebuild" dann funktionieren? Stellst du dir da so vor:
Du: Hey Raid, mach nen Rebuild
Raid: Aber ich habe 2 Platten nicht, ich kann nix wieder herstellen
Du: Hey, ich WILL aber das du nen Rebuild machst
Raid: Ok, wenn das so ist denke ich mir halt den Inhalt der zwei Platten und stells wieder her...
Ganz ehrlich - spar dir die Zeit. Baue mind. 2 vernünftige Platten ein, hau das Backup rüber, fertig... Solltest du kein Backup haben, einen Server ohne USV betreiben bei dem wissentlich eine Platte schon länger defekt ist und du selbst DANN nicht aktiv wirst kann man nur sagen: Alles dafür getan das du selbst schuld bist... Viel mehr geht dann wirklich nich mehr....
Wenn aber eine Platte simpel nicht mehr anläuft (und is ja nett das die Firmware der Platte noch sagt das die da ist - nur blöd wenn die Platte selbst sich schon zerlegt hat) ODER die Schäden an den Daten einfach zu gross sind - wie soll ein "Force Rebuild" dann funktionieren? Stellst du dir da so vor:
Du: Hey Raid, mach nen Rebuild
Raid: Aber ich habe 2 Platten nicht, ich kann nix wieder herstellen
Du: Hey, ich WILL aber das du nen Rebuild machst
Raid: Ok, wenn das so ist denke ich mir halt den Inhalt der zwei Platten und stells wieder her...
Ganz ehrlich - spar dir die Zeit. Baue mind. 2 vernünftige Platten ein, hau das Backup rüber, fertig... Solltest du kein Backup haben, einen Server ohne USV betreiben bei dem wissentlich eine Platte schon länger defekt ist und du selbst DANN nicht aktiv wirst kann man nur sagen: Alles dafür getan das du selbst schuld bist... Viel mehr geht dann wirklich nich mehr....