aki-kun
Goto Top

Hardware Raid 5 mit 4 HDDs degraded, 2 HDDs defekt. Wie rebuild durchführen?

Das Erste mal mit dieser speziellen Konstallation. Was ist sicherer und schneller?

Ist es nun besser beide defekte Platten gleichzeitig auszutauschen und den Rebuild zu starten, oder erst eine Platte und dann die Andere.

Grundsätzlich würden wir den Server runterfahren und den Rebuild im Raid-Bios durchführen. Backup ist zwar vorhanden, aber ein Stillstand sollte vermieden werden. Deshalb sollte der Rebuild auch am Besten übers WE durchlaufen.

Server ist ein Fujitsu Primergy mit Hardware Raid.

(Der Server eh gegen eine neue Maschine ausgetauscht, muss aber noch ein paar Wochen durchhalten)

Vielen Dank für die Tipps.

Aki

Content-ID: 204718

Url: https://administrator.de/contentid/204718

Ausgedruckt am: 14.11.2024 um 09:11 Uhr

keine-ahnung
keine-ahnung 09.04.2013 um 19:47:18 Uhr
Goto Top
Hi,

ich will jetzt keine Missstimmung verbreiten, aber ein RAID 5 mit 4 Platten verträgt nur den Ausfall einer HDD. Aber es ist noch Hoffnung: ich bin Laie face-wink

LG, Thomas
rana-mp
rana-mp 09.04.2013 aktualisiert um 19:55:08 Uhr
Goto Top
Sicher das das ein RAID-5 ist? Das sollte nämlich mit 2 defekten Platten keinen Mucks mehr machen... Oder ist eine der defekten Platten eine ehemalige HotSpare?
Interessant waere jetzt noch die Grösse der Platten, so dass man in etwa den Zeitaufwand des Rebuilds abschaetzen kann. Den Rebuild im RAID BIOS zu machen ist schonmal ne gute Idee, denn zugriffe während des Rebuilds verlängern die Dauer enorm.

Da ich davon ausgehe das eine der defekten Platten eine HotSpare ist (wie gesagt, wäre diese tatsächlich Teil des Arrays gewesen wäre das Array down) würde ich zuerst die Platte tauschen die Teil des Arrys war. Nach dem Rebuild kann die HotSpare dann auch getauscht werden wenn das System online ist, denn da sollte kein weiterer Rebuild nötig sein.

Wichtig: Ein RAID Rebuild ist sehr stressig für die Platten, vorallem wenn das System schon älter ist definitiv vorher das Backup überprüfen ;)

EDIT: Sicher und Schnell schliessen sich in den allermeisten Fällen völlig aus...

Gruß,

Ranayna
Aki-kun
Aki-kun 09.04.2013 aktualisiert um 19:59:53 Uhr
Goto Top
Hmm, wäre unschön . . .

So sieht der Monitor aus:
cbe719e1f95f03bf138fc564646f6d0f
Dani
Dani 09.04.2013 um 20:01:12 Uhr
Goto Top
Moin,
sieht aber so aus... RAID1 und RAID5.


Grüße,
Dani
SamvanRatt
SamvanRatt 09.04.2013 um 20:06:06 Uhr
Goto Top
Hi
wie sind denn die HDs defekt? Melden sich nicht mehr (an einem anderen Kontroller) oder Bad Blocks, klacken?
Welcher Hersteller der HDs?
Wenn du ein Backup hast: lösch das alte, zwei neue Hinzu (oder besser drei und RAID6) und neu bauen lassen+befüllen
Gruß
Sam
rana-mp
rana-mp 09.04.2013 um 20:06:23 Uhr
Goto Top
Ok, dass sieht ja noch halbwegs nach was aus... Defekt ist noch keine Platte, aber zwei haben Warnungen geschmissen...

Erster Schritt: Datensicherung machen! Ein RAID-Rebuild ist wie gesagt sehr stressig für die Platten. Die Wahrscheinlichkeit das die zweite Platte die jetzt Probleme hat wärend des Rebuilds aussteigt ist nicht unerheblich.

Zweitens: EINE, und nur eine, Platte ausbauen und das System rebuilden lassen. Kommt es während des Rebuilds zum Ausfall der zweiten Platte, am besten das gesamte RAID im Kontroller löschen, die zweite Platte ebenfalls austauschen (so das nur gute Platten drin sind) und die Datensicherung zurückspielen

Drittens: Sollte das Rebuild nach dem ersten Tausch erfolgreich durchgelaufen sein, jetzt auch die zweite Platte tauschen und den Rebuild abwarten. Auch hier kann es jetzt natürlich noch zu einem Fehler kommen, vorallem wenn die Platten alle aus der gleichen Charge kommen. Wenns passiert, siehe Schritt 2 ;)

Viertens: Hatt alles geklappt tief durchatmen face-smile

Fünftens: Für zukünftige Systeme gut drüber nachdenken ob RAID 5 wirklich das richtige ist, und ggf. besser RAID 6 oder 10 nutzen.
Aki-kun
Aki-kun 09.04.2013 um 20:07:42 Uhr
Goto Top
Also wenn das Raid 5 dann keinen Muckser mehr machen sollte besteht noch Hoffnung. Es arbeitet ja noch. Zugriff ist auch noch vorhanden.
Der Monitor zeigt mir auch an, dass vom Raid nur eine Platte fehlt, auch wenn 2 Platten oben markiert wurden.

Aber so wie es aussieht kann ich eh nicht bei Platte zusammen tauschen. Werd aber definitiv beide Platten tauschen lassen.

Ich freu mich schon rauszufinden, was nun wirklich die kaputte Platte ist.
SamvanRatt
SamvanRatt 09.04.2013 um 20:08:32 Uhr
Goto Top
Nach der Meldung hat SMART und das Replacement zugeschlagen; du könntest die HD extern clonen und dann mit ext. Software wie Filescavenger wieder zusammensuchen lassen; mit Backup aber unsinnig und mit Downtime verbunden.
rana-mp
rana-mp 09.04.2013 um 20:11:13 Uhr
Goto Top
Wow, jetzt hab ich das erst gesehen im Screenshot, Platte 3 fehlt ja... War die Teil des Raids?

Wenn ja, dann ist der Vorschlag von SamvanRatt wohl die bessere Lösung. Bei 3 defekten Platten (also 3 nötigen Rebuilds) geht das wahrscheinlich sogar schneller und ist deutlich stressfreier, wenn du deiner Datensicherung vertraust.
Aki-kun
Aki-kun 09.04.2013 aktualisiert um 20:13:36 Uhr
Goto Top
Jo, das war der Plan. ich hoffe auf Viertens.

Zu Fünftens: Ich hab die Systeme nicht aufgesetzt, wurde nur zur Hilfe dazugerufen. Ich mag Raid 5 nicht und nutz fast nur 10


EDIT: Argl, so hab ich das noch gar nicht gesehen ,dass da eine Platte fehlen könnte. Das wurde mir vom Betreiber auch nicht gesagt. Er meinte da nur Raid 5 mit 4 Platten . . .
Wird ein längerer Besuch morgen . . .
broecker
broecker 09.04.2013 um 20:13:36 Uhr
Goto Top
Alles eindeutig, 4 aus (4,5,7=RAID5) ist defekt, 6 ist auch defekt, aber keinem RAiD zugeordnet, also RAID5-Backup überprüfen und 4 ersetzen, wenn eine intakte noch verfügbar ist, danach 3 Minuten nach dem Start von 4-Rebuild, 6 ersetzen vielleicht wird sie automatisch HotSpare - wenn nicht schad's nicht.
Zum Weltfrieden klärt's nichts - aber das wäre wohl zuviel verlangt...
HG
Mark
108012
108012 09.04.2013 aktualisiert um 20:24:09 Uhr
Goto Top
Hallo Aki,

Auf dem RAID1 ist wohl das OS und auf dem RAID5 die Daten.

Drive 2 und 3 fehlen komplett und 4 und 6 haben Warnungen angezeigt, oder irre ich mich jetzt.
Müsste das dann nicht ein RAID5 mit 9 HDDs sein?

Ich würde auch gleich neue Platten kaufen wenn das RAID schon ein paar Jahre auf dem "Puckel" hat, denn
es ist nicht selten das sich auch andere Platten "verabschieden" während des Rebuilds!!!
2 HDDs sind schon platt und zwei haben Warnungen.

Falls das nicht möglich ist mach das Rebuild nicht am WE denn da kann man dann keine neuen HDDs
kaufen!!!!

(Der Server eh gegen eine neue Maschine ausgetauscht, muss aber noch ein paar Wochen durchhalten)
Evtl. gleich neue HDDs holen und diese dann im neuen Server weiternutzen?

Gruß
Dobby
Aki-kun
Aki-kun 09.04.2013 um 20:34:31 Uhr
Goto Top
Ich bin doch etwas froh, nicht die Verantwortung für die Systeme zu tragen. Ich soll sie nur "retten". Ich hoff nur, dass das Backup auch wirklich gemacht ist.

Hatte nur bisher keine solche Konstellation. Eine defekte Platte ist ja im Normalfall kein Problem und man kennt auch seine Systeme.

Vielen Dank für eure Hilfe. Morgen entscheidets sichs face-big-smile

Aki
108012
108012 09.04.2013 um 20:37:08 Uhr
Goto Top
Vielen Dank für eure Hilfe. Morgen entscheidets sichs
Sei mal Kumpel und schau da rein und poste hier wie viele HDDs es nun wirklich gewesen sind.
Wäre ein feiner Zug von Dir.

Gruß
Dobby
Dani
Dani 09.04.2013 aktualisiert um 21:08:03 Uhr
Goto Top
Drive 2 und 3 fehlen komplett und 4 und 6 haben Warnungen angezeigt, oder irre ich mich jetzt.
Müsste das dann nicht ein RAID5 mit 9 HDDs sein?
Ich sehe das so, dass an Port 2 und 3 gar keine Platten angeschlossen sind.
Es ist ein RAID1 mit zwei Festplatten und ein RAID5 mit vieren, wetten? face-big-smile


Grüße,
Dani
108012
108012 09.04.2013 aktualisiert um 21:07:48 Uhr
Goto Top
Hallo,

Es ist ein RAID1 mit zwei Festplatten und ein RAID5 mit vieren, wetten?
Das kann natürlich auch sein! Gar nicht mal so schlecht!
Daran habe ich einfach nicht gedacht.

Aber wetten tue ich nicht.

Gruß
Dobby
keine-ahnung
keine-ahnung 09.04.2013 um 22:30:44 Uhr
Goto Top
Moinsens,

da muss man nicht wetten, steht alles in der Konsole drin ...
im RAID 5 ist die dritte Platte defekt. Aber komische Oberfläche ist das schon ....

LG, Thomas
broecker
broecker 09.04.2013 um 22:36:53 Uhr
Goto Top
ähm, man kann natürlich auch über RAID7 mit 4 1/2 Platten sinnieren, aber nochmal: es steht da (Screenshot: die Zeilen mit RAID) explizit und eindeutig, welche Platten RAID1 (zwei Stück) und welche (drei Stück) RAID5 bilden - gleichfalls welche davon ausgefallen sind, das ist Wetten mit 49 eingeklemmten Kugeln...
108012
108012 10.04.2013 um 00:02:10 Uhr
Goto Top
@broecker

und welche (drei Stück) RAID5 bilden -
Jo nun habe ich es auch, aber da ist doch dann nur ein Fragezeichen zu sehen (?)
evtl. hat er ja Glück und es ist nur eine Platte abgeraucht, oder irre ich schon wieder?
broecker
broecker 10.04.2013 um 05:58:35 Uhr
Goto Top
@108012
das "?" ist die, dem RAID5 nicht mehr zugeordnete HotSpare-Platte - abgerauchtes RAID sähe anders aus ...
Lochkartenstanzer
Lochkartenstanzer 10.04.2013 aktualisiert um 12:31:25 Uhr
Goto Top
Moin,

nachdem das identische Platten zu sein scheinen und mindestens 2 demnächst das Zeitliche segnen werden, wären die Maßnahmen, die ich treffen würde:

  • Image ziehen.
  • Alle(!) Platten des RAID5 tauschen
  • Image zurückspielen.

Dürfte am schnellsten udn streßfreiesten gehen. Der Mehrpreis um "funktionierende" Platten gleich auszutauschen, statt 2-4 Wochen später, rechnet sich.

lks

PS: das ganze natürlich offline, damit es schnell geht.
keine-ahnung
keine-ahnung 10.04.2013 um 13:04:05 Uhr
Goto Top
Mahlzeit miteinand,

ist so eine Frage mit allen Platten austauschen. Wenn der Server wirklich nur noch "ein paar Wochen" halten muss (wieviel sind ein paar? 4? 127?) und man keine Ersatzplatten hat ... Kaufst Du für teuer Geld neue, die dann im neuen Server eventuell nicht mehr in der Kompatibilitätsliste stehen?

Wenn's meiner wäre würde ich gucken, ob ich nicht aus den verbliebenen Platten ein RAID 1 basteln kann, wenn der Platz ausreicht ... oder, ganz Sakrileg, ob ich nicht für den verbleibenden Zeitraum mit JBOD's auskäme und dafür öfter sichern würde ...

Duck und weg, Thomas
Lochkartenstanzer
Lochkartenstanzer 10.04.2013 um 15:26:34 Uhr
Goto Top
Zitat von @keine-ahnung:
Platz ausreicht ... oder, ganz Sakrileg, ob ich nicht für den verbleibenden Zeitraum mit JBOD's auskäme und
dafür öfter sichern würde ...

Wie ich immer sage:

Einfach schauen, was mehr kostet - Ein Tag nicht arbeiten können oder ein paar neue Platten. face-smile

lks
Aki-kun
Aki-kun 13.05.2013 um 22:19:14 Uhr
Goto Top
Soo, endlich Licht im Dunkel.

Und wie versprochen die Auflösung.

Es war tatsächlich ein Raid 1 mit 2 und ein Raid 5 mit 4 Platten. Davon war eine Platte komplett tot und 2 Platten mit SMART-Warnings.

Kunde hat alle 3 Platten tauschen lassen, Rebuild lief auch recht schnell durch. Wundert auch nicht ganz bei 300 GB SAS-HDDs mit 15K

Und Fujitsu liefert noch ne halbe Ewigkeit kompatible und zertifizierte Ersatzteile für ihre Server nach (Der Kunde muss nur bereit sein sie zu bezahlen).

Danke für eure Hilfe

Aki
Lochkartenstanzer
Lochkartenstanzer 14.05.2013 um 07:38:13 Uhr
Goto Top
Zitat von @Aki-kun:
Und Fujitsu liefert noch ne halbe Ewigkeit kompatible und zertifizierte Ersatzteile für ihre Server nach (Der Kunde muss nur
bereit sein sie zu bezahlen).

Das machen so ziemlich viele ernsthaften Serverhersteller. Man bekommt von manchen immer noch SCSI2-Platten, obwohl die schon längst im Museum stehen (sollten). Die Preise dafür sind allerdigns jenseits von gut und böse. face-smile

lks