sams15
Goto Top

HP DL380 Gen8 - 1ne SAS im Raid1 degraded

Hallo, habe in einem Raid1 Verbund (Bay) eine SAS Platte die mir als degraded am Server und in Lilo angezeigt wird. Wie ist das normale Vorgehen für den Austausch der SAS Platte?

Was ich bis her getan habe: ich habe via Linux (das auf dem Server als OS installiert ist) ein Backup in meinem Falle von sdb wie folgt gemacht 'dd if=./dev/sdb of=/usbPlatte'. Dann habe ich die als degraded gegenzeichnete Platte durch eine gleichwertige ausgetauscht und das Backup 'dd if=usbPlatte of=/dev/sdb' zurück gespielt. So weit so gut zumindest dachte ich das, aber leider nein die ausgetauschte Platte wird jetzt zwar nicht mehr am Server selbst aber in Lilo als degraded angezeigt.

Jetzt wäre es Sinnvoll zu wissen wie Ihr normalerweise eine degraded Platte wechselt, um evtl. von mir gemachte Fehler abzustellen bzw. das Problem lösen, bedanke mich vorab. Wenn ich das richtig in Erinnerung habe ist das der HP Controller P420i, kann aber bei Bedarf gerne nochmals nachschauen.

Content-ID: 32556905559

Url: https://administrator.de/contentid/32556905559

Ausgedruckt am: 24.11.2024 um 13:11 Uhr

StefanKittel
StefanKittel 16.05.2024 aktualisiert um 17:51:08 Uhr
Goto Top
Moin,

ähh... wie zurückgespielt?

Was für ein RAID-Controller?

Das normale vorgehene:
- Prüfen ob das Backup vorhanden und aktuell ist uns sonst eines erstellen
- Genau prüfen welche HDD defekt ist
- Defekte HDD rausnehmen und neue HDD reinstecken (im laufenden Betrieb)
- Warten bis das RAID sich wieder synchronisiert hat
Fertig

Es gibt wenige Controller wo man den Vorgang anstoßen muss.

Stefan
sams15
sams15 16.05.2024 um 18:12:48 Uhr
Goto Top
ja einfach das Backup mit neuer SAS Restore, dachte ich halt bzw. getan.

Anbei ein Bild von Lilo, hier wird genau an selbiger Stelle die getauschte SAS HDD als degraded an gemeckert.
Mein Controller ist ein: 'Smart Array P420i Controller' von HP
screenshot_20240516_180653
kreuzberger
kreuzberger 16.05.2024 um 18:27:12 Uhr
Goto Top
Moin @sams15

wenn du da für das Betriebssystem ein RAID1 hast, sind das in der Regel ja (mindestens) zwei identische Platten, von denen nur eine vermutlich einen Defekt hat. So weit, so gut. Das RAID1 soll dich genau davor schützen und du kannst dies Platte ohne Verlust austauschen.

Wir wissen nicht, was für ein RAID Controller da verbaut ist, das gibt sicher die Beschreibung deines Servers her. Aber der Austausch und erneute Spiegelung (RAID1) übernimmt normalerweise ohne weiteres zutun der RAID-Controller (NACHLESEN DER CONTROLLER_ und SERVERBESCHREIBUNG!!!), indem du (Hot-Plug) die defekte Pladde entfernst und die Ersatzpladde rinnschubst.
Das dauert dann ne weile, bis die Spiegelung fertig ist, der Server insgesamt ist derweil lauffähig, aber vermutlich deutlich weniger performant.

Das wars schon

Kreuzberger
radiogugu
radiogugu 16.05.2024 um 19:42:18 Uhr
Goto Top
Nabend.

Wie die Kollegen schon schrieben, bei einem RAID Verbund muss eine Datensicherung nur dann zurückgespielt werden, wenn der Verbund gänzlich neu aufgebaut wurde.

Fällt ein Datenträger aus und die Toleranzgrenze ist noch nicht überschritten (bei RAID 1 darf eine HDD ausfallen - bei einem RAID 6 beispielsweise, dürfen zwei HDD ausfallen), dann muss nur ein neuer Datenträger mit mindestens gleicher Kapazität eingesetzt werden.

Der Rebuild der Daten sollte automatisch erfolgen. Dein genannter RAID Controller beherrscht das und es braucht etwas Geduld.

Hat sich der Status im iLO inzwischen geändert?

Bei 1TB HDD und einem RAID 1 sollte das recht schnell alles wieder in Ordnung sein.

Gruß
Marc
ukulele-7
ukulele-7 17.05.2024 um 08:42:30 Uhr
Goto Top
Die HP Server haben auch Locator LEDs die blau leuchten können um die Platte zu identifizieren. Eventuell kann man das im iLo auslösen oder die leuchtet sogar schon blau weil degraded. Das schlechteste, was man tun kann, ist nämlich die falsche Platte raus zu ziehen...
Hubert.N
Hubert.N 17.05.2024 um 08:59:44 Uhr
Goto Top
Moin

Zitat von @sams15:
Wie ist das normale Vorgehen für den Austausch der SAS Platte?
Du ziehst die defekte Platte raus und steckst eine neu rein.

Gruß
sams15
sams15 17.05.2024 um 16:21:32 Uhr
Goto Top
Hey vielen Dank für die Geduld und Erklärung. Ich denke ich habe es verstanden.

Ich habe die defekte Platte bereits getauscht und die LED an der Platte (die mir anzeigte das da was nicht stimmt) ist mittlerweile erlöschen, aber im Lilo nach wie vor, wie bereits auf dem Bild oben zu sehen, sagt das genau die getauscht Platte degraded sei, das wundert mich doch sehr.

Nun kann ich natürlich nochmals versuchen auch diese Platte zu ersetzten und mich in Geduld üben bis die Spieglung fertig ist. Oder ich ziehe mal für ein zwei Minuten die angeblich degraded bereits getauschte Platte heraus uns setzte Sie wieder ein. Was meint Ihr dazu?
radiogugu
radiogugu 17.05.2024 aktualisiert um 20:05:42 Uhr
Goto Top
Nun kann ich natürlich nochmals versuchen auch diese Platte zu ersetzten und mich in Geduld üben bis die Spieglung fertig ist.

Den Fortschritt muss man in iLO sehen, sodass du mitgeteilt bekommst, dass da eine Spiegelung im Gang ist.

Das sollte bei den logischen Laufwerken in den Klammern zu erkennen sein. Dort sollte neben "Degraded" noch "Rebuilding" stehen.

Gruß
Marc
sams15
sams15 17.05.2024 aktualisiert um 20:22:53 Uhr
Goto Top
Danke, große Schande über mein Haupt, jetzt verstehe ich auch den oben genanten Satz, bestimme die degraded Platte. Oje, bin doch die ganze Zeit davon ausgegangen das Box1 Bay 1 der untere SAS Schacht am Server ist, verdammt dem ist natürlich nicht so.

Wäre ich da mal früher dahinter gekommen dann hätte dies mir bestimmt viel Arbeit erspart. Egal jetzt wieder etwas gelernt. Sogleich die obere SAS Platte gewechselt und schon zeigt mir ILO kein degraded mehr. Aber dafür 'Health Critical'
    -Logical Drive 01
        Status	 Failed
        Capacity	931 GiB
        Fault Tolerance	RAID 1/RAID 1+0
        Logical Drive Type	Data LUN
        Encryption Status	Not Encrypted

Vielleicht wird ja gerade an der Spiegelung gearbeitet, wo ersehe ich den Status bzw. Fortschritt der Spiegelung?
radiogugu
radiogugu 18.05.2024 um 09:33:43 Uhr
Goto Top
Sogleich die obere SAS Platte gewechselt und schon zeigt mir ILO kein degraded mehr. Aber dafür 'Health Critical'

Das iLO hat ja ein Ereignisprotokoll. Dort wird dir angezeigt, warum es meint, dass es dem System nicht gut geht.

Müsste unter "Information" > "Event Logs" zu finden sein.

Sind denn unter den logischen Laufwerken alle Haken auf grün? Ist der Status jetzt wieder sauber beim RAID Verbund?

Gruß
Marc
sams15
sams15 19.05.2024 um 10:27:26 Uhr
Goto Top
Vielen lieben Dank, ich denke es funktioniert wieder alles soweit, aber an der Hardware bzw. rechts am HotPlug Schacht der beiden SAS Platten ist die LED an, die rötlich leuchtet, komisch. Anbei ebenfalls ein Teil-Bild des Event Log.

Bei dieser Gelegenheit drängt sich mir die Frage auf ob es Sinn macht ILO, für kleines Budget upzudaten und noch eine kleine Frage; kann ich die alte SAS irgendwie am besten via USB Bus anschließen und auslesen, bearbeiten usw., gib es dafür so etwas wie einen Adapter?
screenshot_20240519_101224
screenshot_20240519_100554
sams15
sams15 20.05.2024 um 11:57:29 Uhr
Goto Top
Noch ein kleine Frage was bedeutet dies, was kann muss ich tun?
Embedded Flash/SD-CARD 		Controller firmware revision 2.10.00 Embedded media manager failed media attach 
radiogugu
radiogugu 20.05.2024 um 14:31:54 Uhr
Goto Top
Aktualsiere mal dein iLO. Eventuell ist hier ein Software Problem gegeben.

Hat der Server eine BOSS Karte oder sind Betriebssystem und Daten auf demselben RAID aus den genannten HDDs?

Es ist auch immer empfehlenswert die HDDs eines RAID Verbundes diesselbe Serie zu verwenden.

Gruß
Marc
sams15
sams15 20.05.2024 um 19:23:32 Uhr
Goto Top
Das iLO habe ich heute erst auf Feb.02.2023 aktualisiert, genau danach erhielt ich auch die Meldung:
iLO Health (iLO Self-Test reports a problem with: Embedded Flash/SD-CARD. View details on Diagnostics page.)
Und 'Format Embedded Flash an Reset iLO' habe ich ebenfalls bereits getan. Da drängt sich mir die Frage auf wo hat der Server die SD-Card versteckt?. Ach so allerdings habe ich den Server seit dem nicht neu gestartet.

BOSS Karte, kannst du das ein wenig näher beschreiben? JA OS und Daten sind auf dem selben RAID, aber auf unterschiedlichen Partitionen, das ging bevor das HDD degreaded auftauchte ohne Probleme. Allerdings sind das schon, was die Serie und Hersteller betrifft, 2 unterschiedliche SAS's
screenshot_20240520_191041
screenshot_20240520_192059
screenshot_20240520_192129
radiogugu
radiogugu 21.05.2024 um 18:05:45 Uhr
Goto Top
BOSS Karte, kannst du das ein wenig näher beschreiben?

Boot Optimizes Storage Solution ist eine Erweiterung des Servers um eine PCIe Karte, welche beispielsweise zwei M.2 SSD "trägt" und mit eigenem RAID Controller den Speicher dann für das Server OS präsentiert.

Sowas hier:

https://www.serverschmiede.com/konfigurator_bulk/de/dell-boss-2x-m2-2280 ...

Ach so allerdings habe ich den Server seit dem nicht neu gestartet.

Nach einem Neustart können manche Probleme verschwunden oder andere aufgetaucht sein. Nichtsdestotrotz sollte man einen Neustart ab und an durchführen.

Gruß
Marc
sams15
sams15 23.05.2024 um 18:22:24 Uhr
Goto Top
thx, nein ein BOSS Karte habe ich keine zumindest nicht im Sinn RAID Controller. Aber dafür eine 4er NIC-Karte, die jedoch sehr wahrscheinlich, für das Problem nicht relevant sein dürfte.

Ok dann werde ich mal über das WE den Server neu starten. Und wieder berichten.
sams15
sams15 25.05.2024 um 19:27:55 Uhr
Goto Top
so jetzt kurz vor dem DFB Finale. Habe den Server neu gestartet.

Bilder sollen bekanntlich mehr aussagen als Worte.
Anbei ein paar Bilder, drei bzw. vier über den iLO Health Fehler bzw. Problem und eins via Kamera ohne Blitzlicht von der Server Front, hier kann man schön erkennen das die LED recht neben den zwei SAS bzw Bund an sind, leuchten.
screenshot_20240525_191312
screenshot_20240525_191244
screenshot_20240525_191335
20240525_191617
screenshot_20240525_191417