95169
Goto Top

HP DL380G6: Fehler im Raid - HW defekt?

Hallo Zusammen

Ich habe ein Kundensystem zur Betreuung übernommen...
Der Kunde hat ein HP DL380G6 mit einem Raid 5, seit ein paar Tagen ist die ganze Kiste langsam und in der Ereignisanzeige erhalte ich diese Fehler
129, HpSAMD: Ein Zurücksetzen auf Gerät "\device\Raidport0" wurde ausgegeben
154, disk: Fehler beim E/A-Vorgang an der logischen Blockadresse "0x5e43dbc0" für den Datenträger "0" (PDO-Name: \Device\00000042) aufgrund eines Hardwarefehlers.

Der HP Smart Storage Administrator gibt mir keinen Fehler aus und im ADU-Report sehe ich auf die schnelle nichts

System:
Controller: Smart Array P410i
5 x 300GB SAS HDD
72GB RAM
2 x Xeon X5560
Windows Server 2012R2

Darauf laufen 4 virt. PCs, nichts Systemkritisches, das systemkritische (DB und Daten) habe ich auf einen zweiten Server ausgelagert.

Kann mir jemand, da einen Tipp geben, nach was ich im ADU suchen soll?

Gruss + Danke
Senior-ipaq

Content-Key: 516653

Url: https://administrator.de/contentid/516653

Printed on: April 19, 2024 at 20:04 o'clock

Member: erikro
erikro Nov 19, 2019 at 08:03:15 (UTC)
Goto Top
Moin,

steht doch in Deiner Fehlermeldung. Die Platte 0 hat einen HW-Defekt. Tauschen und gut ist.

hth

Erik
Member: spec1re
spec1re Nov 19, 2019 at 08:12:58 (UTC)
Goto Top
Noch ein Tipp, Datenbanken immer auf ein Raid 10, die 5 x 300GB SAS HDD hätte ich 4 x in ein Raid 10 gemacht und die fünfte als Hot Spare. Raid 5 ist was für Pfennigfuchser, fällt eine Platte aus lahmt das ganze System und beim Rebuild ist dann erst mal Feierabend.

Gruß Spec.
Member: falscher-sperrstatus
falscher-sperrstatus Nov 19, 2019 at 08:17:27 (UTC)
Goto Top
Als Datengrab sicher OK.

Für Datenbanken auf jeden Fall Raid1(0), aber hier, musst du zugeben, ist das ganze System langsam die Krücke. Die CPU hat mittlerweile grob 10 Jahre auf dem Rücken.

VG
Mitglied: 95169
95169 Nov 19, 2019 updated at 09:44:38 (UTC)
Goto Top
@Eric
Das ist die Fehlermeldung in der Ereignisanzeige.
wenn jetzt die Platte 0 einen Fehler hat, sollte aus meiner Sicht der Raid-Controller und das hp tool bei der platte 0 auch einen Fehler anzeigen.
Und das macht es nicht.
Mitglied: 95169
95169 Nov 19, 2019 at 09:41:19 (UTC)
Goto Top
Wie gesagt, ich habe das System so übernommen....
Raid 5 hat mein Vorgänger gemacht, ich darf es jetzt ausbaden
Member: erikro
erikro Nov 19, 2019 at 10:58:41 (UTC)
Goto Top
Moin,

Zitat von @95169:

@Eric
Das ist die Fehlermeldung in der Ereignisanzeige.
wenn jetzt die Platte 0 einen Fehler hat, sollte aus meiner Sicht der Raid-Controller und das hp tool bei der platte 0 auch einen Fehler anzeigen.
Und das macht es nicht.

Tja, das ist eine gute Frage. Aber wenn es denn die Fehlermeldung gibt, dann würde ich immer die Ersatzplatte aus dem Schrank holen und tauschen.

Liebe Grüße

Erik
Mitglied: 95169
95169 Nov 19, 2019 at 12:49:08 (UTC)
Goto Top
@erik
Bitte korrigier mich, wenn ich total falsch liege:
Windows sieht bei einem Raid-System im Normalfall gar nicht die einzelnen Platten, sondern nur das Volume, das über die Platten geht.
Wie weiss dann Windows welche Platte defekt ist? Ist es nicht eher so, das dies eigentlich die Aufgabe des Raidcontrollers und dieser zeigt mir weder beim Bios noch in der Windows-Oberfläche eine defekte Platte an.
Ich nehme auch an, das irgend eine Platte defekt ist, aber welche....

Aufgrund einer solchen Aussage (Raidplatte 0 in der Ereignisanzeige) habe ich schon mal ein Raid-System gekillt...
Es gab die Fehlermeldung, Raidplatte 0, defekt war im Raid eine andere Platte...

Gruss
senior-ipaq
Member: spec1re
spec1re Nov 19, 2019 at 13:23:47 (UTC)
Goto Top
Eigentlich sollte bei einem HP DL380 G6 mit einem Smart Array P410i und mit original HP SAS HDDs, vorne bei der defekten eine LED orange blicken. Die Controller und HDD Firmware ist aktuell? Kann mich erinnern, das es ein paar Firmware Updates gab, wegen drohendem Datenverlust usw.

Du kannst auch noch mal in der ILO Weboberfläche ins Event Log rein schauen.

Gruß Spec.
Member: erikro
erikro Nov 19, 2019 at 13:31:27 (UTC)
Goto Top
Moin,

Zitat von @95169:
Windows sieht bei einem Raid-System im Normalfall gar nicht die einzelnen Platten, sondern nur das Volume, das über die Platten geht.

Das stimmt.

Wie weiss dann Windows welche Platte defekt ist? Ist es nicht eher so, das dies eigentlich die Aufgabe des Raidcontrollers und dieser zeigt mir weder beim Bios noch in der Windows-Oberfläche eine defekte Platte an.
Ich nehme auch an, das irgend eine Platte defekt ist, aber welche....

Was sagt denn die ILO? Bei HP ist die doch extrem geschwätzig. Hast Du da schon geguckt, ob eine Platte als defekt gemeldet wird?

Liebe Grüße

Erik
Member: goscho
Solution goscho Nov 19, 2019 at 14:35:23 (UTC)
Goto Top
Mahlzeit,

schau mal in meinen Erfahrungsbericht zu einem ML350P G8.

Dort war es ähnlich, es wurde kein Defekt einer einzelnen HDD gemeldet. Aber bei weiteren Nachforschungen habe ich Lesefehler gefunden und die entsprechende HDD ersetzt. Seither ist alles wieder gut.

HPE Proliant ML350P Gen8 Probleme mit Zugriff auf Raid-Volumes
Mitglied: 95169
95169 Nov 19, 2019 at 16:36:14 (UTC)
Goto Top
Hallo goscho

Vielen Dank, das wird es vermutlich sein, ich habe bei einer Platte 3 read Fehler im Abschnitt "Monitor and Performance Statistics (Since Reset)" gesehen:

Read Errors Hard 0x00000000
Read Errors Retry Recovered 0x0000030f
Read Errors ECC Corrected 0x0000000000000001

gruss
senior-ipaq
Mitglied: 95169
95169 Nov 19, 2019 at 16:37:14 (UTC)
Goto Top
Wie gesagt alles grün...
Erst auf den Hinweis von Goscho habe ich was entdeckt