
96449
04.02.2021, aktualisiert am 08.02.2021
ProLiant DL380 Gen10 Disk Media Error mit Raid Controller
Guten Abend Community,
The Infos:
Server: ProLiant DL380 Gen10
Controller: HPE Smart Array P408i SR Gen 10
Hyper-V 2016 with 3 VMs
1 - Domain Controller
2 - Application Server
3 - Backup Server
2 logical Arrays
A1: 5x 900GB Raid 5
A2: 3x 480GB SSD Raid 5
The Problem:
Predicted Disk Failure @ A1-> Disk wurde durch einen HP Techniker ausgetauscht
Alles normal soweit. Disk Paritätsprüfung bleibt aber länger als sonst auf 0% stehen.
Nächster Tag:
Veeam Backup Meldung, dass die VM 1 - Domain Controller nicht gesichert werden konnte aufgrund von CRC Errors während der Synchronisation der vhd.
Die anderen 2 VMs wurden erfolgreich gesichert.
SSA / ILO / Windows Error Logs gecheckt:
SSA:
Logisches Laufwerk 1: Nicht wiederherstellbare Medienfehler auf Laufwerken während des letzten Umbaus oder einer Background Surface Analyse (ARM). Fehler werden automatisch behoben, wenn der Sektor/die Sektoren überschrieben wird/werden. Sicherung und Wiederherstellung sind empfehlenswert.
Für mich klingt das, dass das Raid mit der ersetzten Platte nicht sauber wiederhergestellt wurde und es dadurch defekte Blöcke auf dem Array hat.
Nochmals Rücksprache mit HP Support Techniker. Er meine, ich solle Firmwareupdates machen.
War für heute Abend geplant. Also nochmals ILO geprüft und ohh nice:
2tes Drive mit der Meldung:
900 GB SAS HDD in Port 2I : Gehäuse 3 : Schacht 5 steht ein Ausfall bevor.
Dies ist nicht die Disk, welche ersetzt wurde. sondern eine andere aber im gleichen Array (A1)
Nun meine eigentliche Frage(n):
Wie hoch ist die Chance, dass dieser Fehler durch Firmware verursacht wird?
Angenommen ich mache die Updates und reboote, besteht doch eine grosse chance, dass
der Hyper-V host nicht wieder hochfährt, wegen den defekten Sektoren im Array.
Wenn ich nun die neu angeschlagene Disk wechsle, denke ich, dass ich das Array komplett verliere oder sollte dies klappen?
Momentan mache ich ein manuelles Backup gewisser Daten auf dem Array (einfach zur Sicherheit)
Mein zweiter Plan wäre noch einen zweiten Server daneben zu stellen und dann die VMs verschieben, jedoch denke ich, dass es dort mit den CRC Errors auch Probleme geben wird.
Screenshots der Logs im Anhang
Eventlog ID 24606 ist die Disk, welche zuerst ausgetauscht wurde
Die zweite ist die Disk, welche neu angeschlagen ist.
Danke für eure Hilfe und einen schönen Abend
Various5
Edit: Problem ist soweit gelöst. (oder verschoben, je nach Ansichtssache)
Kurzform:
Disk gewechselt -> Parität bleibt bei 0% hängen -> Shutdown -> Reboot -> Raid OK.
Array immer noch defekt. chkdsk /r (mit der Annahme, dass ich danach eh Neu Aufsetzten kann)
Konnte aber danach die VMs sichern, sowie das Backup sicherstellen.
Daher mal soweit abgeschlossen.
The Infos:
Server: ProLiant DL380 Gen10
Controller: HPE Smart Array P408i SR Gen 10
Hyper-V 2016 with 3 VMs
1 - Domain Controller
2 - Application Server
3 - Backup Server
2 logical Arrays
A1: 5x 900GB Raid 5
A2: 3x 480GB SSD Raid 5
The Problem:
Predicted Disk Failure @ A1-> Disk wurde durch einen HP Techniker ausgetauscht
Alles normal soweit. Disk Paritätsprüfung bleibt aber länger als sonst auf 0% stehen.
Nächster Tag:
Veeam Backup Meldung, dass die VM 1 - Domain Controller nicht gesichert werden konnte aufgrund von CRC Errors während der Synchronisation der vhd.
Die anderen 2 VMs wurden erfolgreich gesichert.
SSA / ILO / Windows Error Logs gecheckt:
SSA:
Logisches Laufwerk 1: Nicht wiederherstellbare Medienfehler auf Laufwerken während des letzten Umbaus oder einer Background Surface Analyse (ARM). Fehler werden automatisch behoben, wenn der Sektor/die Sektoren überschrieben wird/werden. Sicherung und Wiederherstellung sind empfehlenswert.
Für mich klingt das, dass das Raid mit der ersetzten Platte nicht sauber wiederhergestellt wurde und es dadurch defekte Blöcke auf dem Array hat.
Nochmals Rücksprache mit HP Support Techniker. Er meine, ich solle Firmwareupdates machen.
War für heute Abend geplant. Also nochmals ILO geprüft und ohh nice:
2tes Drive mit der Meldung:
900 GB SAS HDD in Port 2I : Gehäuse 3 : Schacht 5 steht ein Ausfall bevor.
Dies ist nicht die Disk, welche ersetzt wurde. sondern eine andere aber im gleichen Array (A1)
Nun meine eigentliche Frage(n):
Wie hoch ist die Chance, dass dieser Fehler durch Firmware verursacht wird?
Angenommen ich mache die Updates und reboote, besteht doch eine grosse chance, dass
der Hyper-V host nicht wieder hochfährt, wegen den defekten Sektoren im Array.
Wenn ich nun die neu angeschlagene Disk wechsle, denke ich, dass ich das Array komplett verliere oder sollte dies klappen?
Momentan mache ich ein manuelles Backup gewisser Daten auf dem Array (einfach zur Sicherheit)
Mein zweiter Plan wäre noch einen zweiten Server daneben zu stellen und dann die VMs verschieben, jedoch denke ich, dass es dort mit den CRC Errors auch Probleme geben wird.
Screenshots der Logs im Anhang
Eventlog ID 24606 ist die Disk, welche zuerst ausgetauscht wurde
Die zweite ist die Disk, welche neu angeschlagen ist.
Danke für eure Hilfe und einen schönen Abend
Various5
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 648157
Url: https://administrator.de/forum/proliant-dl380-gen10-disk-media-error-mit-raid-controller-648157.html
Ausgedruckt am: 15.04.2025 um 09:04 Uhr
4 Kommentare
Neuester Kommentar
Hallo,
Gruß,
Peter
Zitat von @96449:
Screenshots der Logs:
Bitte die Logs als Text und nicht als Bild auf irgendwelchen Quellen hier rein stellen. Danke. Auch Bilder kannst du hier rein stellen.Screenshots der Logs:
jedoch denke ich, dass es dort mit den CRC Errors auch Probleme geben wird.
Warum, hat denn der zweite Server auch und an den gleichen Stellen CRC Fehler?Gruß,
Peter