HP NetRAID
Predictive failure detected!?
Es geht um einen HP NetServer LH3 mit NetRAID LSI-Controller.
Das "Problem" ist das in der Log der Softwareverwaltung ständig der Fehler "Notify message : Predictive failure detected" auftaucht. Nur sind die Platten neu, womit könnte das zu tun haben?
Es geht um einen HP NetServer LH3 mit NetRAID LSI-Controller.
Das "Problem" ist das in der Log der Softwareverwaltung ständig der Fehler "Notify message : Predictive failure detected" auftaucht. Nur sind die Platten neu, womit könnte das zu tun haben?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 25455
Url: https://administrator.de/contentid/25455
Ausgedruckt am: 22.11.2024 um 16:11 Uhr
7 Kommentare
Neuester Kommentar
Hi,
es gibt mehrere Möglichkeiten:
Fremddisk (keine HP)
Firmware (Controller und Disk's)
SCSI Verkabelung
Die HP Disks haben eine Firmware, welche von HP kommt, es kann zu Fehlinterpretationen kommen (Testweise Orginal- HP- Disks einbauen)
Firmwareupdate auf Controller und Disks (sofern die von HP sind)
Kabel prüfen (eher unwahrscheinlich, da die Fehlermeldung auf ein Problem hinweist, das erst noch auftreten kann, z.B. zu geringe Drehzahl der Disk, was auf ein baldiges Lebensende dieser hinweisen würde)
Gruß - Toni
es gibt mehrere Möglichkeiten:
Fremddisk (keine HP)
Firmware (Controller und Disk's)
SCSI Verkabelung
Die HP Disks haben eine Firmware, welche von HP kommt, es kann zu Fehlinterpretationen kommen (Testweise Orginal- HP- Disks einbauen)
Firmwareupdate auf Controller und Disks (sofern die von HP sind)
Kabel prüfen (eher unwahrscheinlich, da die Fehlermeldung auf ein Problem hinweist, das erst noch auftreten kann, z.B. zu geringe Drehzahl der Disk, was auf ein baldiges Lebensende dieser hinweisen würde)
Gruß - Toni
Ich weiß nicht, was Du mit "Prozessorabfragen" meinst, die Platten werden vom Kontroller über die Diskfirmware mittels S.M.A.R.T überwacht, um drohende Ausfälle im Vorfeld melden zu können. Wenn nun der Kontroller von der (non-HP)-Firmware der Platte z.B. die Meldung "Temperatur OK" erhält, der Kontroller aber in diesem Bereich eine Info über die Drehzahl erwartet, wird eine Fehlinterpretation die Folge sein.
Probier mal eine Orginal- HP aus, ich hab noch nie eine Fremdplatte in einem HP getestet.
Ich kann Dir nur aus meiner Zeit bei der Compaq Server Hotline sagen, daß viele Leute billige Fremdplatten kauften (die Compaqs waren aber auch sauteuer), und dann bei uns anriefen, weil die Kisten nicht liefen. Fremd raus - CPQ rein: alles im Lack.
Wie gesagt, kann sein, muß nicht, am Besten testen.
Gruß - Toni
Probier mal eine Orginal- HP aus, ich hab noch nie eine Fremdplatte in einem HP getestet.
Ich kann Dir nur aus meiner Zeit bei der Compaq Server Hotline sagen, daß viele Leute billige Fremdplatten kauften (die Compaqs waren aber auch sauteuer), und dann bei uns anriefen, weil die Kisten nicht liefen. Fremd raus - CPQ rein: alles im Lack.
Wie gesagt, kann sein, muß nicht, am Besten testen.
Gruß - Toni
Das von Dir beschriebene Problem mit den 8 Disks ist mir bekannt, auch das hängt mit größter Wahrscheinlichkeit mit Firmwareinkonsistenzen zusammen (HP hat da aber auch keine sichere Lösung). Ich nehme an, daß bei dem Crash keine Platte defekt war oder nur eine, welche den Bus verstopft hat und dann den Rest mitruntergezogen hatte. Ergebnis dürfte gewesen sein (vermutlich war auch eine Hotspare im Spiel und der autom. Rebuild ging in die Hose) daß mehrere Disks auf failed, free und online standen. In dem Fall hättest Du nur die Hotspare mit der defekten Disk tauschen müssen (ausgeschaltet natürlich), die defekte Disk (Auslöser des Chaos) erkennt man im Log an der ersten Disk, die Mist produzierte. Danach das Array komplett löschen und ohne zu initialisieren wieder so konfigurieren, wie es vorher war. Nun noch die getauschte (Hotspare) auf failed setzen (weil die natürlich leer ist), und schon hast Du wieder ein funktionierendes Raid5 (allerdings degraded). Hotspare rein (neue Disk) rebuild starten - wohlfühlen. Falls keine Disk defekt war und keine Hotspare drin war, hätte es gereicht, die Platten wieder von failed auf online zu setzen. Klappt meistens. Die beschriebene Vorgehensweise ist NICHT supported, Datenverlust natürlich nicht 100%ig auszuschliessen (Controllercache), aber oft besser, als einen tagelangen Restore zu fahren.
Gruß - Toni
P.S. um so was produktiv machen zu können, sollte man vorher allerdings geübt haben, da der geringste Denkfehler zu einem Totalverlust führt!!!
Gruß - Toni
P.S. um so was produktiv machen zu können, sollte man vorher allerdings geübt haben, da der geringste Denkfehler zu einem Totalverlust führt!!!