Spontanabschaltung HP Proliant ml350p gen 8 Fehlersuche
Hallo zusammen,
gestern war unser ProLiant ml350p gen8 spontan ausgeschaltet. Wieder eingeschaltet, läuft bis jetzt fehlerfrei.
Das Problem ist: ich finde keinen Grund dafür. Im Grunde sieht es so aus, als sei der Strom plötzlich weg gewesen, aber die USV hat nichts mitgeloggt und der Server hat 2 redundante Netzteile.
Unauffällig bisher:
Vor dem Abschalten ist nichts außergewöhnliches geloggt.
Wo kann ich weitersuchen (außer dass jetzt Gen10 aktuell wäre).
Der Server dient als HyperV Host, sonst ist nichts weiter drauf installiert (außer Treiber, Datensicherung, Antivirus, icinga2 Agent, Elastic-metricbeat)
Grüße
lcer
gestern war unser ProLiant ml350p gen8 spontan ausgeschaltet. Wieder eingeschaltet, läuft bis jetzt fehlerfrei.
Das Problem ist: ich finde keinen Grund dafür. Im Grunde sieht es so aus, als sei der Strom plötzlich weg gewesen, aber die USV hat nichts mitgeloggt und der Server hat 2 redundante Netzteile.
Unauffällig bisher:
- iLO Logs
- iLO Status
- Windows Logs: System, Anwendung
- USV Logs
- Kibana: keine Auffälligen Leistungsdaten
Vor dem Abschalten ist nichts außergewöhnliches geloggt.
Wo kann ich weitersuchen (außer dass jetzt Gen10 aktuell wäre).
Der Server dient als HyperV Host, sonst ist nichts weiter drauf installiert (außer Treiber, Datensicherung, Antivirus, icinga2 Agent, Elastic-metricbeat)
Grüße
lcer
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 390474
Url: https://administrator.de/forum/spontanabschaltung-hp-proliant-ml350p-gen-8-fehlersuche-390474.html
Ausgedruckt am: 07.04.2025 um 00:04 Uhr
34 Kommentare
Neuester Kommentar
Frag die Putzfrau, ob sie eine Steckdose für den Staubsauger gebraucht hat.
lks
PS: Vielleicht hat einer einfach den Ausschalter umgelegt/gedrückt und sich nicht getraut, das zu sagen.
Zitat von @Lochkartenstanzer:
Frag die Putzfrau, ob sie eine Steckdose für den Staubsauger gebraucht hat.
Frotzle nicht Frag die Putzfrau, ob sie eine Steckdose für den Staubsauger gebraucht hat.
Zitat der Putzi "...das mache ich doch schon seit Jahren, weil das Kabel nicht für die Flursteckdose reicht...".
Das da plötzlich ein Stecker drin war.... scheiß drauf...
Und keiner wusste, das ihr Schlüssel auch für den Serverraum passte
SH
Unser Azubi hat damals den Serverraum gesaugt und dabei den Sauger direkt an der USV angeschlossen weil sonst nix mehr frei war.
Zitat von @SachsenHessi:
das mit der Putzi habe ich wirklich erlebt !
Zitat von @Lochkartenstanzer:
Frag die Putzfrau, ob sie eine Steckdose für den Staubsauger gebraucht hat.
Frotzle nicht Frag die Putzfrau, ob sie eine Steckdose für den Staubsauger gebraucht hat.
Auch wenn ich das etwas ironisch schrieb, ist es doch ein ernstgemeinter Rat. Ich habe auch schon oft genug erlebt, daß jemand mal schnell eine freie Steckdose brauchte.
lis
Zitat von @keine-ahnung:
Den kannst Du doch von der Steuer absetzen, Betriebsausgaben... und dabei den Sauger direkt an der USV angeschlossen
Da ich mir die teuren DYSON-Akkusauger nicht leisten kann, betreibe ich meine Aldi-Sauger nur via USV. Man hat da einfach das Gefühl, auch reich und schön zu sein ...Gruss Penny.
Habs gerade erst bei einem DL380 G5 hinter mir...da wars das VRM für eine CPU, das spontan Fehler macht. War im ILO-Log nicht ersichtlich, da war nur der Shutdown zu sehen. Erst als es kurz darauf wieder aufgetreten ist bin ich zum Server hin und sah die Lämpchen, die mich auf den Fehler hinwiesen. Ergo: nicht alles steht klar im Log, lieber beim (hoffentlich nicht auftretenden) nächsten Mal vorm Anschalten am Server gucken, ob was leuchtet.
Zitat von @shadynet:
Habs gerade erst bei einem DL380 G5 hinter mir...da wars das VRM für eine CPU, das spontan Fehler macht. War im ILO-Log nicht ersichtlich, da war nur der Shutdown zu sehen. Erst als es kurz darauf wieder aufgetreten ist bin ich zum Server hin und sah die Lämpchen, die mich auf den Fehler hinwiesen. Ergo: nicht alles steht klar im Log, lieber beim (hoffentlich nicht auftretenden) nächsten Mal vorm Anschalten am Server gucken, ob was leuchtet.
Hm, erinnert mich an die IBM Netfinity 4500 in den 90er. Da haben wir im Rechenzentrum von der IBM eine ganze Kiste mit VRMs bekommen, weil diese damals reihenweise ausgestiegen / kaputt gegangen sind.Habs gerade erst bei einem DL380 G5 hinter mir...da wars das VRM für eine CPU, das spontan Fehler macht. War im ILO-Log nicht ersichtlich, da war nur der Shutdown zu sehen. Erst als es kurz darauf wieder aufgetreten ist bin ich zum Server hin und sah die Lämpchen, die mich auf den Fehler hinwiesen. Ergo: nicht alles steht klar im Log, lieber beim (hoffentlich nicht auftretenden) nächsten Mal vorm Anschalten am Server gucken, ob was leuchtet.
Gruss Penny.
Hi,
ich gehe doch stark davon aus, dass du nicht den Fehler gemacht und beide Netzteile auf die eine USV gehängt hast?
Nein, ein Host ist ein Host ist ein Host. Keine Backup-Software und kein AV haben da etwas zu suchen. Und wieso 2 Monitoring Agents?
Ansonsten, HP bringt immer SPPs für Pre-Gen9-Server raus, zieh mal prophylaktisch die neuesten Firmware-Updates drauf.
ich gehe doch stark davon aus, dass du nicht den Fehler gemacht und beide Netzteile auf die eine USV gehängt hast?
Der Server dient als HyperV Host, sonst ist nichts weiter drauf installiert (außer Treiber, Datensicherung, Antivirus, icinga2 Agent, Elastic-metricbeat)
Nein, ein Host ist ein Host ist ein Host. Keine Backup-Software und kein AV haben da etwas zu suchen. Und wieso 2 Monitoring Agents?
Ansonsten, HP bringt immer SPPs für Pre-Gen9-Server raus, zieh mal prophylaktisch die neuesten Firmware-Updates drauf.
Zitat von @chgorges:
Hi,
ich gehe doch stark davon aus, dass du nicht den Fehler gemacht und beide Netzteile auf die eine USV gehängt hast?
Wenn er nur eine USV hat, bleibt ihm nichts anderes übrig.Hi,
ich gehe doch stark davon aus, dass du nicht den Fehler gemacht und beide Netzteile auf die eine USV gehängt hast?
Der Server dient als HyperV Host, sonst ist nichts weiter drauf installiert (außer Treiber, Datensicherung, Antivirus, icinga2 Agent, Elastic-metricbeat)
Nein, ein Host ist ein Host ist ein Host. Keine Backup-Software und kein AV haben da etwas zu suchen. Und wieso 2 Monitoring Agents?
Und zwei Monitoring Agents ist wie zwei Virenscanner. Denn mit wenn der erste nixx findet, findet vielleicht der zweite was.
Gruss Penny.
Falsch. dann hängt man ein Netzteil direkt ans Netz und eines an die USV!
lks
PS: Ich gehe davon aus, daß die zwei Netzteile wegen der Redundanz und nicht wegen der Last drin sind.
Zitat von @Lochkartenstanzer:
Falsch. dann hängt man ein Netzteil direkt ans Netz und eines an die USV!
Falsch. dann hängt man ein Netzteil direkt ans Netz und eines an die USV!
Korrekt, genau darum geht es. Wenn man beide Netzteile auf ein und dieselbe USV hängt, kann man auch gleich 1 Netzteil ausbauen, die Redundanz ist damit hinüber.
Im Idealfall hat man zwei USVs an zwei unterschiedlichen Sicherungen, was man aber in der Realität fast nirgendwo antrifft.
Zitat von @lcer00:
Kann ich ja dann so machen, aber ich würde das als Ursache ausschließen. An der USV hängen auch andere Systeme und die sind zufrieden.
Kann ich ja dann so machen, aber ich würde das als Ursache ausschließen. An der USV hängen auch andere Systeme und die sind zufrieden.
Ok, wenn die Geräte keine Stromabschaltung in dem Zeitraum geloggt haben, bleiben eigentlich nur noch die Firmwareupdates vor Hardwaredefekt.
Hallo,
nur so halb.
Ein Brown-Out ist ein "Kurzzeitige Spannungsabsenkung infolge von Überlastung aufgrund unvorhergesehener Ereignisse".
Quelle: https://de.wikipedia.org/wiki/Stromausfall#Einteilung
Also wenn der Server mehr Strom braucht als die USV liefern kann.
Aber dann hätte die USV das protokollieren müssen.
Mehr Sinn macht der Hinweis von certifiedit.net
Der Effekt würde auch auftreten wenn der Server mehr Strom braucht als das Netzteil liefern kann.
Dann würde die USV davon nichts mitbekommen.
Stefan
nur so halb.
Ein Brown-Out ist ein "Kurzzeitige Spannungsabsenkung infolge von Überlastung aufgrund unvorhergesehener Ereignisse".
Quelle: https://de.wikipedia.org/wiki/Stromausfall#Einteilung
Also wenn der Server mehr Strom braucht als die USV liefern kann.
Aber dann hätte die USV das protokollieren müssen.
Mehr Sinn macht der Hinweis von certifiedit.net
Der Effekt würde auch auftreten wenn der Server mehr Strom braucht als das Netzteil liefern kann.
Dann würde die USV davon nichts mitbekommen.
Stefan
Zitat von @lcer00:
Wir hatte zu dem Zeitpunkt eine etwas höhere Auslastung des Systems durch parallele Kopiervorgänge vom NAS auf den Server (die liefen aber auf einer VM). Ist das eine denkbare Ursache?
Wir hatte zu dem Zeitpunkt eine etwas höhere Auslastung des Systems durch parallele Kopiervorgänge vom NAS auf den Server (die liefen aber auf einer VM). Ist das eine denkbare Ursache?
Funktionieren noch beide Netzteile? ggf. mal testen, indem man jeweils nur ein Netzteil mal abschaltet.
Zumindest scheinen sie unterdimensioniert für die Spitzenlast zu sein.
lks
Zitat von @lcer00:
Hallo,
Habe nochmal bei HP nachgefragt, knackige Aussage: Ursache ist die BIOS-Einstellung "HP Dynamic Power Savings Mode" und alles wird gut wenn ich auf "maximum performance" stelle.
Hallo,
Habe nochmal bei HP nachgefragt, knackige Aussage: Ursache ist die BIOS-Einstellung "HP Dynamic Power Savings Mode" und alles wird gut wenn ich auf "maximum performance" stelle.
Es ist aber trotzdem ein Unding, daß der Server sich abschaltet, statt einfach die Netzteile hochzufahren. Denn ein wenig ,ehr Strom ist nie wichtiger als die Kudendaten.
lks
Zitat von @Lochkartenstanzer:
Es ist aber trotzdem ein Unding, daß der Server sich abschaltet, statt einfach die Netzteile hochzufahren.
Es ist aber trotzdem ein Unding, daß der Server sich abschaltet, statt einfach die Netzteile hochzufahren.
Wieso Unding?
Zum Glück macht er das bevor die Kiste in Flamme aufgeht. Wir kennen ja auch die Konfiguration des Servers nicht, aber wenn er 24 HDDs, 2 CPUs, zig GB Ram und nur 2x 500Watt Netzteile hat, ist auch die Physik irgendwann am Ende, da gibt es dann nichts mehr zum Hochfahren...
Was die Aussage vom HP Support angeht, versuch das mit Maximum Power, Best Practise bei Virtualisierung (zumindest VMWare) ist eigentlich OS Control.
Zitat von @chgorges:
Wieso Unding?
Zum Glück macht er das bevor die Kiste in Flamme aufgeht. Wir kennen ja auch die Konfiguration des Servers nicht, aber wenn er 24 HDDs, 2 CPUs, zig GB Ram und nur 2x 500Watt Netzteile hat, ist auch die Physik irgendwann am Ende, da gibt es dann nichts mehr zum Hochfahren...
Zitat von @Lochkartenstanzer:
Es ist aber trotzdem ein Unding, daß der Server sich abschaltet, statt einfach die Netzteile hochzufahren.
Es ist aber trotzdem ein Unding, daß der Server sich abschaltet, statt einfach die Netzteile hochzufahren.
Wieso Unding?
Zum Glück macht er das bevor die Kiste in Flamme aufgeht. Wir kennen ja auch die Konfiguration des Servers nicht, aber wenn er 24 HDDs, 2 CPUs, zig GB Ram und nur 2x 500Watt Netzteile hat, ist auch die Physik irgendwann am Ende, da gibt es dann nichts mehr zum Hochfahren...
Wenn die BIOS-Einstellugen helfen, die Kiste am laufen zu halten, heißt das, daß die Netzteile genug Leistung haben auch bei Hochlast weiterzuarbeiten. Das ist genauso, wie wenn Dein schlaues Auto Dich auf Null runterbremst, weil Du als Geschwindigkeitsbegrenzung 130 angegeben hast und kurz zum überholen 150 fahren wolltest.
lks
Zitat von @lcer00:
2x460 Watt bei 2 CPU, 8 Platten, 64GB Ram und eine Netzwerkkarte mit 2xSFP+ 10Gbit
2x460 Watt bei 2 CPU, 8 Platten, 64GB Ram und eine Netzwerkkarte mit 2xSFP+ 10Gbit
PS: Zweimal 450Watt für so eine Kiste finde ich etwas untertrieben. Ich hätte da mindestens zwei 750er, eher 1000er verbaut. Um redundante Netzteile sinnvoll einzusetzen benötigt man welche, die die Last auch alleine stemmen können.