HP Proliant DL380 G9 stürzt ab und fährt nicht mehr hoch
Hallo zusammen
Wir haben seit ein mehreren Wochen das kuriose Problem, daß ein HP Server ständig crasht. Fast immer in in Abständen von genau einer Woche zum ähnlichen Tageszeitpunkt.
Das blöde daran ist, daß er danach nicht mehr hochfährt, wenn man ihn nicht vom Stromnetz trennt für eine Zeit von etwa 20 Minuten.
Steckt man dann die Stecker wieder rein, fährt er ganz normal wieder hoch als sei nichts gewesen.
- HP Server DL380 G9
- 96GB RAM,
- 2 x E5 2680v4
- 4 x HP SAS 600GB als Raid5
- 2 x 500W Netzteile
- ESXi 6.0.0 3620759
- Der Server ist ca 4 Jahre alt
- Der Server steht frei, hat keinerlei Staub und die Lüfter laufen fast auf Minimum.
Auf dem ESXi laufen 4 Windows Server, ein Windows 10 Testclient, sowie die Powerchute appliance in der Version 4.3
- 1 x Server 2019 DC, DNS, Printspooler, DHCP, das übliche
- 1 x Server 2016 für Exchange 2016
- 1 x Server 2019 RDP Broker + Host
- 1 x Server 2019 RDP Host
Der Server zeigt im iLO einen Stromverbauch von ca. 260 Watt an
Der Server hängt schon immer an einer 1500er APC USV. Diese wurde vor 14 Tagen komplett erneuert ohne Erfolg
Es hängt noch ein Microserver und ein kleines NAS an der USV, die ohne Probleme weiterlaufen.
Was wir probiert haben.
- HP Firmware upgrade alles auf den neuesten Stand - kein Erfolg
- Netzteile getauscht auf 2 x 1400 Watt - kein Erfolg
- Cache Batterie getauscht - kein Erfolg
- Stromversorgung von Hardware controlled auf OS controlled hin und herprobiert - kein Erfolg
- Volle Leistung oder ausgewogen - kein Erfolg
- Alle Komponenten raus, Kontakte geprüft, gereinigt - kein Erfolg
- RAMs in den Steckplätzen getauscht - kein Erfolg
- Prozessoren vertauscht, Kühlpaste erneuert - kein Erfolg. Die Dinger sind selbst bei offenen Gehäuse nur mässig warm.
- Im Haus herumgesucht ob zu den Zeitpunkten irgendjemand in den anderen Büros Experimente am Strom macht. Ohne Erfolg. ist auch schon mal an einem Samstag Nachmittag passiert, wo sonst keiner da war.
Uns gehen jetzt die Ideen aus. Wir haben mit der Lupe das Mainboard untersucht auf defekte oder geplatzte Kondensatoren, ist aber nichts zu erkennen (von oben)
Wer hat einen Tipp? Bleibt eigentlich nur das Mainboard und die Prozessoren, oder?
Wir haben seit ein mehreren Wochen das kuriose Problem, daß ein HP Server ständig crasht. Fast immer in in Abständen von genau einer Woche zum ähnlichen Tageszeitpunkt.
Das blöde daran ist, daß er danach nicht mehr hochfährt, wenn man ihn nicht vom Stromnetz trennt für eine Zeit von etwa 20 Minuten.
Steckt man dann die Stecker wieder rein, fährt er ganz normal wieder hoch als sei nichts gewesen.
- HP Server DL380 G9
- 96GB RAM,
- 2 x E5 2680v4
- 4 x HP SAS 600GB als Raid5
- 2 x 500W Netzteile
- ESXi 6.0.0 3620759
- Der Server ist ca 4 Jahre alt
- Der Server steht frei, hat keinerlei Staub und die Lüfter laufen fast auf Minimum.
Auf dem ESXi laufen 4 Windows Server, ein Windows 10 Testclient, sowie die Powerchute appliance in der Version 4.3
- 1 x Server 2019 DC, DNS, Printspooler, DHCP, das übliche
- 1 x Server 2016 für Exchange 2016
- 1 x Server 2019 RDP Broker + Host
- 1 x Server 2019 RDP Host
Der Server zeigt im iLO einen Stromverbauch von ca. 260 Watt an
Der Server hängt schon immer an einer 1500er APC USV. Diese wurde vor 14 Tagen komplett erneuert ohne Erfolg
Es hängt noch ein Microserver und ein kleines NAS an der USV, die ohne Probleme weiterlaufen.
Was wir probiert haben.
- HP Firmware upgrade alles auf den neuesten Stand - kein Erfolg
- Netzteile getauscht auf 2 x 1400 Watt - kein Erfolg
- Cache Batterie getauscht - kein Erfolg
- Stromversorgung von Hardware controlled auf OS controlled hin und herprobiert - kein Erfolg
- Volle Leistung oder ausgewogen - kein Erfolg
- Alle Komponenten raus, Kontakte geprüft, gereinigt - kein Erfolg
- RAMs in den Steckplätzen getauscht - kein Erfolg
- Prozessoren vertauscht, Kühlpaste erneuert - kein Erfolg. Die Dinger sind selbst bei offenen Gehäuse nur mässig warm.
- Im Haus herumgesucht ob zu den Zeitpunkten irgendjemand in den anderen Büros Experimente am Strom macht. Ohne Erfolg. ist auch schon mal an einem Samstag Nachmittag passiert, wo sonst keiner da war.
Uns gehen jetzt die Ideen aus. Wir haben mit der Lupe das Mainboard untersucht auf defekte oder geplatzte Kondensatoren, ist aber nichts zu erkennen (von oben)
Wer hat einen Tipp? Bleibt eigentlich nur das Mainboard und die Prozessoren, oder?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 629802
Url: https://administrator.de/contentid/629802
Ausgedruckt am: 21.11.2024 um 17:11 Uhr
16 Kommentare
Neuester Kommentar
Zitat von @MacLeod:
Der Log vom Esxi ist leer bzw. beginnt erst wieder mit dem Neustart des Systems.
Der Log vom iLo sagt "Server Power removed"
Der Log vom Esxi ist leer bzw. beginnt erst wieder mit dem Neustart des Systems.
Der Log vom iLo sagt "Server Power removed"
Sind beide Netzteile angeschlossen?
Servas
(Wichtige) Server kaufe ich prinzipiell mit möglichst langer Garantiezeit, 5 Jahre sind da die Untergrenze. Hast Du da noch Garantie oder ist die schon abgelaufen?
Ansonsten: Hast Du mehrere Server, sprich kannst Du die VMs verschieben? Dann tue es und laß den HP ohne irgendwas laufen. Dann die VMs einzeln rüber ....... verdammt jeweils eine Woche warten ist ....... ein bißchen lang
Gibt die Ereignisanzeige was her? Nicht nur vom Host, auch die der VMs.
(Wichtige) Server kaufe ich prinzipiell mit möglichst langer Garantiezeit, 5 Jahre sind da die Untergrenze. Hast Du da noch Garantie oder ist die schon abgelaufen?
Ansonsten: Hast Du mehrere Server, sprich kannst Du die VMs verschieben? Dann tue es und laß den HP ohne irgendwas laufen. Dann die VMs einzeln rüber ....... verdammt jeweils eine Woche warten ist ....... ein bißchen lang
Gibt die Ereignisanzeige was her? Nicht nur vom Host, auch die der VMs.
Zitat von @MacLeod:>
- Support ist leider keiner mehr auf der Büchse. Hatte der Kunde nicht mitgeordert
- Support ist leider keiner mehr auf der Büchse. Hatte der Kunde nicht mitgeordert
Damit kann der Server nicht so wichtig sein Sprich Du hast Zeit ....... Wie schauts mit dem Platz auf anderen(?) Servern aus? Kannst was verschieben? Kannst irgendwo ein (Leih)Gerät auftreiben? Irgendwie den Zeitdruck herausnehmen.
Die Frage ist halt nur, ob das wirklich das Mainboard ist.
Ein Gebrauchter kostet so um die 2.000er herum die 9.Generation gibts seit 2014, also 6 Jahre.
Ich würde entweder ein gebrauchtes gleichwertiges oder neueres Gerät mit Garantie nehmen (alles aus einer Hand) oder wenn ich schon Teile tausche nur solche die ich, wenn sich herausstellt, daß die doch nicht fehlerhaft sind entwerder zurückgeben oder anderwertig weiterverwenden kann.
Nichts ist für einen Kunden ärgerlicher als zahlen, zahlen und zahlen ...... und das wars doch nicht die Arbeitszeit mußt ja auch rechnen .... und da kommen schon ein paar Stunden zusammen.
Zitat von @MacLeod:
Wir haben seit ein mehreren Wochen das kuriose Problem, daß ein HP Server ständig crasht.
Moin,Wir haben seit ein mehreren Wochen das kuriose Problem, daß ein HP Server ständig crasht.
die Erfahrung kann ich bei einem Spezl ebenfalls teilen:
- der DL380 G9 Server fuhr aus dem nichts herunter und legte mal kurz das Unternehmen lahm
- der HPE Support ist eine eine mittlere Katastrophe
-- Firmware Update hast du eingespielt (ist ein bekanntes Problem)
-- Es ist wahrscheinlich, dass das Problem wieder auftreten kann, dann aber ist es ein Hardware Defekt.
Er hat aber nur das SPP eingespielt, da fehlen ca. 50% Firmwareupdates. Heißt "Firmwareupdates installiert" zählt bei ihm nicht