schroedingers.katze
Goto Top

Server stürzt neuerdings öfters mal ab. Wo könnte der Fehler liegen?

Hallo zusammen,

ich habe neuerdings ein Problem mit unserem Mailserver. Anfang der Woche ist der Server bereits schon mal hängen geblieben. Heute wieder. Das ist insgesamt recht ungewöhnlich, weil er vorher zwei Jahre lang recht klaglos seinen Dienst getan hat.

Der Server ist im Fehlerfall überhaupt nicht mehr ansprechbar. Weder über's Netzwerk (auch kein Ping), noch direkt mit Maus, Tastatur und Bildschirm.
Bei dem Server handelt es sich um einen HP Microserver Gen 8, der mit Windows Server 2012 (ohne R2) läuft. Als der Fehler heute aufgetreten ist, dachte ich zumindest, dass der Server immer langsamer reagiert hat, bis er irgendwann komplett still stand. Der Server kennt dann laut iLO seine Netzwerkkarte auch nicht mehr. Lösen lässt sich die Situation nur, wenn man den Server hart abschaltet und dann neu startet. Im Eventlog sind keine Fehler zu finden.

Persönlich würde ich hier einen Hardwarefehler vermuten, vor allem weil die LED für den HDD Zugriff am Server im Fehlerfall dann dauerhaft leuchtet, ohne dass zumindest hörbar Zugriff da ist. Wirklich viel gibt das iLO nicht her, außer vielleicht die folgende Stelle hier. Kann das an dem CPLD-Modul liegen oder ist das ein normaler Zustand? Ich weiß es leider gerade nicht so wirklich.


Der Server wird sehr bald durch einen neuen abgelöst werden. Ich hab die Kiste schon hier stehen. Ich muss eigentlich nur noch den Mailserver migrieren. Mich würde aber trotzdem interessieren, was da verkehrt läuft. Habt ihr hier Ideen, wie ich dem weiter nachgehen könnte?

Grüße

schrödingers dingsda
hp_müll

Content-ID: 313726

Url: https://administrator.de/contentid/313726

Ausgedruckt am: 08.11.2024 um 15:11 Uhr

Vision2015
Vision2015 26.08.2016 um 20:37:42 Uhr
Goto Top
Nabend...
ich würde mal nen Speicher Test machen....

Frank
Schroedingers.Katze
Schroedingers.Katze 26.08.2016 um 20:43:08 Uhr
Goto Top
Hallo Frank,

danke für deine Antwort.

Ist soweit vermerkt. Das teste ich mal durch, sobald ich die Kiste aus dem Produktivbetrieb genommen habe. Habt ihr weitere Vorschläge?

Grüße

face-smile
Looser27
Looser27 26.08.2016 aktualisiert um 20:59:20 Uhr
Goto Top
CPU und PCIe Mal testen. RAID onboard oder separat?
Firmware ist up to date?
Schroedingers.Katze
Schroedingers.Katze 26.08.2016 um 21:29:10 Uhr
Goto Top
Firmware ist aktuell.

Seid ihr tatsächlich (auch) der Meinung, ich sollte hardwareseitig weitersuchen? Wenn ja, darf ich fragen, wieso ihr das so seht? Ich finde den Fehler total unspezifisch und deshalb nervig. Könnte irgendwie alles ein bisschen sein, incl. dem OS.
Looser27
Looser27 27.08.2016 um 09:01:17 Uhr
Goto Top
Du hast geschrieben, die HD Lampen leuchten und du hast keinen Zugriff mehr. Das passiert u.a. wenn der RAM, die CPU oder der RAID kontroller defekt sind.
Chonta
Chonta 29.08.2016 um 11:13:42 Uhr
Goto Top
Hallo,

Weder über's Netzwerk (auch kein Ping), noch direkt mit Maus, Tastatur und Bildschirm.
würde auf defekten RAM tippen.

Lass den memtest abe rnicht nur 1-2 mal durchlaufen sondern länger (es sei denm, es gibt sofort Fehler), also über Nacht.
Einige Fehler passieren erst bei längerem Zugriff/bestimmter Temperatur.

Gruß

Chonta