rrobbyy
Goto Top

Windows Server 2008 R2 - erst langsam, dann keine Reaktion

Hallo zusammen,

heute trat zum zweiten Mal innerhalb von 7 Tagen (ganz genau vor einer Woche) das Problem auf, dass einer unserer Server einfach "stehen bleibt". Eine Anmeldung ist weder per Remote noch lokal am Server möglich. Mit STRG + ALT + ENTF erscheint nicht mal mehr das Login-Fenster. Windows ist auf dem Patch-Stand von Juli.

HP ProLiant 370 G6 / 2 x XEON X5650 / 32GB RAM / RAID5

Es gibt keine Eintragungen im Eventlog, was sich hierauf beziehen könnte. Auch das Eventlog des Raid-Controllers liefert keine Meldungen, die derartige Fehler hervorrufen.


Eben konnte ich das Phänomen hervorrufen, in dem ich per RDP eine lokale PDF öffnen wollte. Jetzt reagiert die Maschine scheinbar nur noch aus dem RAM heraus. Geöffnete Programm sind funktionsfähig, aber sobald ein Zugriff auf die Platten erfolgen soll > keine Reaktion.

Wie gesagt, keine Meldungen im Eventlog von Windows oder des RAID-Controllers.

Auf der Maschine laufen mehrere Dienste: SQL Server 2008 R2, Zeiterfassung (Reiner SCT), Online-Banking, Dokumenten-Management (ELO)

Was würdet ihr jetzt machen?

vielen Dank vorab und Gruß
Robert

Content-ID: 246864

Url: https://administrator.de/contentid/246864

Ausgedruckt am: 24.11.2024 um 07:11 Uhr

keine-ahnung
keine-ahnung 19.08.2014 aktualisiert um 17:24:43 Uhr
Goto Top
Moin,
Was würdet ihr jetzt machen?
ich würde mir die Hardware anschauen?

LG, Thomas

p.s.: auch das mal prüfen ...
certifiedit.net
certifiedit.net 19.08.2014 um 17:28:04 Uhr
Goto Top
Thomas, Patchstand Juli ;)

@to: Leuchten denn die Platten, was ist mit dem RAID?
Chonta
Chonta 19.08.2014 um 17:33:15 Uhr
Goto Top
Hallo,

und wie schaut die Systemauslastung aus? Vor allem RAM und HDD, ist die HDD auf 100% Auslastung?

Wenn ein System so einfriert, das nicht mal mehr Strg+Alt+Entf geht und auch sonst keine Reaktion ist (ping?) dann liegt evtl ein RAM-Problem vor.
Wie groß war das PDF?

Gruß

Chonta
keine-ahnung
keine-ahnung 19.08.2014 um 17:38:40 Uhr
Goto Top
Thomas, Patchstand Juli ;)
Sorry, mein Fehler ... dafür leuchtet meine Platte noch nicht face-wink! --> aber ob jetzt mit oder ohne Haupthaar: klingt nach defekter Hardware und kann sonstwas sein, bis hin zum Netzwerk.

LG, Thomas
rrobbyy
rrobbyy 19.08.2014 um 17:53:04 Uhr
Goto Top
die Updates waren es nicht (korrekt bemerktface-smile

Aber tatsächlich haben die Platten "merkwürdige" Leuchtsignale gesendet (aber keine Warnmeldungen). Ich suche derzeit noch die Interpretation.
3 Platten blinken dann, wenn die anderen 4 aus sind und umgekehrt. Dies geschieht zyklisch. (Bitte entschuldigt diese laienhafte Beschreibung, aber visuelle Beschreibungen sind nicht so mein Ding)


Zur Konfiguration des Raids.
Es existieren zwei Raid-Controller:
P410i in integriertem Steckplatz mit 7x300GB + 1x300GB Spare (Volume C á 500 GB)
P410 in Steckplatz 5 mit 7x600GB + 1x600GB Spare (Volume E á 3,27 TB, Volume D á 1 TB)

Beim Ausfall blinkten die 600er Platten immer wie beschrieben abwechselnd. Da hilft nur ein harter Reset.


Zu den Fragen: Da RAM war ca. 50% ausgelastet, die CPU 2%
Das PDF lag auf Volume E. Nach dem Doppelklick ging wie beschrieben nicht mehr. Den Ressourcen-Monitor konnte ich leider auch nicht mehr öffnen.

Ich lasse die Anmeldung jetzt so lange offen, bis es das nächste Mal wieder auftritt.
certifiedit.net
certifiedit.net 19.08.2014 um 17:57:09 Uhr
Goto Top
Was sagt denn das iLO? Was sagt der HP Support (der ist doch vorhanden, oder?)
rrobbyy
rrobbyy 19.08.2014 um 18:11:37 Uhr
Goto Top
ich könnte ...
Nachdem ich die Meldungen von 2011 bis 2013 im Management Log Viewer gelöscht haben, tauchen von heute diverse Meldungen auf. Alle mit dem Status "Repaired"

Angemeckert wurde, dass das Drive Array nicht konfiguriert sei und das eine Performance-Optimierung stattfindet.


Mit iLO habe ich bisher noch gar nicht gearbeitet. Aber auf dem Server ist die Tools dafür vorhanden. Wieder ein Thema mehr zum Studieren.
keine-ahnung
Lösung keine-ahnung 19.08.2014, aktualisiert am 03.09.2014 um 14:35:39 Uhr
Goto Top
Moin,

ILO konfigurieren und gucken! Sollte auch bei G6 schon einiges bringen ... (SMART, Arrays). ACU gucken! BBU gucken!

LG, Thomas
Saftnase
Lösung Saftnase 28.08.2014, aktualisiert am 03.09.2014 um 14:35:43 Uhr
Goto Top
Wenn du noch Support auf dem Eisen hast, besorg dir die aktuelle Proliant ServicePack DVD und lass die Firmwarestände der Controller und vor allem der Platten checken bzw. updaten. Danach solltest du auch die aktuellsten Treiber installieren.

So wie du das Verhalten beschreibst, tippe ich auf einem Fehler in diesem Bereich.
Falls du zusätzlichen RAM auf dem Controller hast, kannst du den testweise auch mal entfernen. Wenn ich es noch richtig im Kopf habe, sollte der Riegel einfach zu ein-/ausklipsen sein.

cu
rrobbyy
rrobbyy 03.09.2014 um 14:34:36 Uhr
Goto Top
Das System läuft jetzt wieder seit mehreren Tagen ohne Probleme.
Wir haben die Kabel kontrolliert und neu verbunden. Sah aber alles OK aus. Das Strom-Kabel vom zweiten Netzteil war jedoch nicht vollständig verbunden (was meiner Meinung nach nicht der Fehler sein kann/konnte)
Der Controller hat tatsächliche mehrere Fehler gemeldet, die jedoch von ihm selbstständig behoben worden sind.

Hoffen wir, dass es so bleibt.

Vielen Dank für eure Ideen und Hilfe!