marco8383
Goto Top

Windows Server (Supermicro X9SCL) hängt sich komplett auf

Hallo zusammen,
ich habe ein kleines Problem. Habe einen Windows Server (Supermicro X9SCL) mit RAID 1 (2x500GB SATA Platten). Der Server ist extrem langsam. In der Ereignisanzeige sind keine eindeutigen Fehlermeldungen.

Das ist mal eine die ein bisschen etwas aussagt:
wuaueng.dll (992) SUS20ClientDataStore: Eine Anforderung, von der Datei "C:\Windows\SoftwareDistribution\DataStore\DataStore.edb" ab Offset 1023574016 (0x000000003d028000) insgesamt 32768 (0x00008000) Bytes zu lesen, war erfolgreich, benötigte aber ungewöhnlich viel Zeit (67 Sekunden) von Seiten des Betriebssystems. Dieses Problem ist vermutlich durch fehlerhafte Hardware bedingt. Wenden Sie sich für weitere Unterstützung bei der Diagnose des Problems an Ihren Hardwarehersteller.  


Daraufhin habe ich mit Memtest den Arbeitsspeicher getestet. Hier scheint aber kein Problem vorzuliegen. Dann wollte ich mit Seagte Tools für Windows mal die Festplatten testen, aber sobald das Programm die Festplatten Infos lesen will hängt sich der Server komplett auf. Muss dann über Hardreset neugestartet werden. Mit HWInfo das gleiche Problem. Server hängt komplett. Was mir noch aufgefallen ist, wenn der Server sich aufhängt sind die Festplatten LED's aus. Also hier scheint kein Lese- / Schreibzugriff mehr stattzufinden.

Bisher hatte ich dieses Fehlerbild nicht. An was könnte das liegen? Mainboard, RAID Controller, Festplatte oder Treiber?

Vielleicht hat mir hier jemand einen Tipp wie ich das Problem weiter eingrenzen kann

MfG

Content-ID: 434134

Url: https://administrator.de/contentid/434134

Ausgedruckt am: 21.11.2024 um 15:11 Uhr

Archeon
Archeon 29.03.2019 um 09:10:53 Uhr
Goto Top
Guten morgen,

was meldet denn der RAID Controller? Ist da vielleicht eine Platte defekt und er versucht einen Rebuild o.ä.?

Gruß
Lochkartenstanzer
Lochkartenstanzer 29.03.2019 aktualisiert um 09:40:45 Uhr
Goto Top
Zitat von @Marco8383:

Dann wollte ich mit Seagte Tools für Windows mal die Festplatten testen, aber sobald das Programm die Festplatten Infos lesen will hängt sich der Server komplett auf. Muss dann über Hardreset neugestartet werden. Mit HWInfo das gleiche Problem. Server hängt komplett.


Versuch mal mit einem anderen System wie z.B. Windows 2Go, c't-Notfall-Windows, knoppix, etc. zu starten und dann die Platten zu prüfen, z.G. mit cmartctl oder gmsartctl.

Bisher hatte ich dieses Fehlerbild nicht. An was könnte das liegen? Mainboard, RAID Controller, Festplatte oder Treiber?

Ich tippe mal auf HDD, aber meine Glaskugel kann sich natürlich auch irren.

Vielleicht hat mir hier jemand einen Tipp wie ich das Problem weiter eingrenzen kann

s.o. einfach mit einem Live-System bnooten udn nachschauen. Damit schließt Du ein kaputtes Windows auf Deiner Kiste erstmal aus.

lks

PS: Das Du schnellstmöglichst ein aktuelles Backup machen solltest, falls noch nciht geschehen, versteht sich natürlich von selbst.
sabines
sabines 29.03.2019 um 09:35:15 Uhr
Goto Top
Moin,

sichere als erstes mal die Daten, falls das noch nicht geschehen ist.
Dann mal die Eventlogs durchprüfen, wie schon durch @Archeon gesagt auch den Raid Controler prüfen.

Bei der Gelegenheit mal prüfen ob die Firmware (auch auf dem Board) aktuell ist.
https://www.supermicro.com/products/motherboard/Xeon/C202_C204/X9SCL.cfm

Ggfs. mal mit einer Live CD booten, falls das möglich ist.

Gruss
Marco8383
Marco8383 29.03.2019 aktualisiert um 11:59:28 Uhr
Goto Top
Zitat von @Archeon:

Guten morgen,

was meldet denn der RAID Controller? Ist da vielleicht eine Platte defekt und er versucht einen Rebuild o.ä.?

Gruß


Also die "Datensicherung" wird im Moment so durchgeführt. Zweimal in der Woche wird einfach eine Festplatte vom Raid rausgenommen und mit einer anderen ersetzt. Danach wird ein Rebuild gemacht. Hier kommen keine Fehler. Der Festplatten Status "im Display" zeigt auch keine Fehler.

Werde die Festplatten mal prüfen in dem ich von einer Live CD boote. Mal schauen was hier rauskommt.


Zitat von @sabines:

Moin,

sichere als erstes mal die Daten, falls das noch nicht geschehen ist.
Dann mal die Eventlogs durchprüfen, wie schon durch @Archeon gesagt auch den Raid Controler prüfen.

Bei der Gelegenheit mal prüfen ob die Firmware (auch auf dem Board) aktuell ist.
https://www.supermicro.com/products/motherboard/Xeon/C202_C204/X9SCL.cfm

Ggfs. mal mit einer Live CD booten, falls das möglich ist.

Gruss

Die Firmware ist nicht aktuell. Im Moment ist folgendes drauf:
- BIOS Date: 09/28/11 18:22:33 Ver: 04.06.04
- BIOS-Version: 1.1a
- BIOS-Veröffentlichungsdatum: 2011-09-28
sabines
sabines 29.03.2019 aktualisiert um 12:11:57 Uhr
Goto Top
Zitat von @Marco8383:

Also die "Datensicherung" wird im Moment so durchgeführt. Zweimal in der Woche wird einfach eine Festplatte vom Raid rausgenommen und mit einer anderen ersetzt. Danach wird ein Rebuild gemacht. Hier kommen keine Fehler. Der Festplatten Status "im Display" zeigt auch keine Fehler.


Was es so alles gibt, man lernt nie aus;
Bitte mal ganz dringend das Backup Konzept überarbeiten und jetzt akuell ein "richtiges" Backup machen.


Die Firmware ist nicht aktuell. Im Moment ist folgendes drauf:
- BIOS Date: 09/28/11 18:22:33 Ver: 04.06.04
- BIOS-Version: 1.1a
- BIOS-Veröffentlichungsdatum: 2011-09-28

Nach dem Backup, machst Du ggfs. die anstehenden Firmware Updates hier musst Du aufpassen on Zwischenschritte nötig sind oder Jumper gesetzt werden müssen.

Ist das ein zusätzlicher Raid Controller oder onboard? Hier ggfs. auch die Firmware prüfen.
MettGurke
MettGurke 29.03.2019 aktualisiert um 13:56:10 Uhr
Goto Top
Hi,

Zitat von @Marco8383:
Also die "Datensicherung" wird im Moment so durchgeführt. Zweimal in der Woche wird einfach eine Festplatte vom Raid rausgenommen und mit einer anderen ersetzt. Danach wird ein Rebuild gemacht. Hier kommen keine Fehler. Der Festplatten Status "im Display" zeigt auch keine Fehler.

Sei mir bitte nicht böse, aber jemand der so etwas macht braucht dringend einen Dienstleister o.ä. der etwas von der Thematik versteht. Ich bin gerade fassungslos.

Cheers MettGurke
bitnarrator
bitnarrator 30.03.2019 um 23:47:30 Uhr
Goto Top
Zitat von @Marco8383:

Also die "Datensicherung" wird im Moment so durchgeführt. Zweimal in der Woche wird einfach eine Festplatte vom Raid rausgenommen und mit einer anderen ersetzt. Danach wird ein Rebuild gemacht. Hier kommen keine Fehler. Der Festplatten Status "im Display" zeigt auch keine Fehler.


Einfach so? Im laufenden Betrieb?

Wenn ja, da haste das Problem das der Server so lahm ist, wenn der ständig das RAID kaputt...

PS: Du kommst jetzt auf die DAA-Liste (neben meinen DAUs) , sowas geht echt nicht...
Lochkartenstanzer
Lochkartenstanzer 30.03.2019 aktualisiert um 23:58:57 Uhr
Goto Top
Zitat von @Marco8383:

Also die "Datensicherung" wird im Moment so durchgeführt. Zweimal in der Woche wird einfach eine Festplatte vom Raid rausgenommen und mit einer anderen ersetzt. Danach wird ein Rebuild gemacht. Hier kommen keine Fehler. Der Festplatten Status "im Display" zeigt auch keine Fehler.

Russisches Roulette ist Pipifax dagegen.

Hast Du mit so einen Backup mal Recovery probiert?

Hast Du die Datenkonsistenz überprüft?

Hast Du mal geschaut, ob wenigstens das Filesysten das heil übersteht?

Sowas kann man mal machen, um die Stabilität des Systems zu prüfen, aber erst nachdem.man ein richtiges Backup gemacht hat und das Recovery damit auch wirklich funktioniert.

Ansonsten sagt die Statusanzeige im Controller nur, daß die Festplatten o.k. sind und das Raid konsistent. Das sagt überhaupt nichts über die Dateisystemintegrität oder die Datenkonsistenz aus.


Viel Glück beim Recovern.

lks
Marco8383
Marco8383 31.03.2019 aktualisiert um 08:50:09 Uhr
Goto Top
Danke für die ganzen Kommentare. Habe ja geschrieben "im Moment" wird die Datensicherung so durchgeführt. Ist mir schon klar, dass das Müll ist. Ist nicht auf meinem Mist gewachsen! Das hat aber wirklich ein "IT Dienstleister" so "eingerichtet".

Wollte einfach ein paar Tipps haben, wie ich dem Problem am schnellsten auf die schliche komme.

Werde als nächstes ein Backup machen und die Platten prüfen.

Beste Grüße
Lochkartenstanzer
Lochkartenstanzer 31.03.2019 um 10:24:44 Uhr
Goto Top
Zitat von @Marco8383:

Werde als nächstes ein Backup machen und die Platten prüfen.

Nicht nur Platten, sondern auch Filesystem und datenbanken wären angebracht.

lks
Archeon
Archeon 31.03.2019 um 12:54:33 Uhr
Goto Top
Wenn du weißt das es Mist ist, warum änderst du das dann nicht ab?
Sowas kann dir schneller und schlimmer auf die Füße, als dir lieb ist.