danielsil
Goto Top

Periodischer Serverabsturz

Guten Tag,

Wir haben einen Server mit Windows Server 2019 Standard am laufen. Die Zeit zwischen den Abstürzen liegt bei 8h 30min (Abstand der kritischen Events (Kernel-Power) im Eventlog) und lässt sich vorraussagen. Im Eventlog und der Zuverlässigkeitsüberwachung ist ansonsten kein Hinweis auf die Ursache zu erkennen.
Eine Begutachtung der Aufgabenplanung hat bisher zu keinem Ergebnis geführt. Das periodische Auftreten der Abstürze macht eine Hardwareursache unwahrscheinlich.
Leider habe ich keine Ansatzpunkte mehr, die ich dahingehend verfolgen kann.
Über mögliche Lösungsansätze bin ich sehr dankbar.

Content-ID: 7358535094

Url: https://administrator.de/contentid/7358535094

Ausgedruckt am: 25.11.2024 um 00:11 Uhr

NordicMike
NordicMike 30.05.2023 um 09:55:46 Uhr
Goto Top
Keine Infos über RAM Auslastung usw?
6376382705
6376382705 30.05.2023 um 09:56:30 Uhr
Goto Top
Hi.

was heißt Absturz? Geht das System einfach "aus" oder fährt die Kiste graceful herunter?

Systemstart geprüft? MSConfig geprüft? Dienste geprüft? shell:startup geprüft?`
Löst die USV vielleicht den shutdown aus?

Gruß
Crusher79
Crusher79 30.05.2023 um 10:55:29 Uhr
Goto Top
Zitat von @6376382705:

was heißt Absturz? Geht das System einfach "aus" oder fährt die Kiste graceful herunter?

Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein. So trivial ist es hier nicht oder?
MacLeod
MacLeod 30.05.2023 um 11:41:57 Uhr
Goto Top
Hallo
Auf Blech oder virtualisiert? Redundante Netzteile? Hatten mal ähnliches Problem beim Kunden mit defekter USV. Hat immer wieder einen Selbsttest gemacht und dabei den Server eben kurz stromlos geschaltet. Managementkarte hatte nichts angezeigt. Einer von 4 Akkupacks war defekt. Alle ausgetauscht, kalibriert. Firmware auf der APC upgegraded und seitdem ist Ruhe.
MfG,
MacLeod
NordicMike
NordicMike 30.05.2023 um 12:19:15 Uhr
Goto Top
Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein.
Das habe ich noch nicht erlebt, bei einem Server?
em-pie
em-pie 30.05.2023 um 12:41:58 Uhr
Goto Top
Moin,

spannend wäre, ob es IMMER 8,5h nach dem Serverstart war oder es nur eine feste Zeit ist, die "zufällig" nach 8,5h ansteht.

Also wenn die 8,5h z. B. um 17Uhr erreicht sind. was passiert, wenn du mal den Server um 16:30 den Server sauber herunter- und dann wieder hochfährst?
Mr-Gustav
Mr-Gustav 30.05.2023 um 12:44:01 Uhr
Goto Top
Zitat von @NordicMike:

Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein.
Das habe ich noch nicht erlebt, bei einem Server?

Jup kommt vor wenn die 60/90 Tage überschritten sind.

Wenn ich dich richtig verstehe ist es eigentlich egal wann du die Kiste
einschaltest ? Also sprich nach dem einschalten ist nach 8:30 fertig ?

Ist der Server was Lizenzen angeht sauber ?
support-m
support-m 30.05.2023 aktualisiert um 13:47:17 Uhr
Goto Top
Zitat von @NordicMike:

Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein.
Das habe ich noch nicht erlebt, bei einem Server?

Kann ich bestätigen. Hatte das bisher aber nur einmal bei einem Steinzeit 2008 Small Business und einem 2012 Foundation mit zuvielen Usern.
In unseren Testumgebungen haben wir zum Teil Server 2016 und höher rumgammeln, die seit Jahren nicht aktiviert wurden und laufen immer noch vor sich hin. Also ich würde daher behaupten, dass das nur bei den früheren Versionen der Fall war...

MfG
Mr-Gustav
Mr-Gustav 30.05.2023 um 14:04:17 Uhr
Goto Top
Zitat von @support-m:

In unseren Testumgebungen haben wir zum Teil Server 2016 und höher rumgammeln, die seit Jahren nicht aktiviert wurden und laufen immer noch vor sich hin. Also ich würde daher behaupten, dass das nur bei den früheren Versionen der Fall war...


Nö ist immer noch so. komischer weise haben wir auch Server im Lab laufen ohne Aktivierung und die laufen und laufen.....
Aber wenn man die dann als DHCP oder DNS eben schnell oder als Filer nutzern will dann smieren die nach der zeit ab face-smile
Das mit dem Runterfahren ist also immer noch aktuell. Scheinbar erkennt Windows wenn es verwendet wird oder ob es eben nur im Idel Modus läuft
DanielSil
DanielSil 30.05.2023 um 14:10:56 Uhr
Goto Top
Zitat von @NordicMike:

Keine Infos über RAM Auslastung usw?

RAM sind 256GB
Prozessor sind 2 * Intel Xepn Silver 4110 CPU 2.10 GHz

Wenn alle Mitarbeiter angemeldet sind, liegt die Auslastung vom RAM bei knapp 35%, die des Prozessors bei 75% max
DanielSil
DanielSil 30.05.2023 um 14:15:35 Uhr
Goto Top
Zitat von @Crusher79:

Zitat von @6376382705:

was heißt Absturz? Geht das System einfach "aus" oder fährt die Kiste graceful herunter?

Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein. So trivial ist es hier nicht oder?

Windows Server 2019 Standard hat eine Lizenz. Andere Software die wir verwenden ist entweder kostenfrei, oder auch lizenziert.
DanielSil
DanielSil 30.05.2023 aktualisiert um 14:23:14 Uhr
Goto Top
Zitat von @MacLeod:

Hallo
Auf Blech oder virtualisiert? Redundante Netzteile? Hatten mal ähnliches Problem beim Kunden mit defekter USV. Hat immer wieder einen Selbsttest gemacht und dabei den Server eben kurz stromlos geschaltet. Managementkarte hatte nichts angezeigt. Einer von 4 Akkupacks war defekt. Alle ausgetauscht, kalibriert. Firmware auf der APC upgegraded und seitdem ist Ruhe.
MfG,
MacLeod

Vielen Dank. Das klingt, nach einer Möglichkeit. Der Server ist auf Blech mit zwei Netzteilen verbaut. Die Batterie der USV hätte vor Zeiten getauscht werden müssen. Ich werde Sie bei der Nächstengelegenheit Probehalber durch eine Ersatz USV tauschen und sehen was bei rauskommt.
MfG
DanielSil
DanielSil
DanielSil 30.05.2023 um 14:25:37 Uhr
Goto Top
Zitat von @em-pie:

Moin,

spannend wäre, ob es IMMER 8,5h nach dem Serverstart war oder es nur eine feste Zeit ist, die "zufällig" nach 8,5h ansteht.

Also wenn die 8,5h z. B. um 17Uhr erreicht sind. was passiert, wenn du mal den Server um 16:30 den Server sauber herunter- und dann wieder hochfährst?

Ja, ein "Zyklus" incl. neustart sind immer 8:38:33h +/- 5 Sekunden. Das ganze passiert unabhängig von der Uhrzeit.
Pjordorf
Pjordorf 30.05.2023 um 14:28:47 Uhr
Goto Top
Hallo,

Zitat von @DanielSil:
Die Batterie der USV hätte vor Zeiten getauscht werden müssen. Ich werde Sie bei der Nächstengelegenheit Probehalber durch eine Ersatz USV tauschen und sehen was bei rauskommt.
Wäre ein Batterietausch nicht zweckmäßiger oder sind die schon 10 mal (10 * 5 Jahre = 50 Jahre alte USV?) getauscht worden? Aber auch USVen haben Logs wo was drin steht.

Gruß,
Peter
Mr-Gustav
Mr-Gustav 30.05.2023 um 14:29:54 Uhr
Goto Top
Versuch noch mal den Server mittels einer CMD ( als Admin )
neu zu aktivieren.

Was sagt der Befehl
slmgt /dli
an ? Hier solltest du normalerweise die letzten 5
Zeichen des Windows Keys sehen. Falls nicht dann mal folgendes probieren:

slmgr /ipk aaaaa-bbbbb-cccc-dddddd-eeeeee-fffff
almgt /ato

Wo hast du denn den Key her ? Nicht das der plötzlich gesperrt wurde.
Gibt ja genügend die eine Server Lizenz für nen 10 verkaufen
DanielSil
DanielSil 30.05.2023 um 14:55:57 Uhr
Goto Top
Hallo,
Zitat von @Pjordorf:

Hallo,

Zitat von @DanielSil:
Die Batterie der USV hätte vor Zeiten getauscht werden müssen. Ich werde Sie bei der Nächstengelegenheit Probehalber durch eine Ersatz USV tauschen und sehen was bei rauskommt.
Wäre ein Batterietausch nicht zweckmäßiger oder sind die schon 10 mal (10 * 5 Jahre = 50 Jahre alte USV?) getauscht worden? Aber auch USVen haben Logs wo was drin steht.

Gruß,
Peter

Die USV ist von 2014 und sie warten seit 2019 auf eine neue Batterie. Leider sieht die Rückseite aus wie ein Haufen Spaghetti, deswegen habe ich mich bis jetzt davor gescheut da bei zu gehen.
vor einer Woche habe ich einen alten Server von Netz genommen, dafürch habe ich eine USV mit intakter Batterie auf Reserve.
Mit freundlichen Grüßen
Daniel
DanielSil
DanielSil 30.05.2023 um 15:09:54 Uhr
Goto Top
Zitat von @Mr-Gustav:

Versuch noch mal den Server mittels einer CMD ( als Admin )
neu zu aktivieren.

Was sagt der Befehl
slmgt /dli
an ? Hier solltest du normalerweise die letzten 5
Zeichen des Windows Keys sehen. Falls nicht dann mal folgendes probieren:

slmgr /ipk aaaaa-bbbbb-cccc-dddddd-eeeeee-fffff
almgt /ato

Wo hast du denn den Key her ? Nicht das der plötzlich gesperrt wurde.
Gibt ja genügend die eine Server Lizenz für nen 10 verkaufen

Vielen Dank für die Hinweise.
Wenn das eingebe, bekomme ich die letzten fünf Zeichen des Keys.
slmgt -dlv
Das Fenster sagt mir auch: Lizenzstatus: Lizenziert
Dieser stammt von unserem Externen IT'ler. Das sollte aber passen, werde ihn dennoch mal Fragen.

Eine erneute Aktiviertung schiebe ich solange wie möglich vor mir her, da wir kein Backup haben ^^

Mit freundlichen Grüßen
Daniel
Mr-Gustav
Mr-Gustav 30.05.2023 um 15:11:53 Uhr
Goto Top
Steht denn im LOG der USV irgendwas drinne ?
NordicMike
NordicMike 30.05.2023 um 15:23:36 Uhr
Goto Top
> Keine Infos über RAM Auslastung usw?

RAM sind 256GB

Das war die Info über RAM Größe. Die RAM Auslastung ist etwas anderes. Genau so wie bei der CPU. Wenn beides auf 100% ausgelastet ist, wäre das ein Hinweis in die Richtung.
DanielSil
DanielSil 30.05.2023 um 15:39:15 Uhr
Goto Top
Zitat von @Mr-Gustav:

Steht denn im LOG der USV irgendwas drinne ?

Das kann ich aktuell nicht überprüfen, da ich an einem anderen Standort bin. Das letzte Mal als ich nachgeschaut habe. wurde mir nicht von Selbsttests oder etwas, was auf einen eigenständigen Neustart hindeutet. Die USV ist (noch) nicht über Netzwerk wartbar.
Mit freundlichen Grüßen
Daniel
JasperBeardley
JasperBeardley 31.05.2023 um 11:02:26 Uhr
Goto Top
Zitat von @NordicMike:

Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein.
Das habe ich noch nicht erlebt, bei einem Server?

Moin,

das gab es früher bei den SBS 2008/11 wenn diese nicht lizenzkonform betrieben wurden.
D.h. zu viele User im AD oder die FSMO lagen auf einem anderen DC.

Dann ist der alle zwei Stunden heruntergefahren, wenn ich mich richtig erinnere.

Gruß
Jasper
DanielSil
DanielSil 31.05.2023 um 11:21:48 Uhr
Goto Top
Zitat von @JasperBeardley:

Zitat von @NordicMike:

Wenn "graceful" fällt mir da immer als erstes nicht aktivierte Lizenz ein.
Das habe ich noch nicht erlebt, bei einem Server?

Moin,

das gab es früher bei den SBS 2008/11 wenn diese nicht lizenzkonform betrieben wurden.
D.h. zu viele User im AD oder die FSMO lagen auf einem anderen DC.

Dann ist der alle zwei Stunden heruntergefahren, wenn ich mich richtig erinnere.

Gruß
Jasper

Mahlzeit,
Bei Windows Server 2019 Essentials gibt es eine Beschränkung von 25 Nutzer. Bei Windows Server 2019 Standard gibt es keine Beschränkung was die Anzhal an Nutzern angeht.

Mit freundlichen Grüßen
Daniel
Mr-Gustav
Mr-Gustav 31.05.2023 um 12:32:52 Uhr
Goto Top
Aber auch hier gilt das wenn was mit der Aktivierung nicht passt sich der Server eben ausschaltet wenn eine gewisse Zeit rum ist. Und da das immer nach der Gleichen Zeit passiert kann es ggf. daran liegen oder an einm Task der die Kiste irgendwie runterfährt
CypH3r-LE
CypH3r-LE 31.05.2023 um 16:50:40 Uhr
Goto Top
Servus,

Zum Thema Lizenzierung.
Bei meinen Testservern (VM, Unlizensiert, Standard und Datacenter) kommt der shutdown exakt nach 60min.

Dadurch würde ich auch eher auf die USV bzw. Die Hardware gehen.
NordicMike
NordicMike 01.06.2023 um 14:29:05 Uhr
Goto Top
Bei meinen Testservern (VM, Unlizensiert, Standard und Datacenter) kommt der shutdown exakt nach 60min.
Interessant, meine laufen durch (2016 und 2019)
6376382705
6376382705 01.06.2023 um 14:32:10 Uhr
Goto Top
2016
Habe gestern nen alten Testserver mit 180 Tagen eval. Server 2016 gestartet. Countdown war bei 0 Tage. Server fährt vollständig herunter.
Habe allerdings nicht geschaut nach welchem Zeitraum. War ein reiner Zufallsfund.

Gruß
Crusher79
Crusher79 01.06.2023 aktualisiert um 15:59:59 Uhr
Goto Top
Hallo, also meine es wird nach weiterer Überschreitung eines nicht lizenzierten Zeitraumes der Intervall kürzer?

Aber normal sieht man dass doch bei MS hübsch in den Systemdaten. So ein "Crash" sollte doch rasch behoben sein. Der TS hast ja schon geschrieben, dass die Möhre lizenziert ist. Wäre ja dann soweit i.O.

Wobei wir dann wieder am Anfang sind....

https://lazyadmin.nl/powershell/start-transcript/

Falls ein PS Script Amok läuft. Ggf. das mal mit laufen lassen?