marabunta
Goto Top

Windows Server 2008R2 Netzwerkausfall

Hallo,

ja die gibts leider noch.
Ein Server fällt nach ca. 10h Netzwerkseitig aus.
RPC-Server nicht verfügbar, keine Anmeldedomäne verfügbar, UNC Netzwerkpfade nicht mehr zugreifbar.

Keine Vorankündigung, nichts ersichtliches läuft voll.
Nur ein Neustart hilft für die nächsten paar Stunden.
Ursache völlig unklar.
Kein Update weder auf dem zuständig DC noch betroffenem Server seit 2 Jahren.
Ein aus der Sicherung geholter Server läuft 1 Woche stabil, aber wenn die seit 20 Jahren unverändert laufende Software darauf produktiv geschaltet geschaltet wird und nur Daten verarbeitet(zippen, fileshare ablegen, dateien verschieben/löschen), gleiches Symptom.
Es sind lediglich viele Daten, gibt es Limits die es erreicht haben könnte? GDI-Objekte, Benutzer-Objekte z.B.? Habe erst jetzt davon gelesen.

Hat jemand eine Idee?

Content-ID: 670661

Url: https://administrator.de/forum/windows-server-2008r2-netzwerkausfall-670661.html

Ausgedruckt am: 21.02.2025 um 18:02 Uhr

em-pie
em-pie 12.01.2025 um 22:24:36 Uhr
Goto Top
Moin,

Drei Fragen:
  • was sagt das Eventlog?
  • Welches Windows-Version genau? So ein Essentials-Kram?
  • ausgeschlossen, dass da eine Schadsoftware aktiv ist? Welche AV-Lösung kommt zum Einsatz (unter 2008 gab es mal die Security Essentials, Vorgänger des MS Defenders)?
Marabunta
Marabunta 12.01.2025 um 23:23:58 Uhr
Goto Top
Hat kein Internet. Viren sind erstmal ausgeschlossen. Hat aber auch kein Antivirus und keine Firewall
Normaler Windows Server 2008R2, kein Essentials
Eventlog Netlogon 5719 Der RPC Server ist nicht verfügbar.
kreuzberger
kreuzberger 12.01.2025 um 23:32:44 Uhr
Goto Top
@Marabunta

Man mag es kaum glauben, aber in solchen fällen hatte ich das oft genug, dass di Batterie bei alten geraten nicht mehr fit war, also die Zeit das Problem war.


https://learn.microsoft.com/de-de/troubleshoot/windows-server/user-profi ...

Kreuzberger
Marabunta
Marabunta 12.01.2025 um 23:44:33 Uhr
Goto Top
es ist eine vm auf einem esx, die angezeigte Zeit ist aktuell? Richtig ist, nach einem Stromausfall war sie mal kurz nicht richtig. Hat sich seitdem beruhigt und alle anderen Server laufen stabil. Darunter auch ein Klon des Servers, bei dem die seit Ewigkeiten gleich laufenden Prozesse nicht gestartet wurden, lief 1 Woche stabil nebenher. Ist hier aber genauso nach ca. 8-10h ausgefallen, nachdem die Prozesse liefen.
Ich werde aber mal die Zeit nochmal prüfen
DivideByZero
DivideByZero 13.01.2025 um 00:07:56 Uhr
Goto Top
Moin,

Zitat von @Marabunta:
Hat kein Internet. Viren sind erstmal ausgeschlossen. Hat aber auch kein Antivirus und keine Firewall
Wenn aber im LAN kontaktierbar, sind wegen der vielen Sicherheitslücken erfolgreiche Angriffe von anderen LAN-Geräten nicht ausgeschlossen und passieren häufiger, als man denkt.

Da Du aber ja, wenn ich das richtig verstehe, langen Leerlauf erfolgreich getestet hast, würde ich mir die Software ansehen. Was macht sie alles, was kann schiefgehen? Da ggf. überwachen. Ist das Dateisystem in Ordnung (chkdsk)?

Gruß

DivideByZero
Marabunta
Marabunta 13.01.2025 um 00:28:32 Uhr
Goto Top
Wie beschrieben, ist die Software an sich ist unkritisch. Lief seit 20 Jahren und kopiert lediglich Dateien, löscht und verpackt die.
Es kann lediglich an der über die Jahre gestiegenen Anzahl an Dateien liegen, falls es die Software ist. Das würde aber zum Absturz der Software und nicht des Netzwerks führen.

Der Zeitserver war time.windows.com und ist bei einigen Millionen Minuten bis zum nächsten versuch angelangt.
Viren schließe ich weiter aus. Das Symptom passt nicht.
kreuzberger
kreuzberger 13.01.2025 um 01:36:14 Uhr
Goto Top
@Marabunta

ich denke es ist nicht so das, was du gerne liesst, aber:
Warum machst dunicht aus dem Server 2008 R2 einen Server Core 2019 HyperV (kostenlos) und diese Kopieraktionen einfach mit Robocopy?
Dann hast du das Uraltsystem los und kein Lizenzproblem.

Kreuzberger
Marabunta
Marabunta 13.01.2025 um 01:54:44 Uhr
Goto Top
Weil die Software Code von 1989 hat, nicht mehr unterstützt wird, die Firma dahinter nicht mehr existiert und wahrscheinlich nicht über 2008R2 hinaus funktioniert.
An die Verzweiflungstat habe ich aber schon gedacht und ich versuche es trotzdem.
Der Server wird derzeit geklont und dann hochgezogen.
Avoton
Avoton 13.01.2025 um 06:01:19 Uhr
Goto Top
Moin,

wahrscheinlich nicht über 2008R2 hinaus funktioniert.

Probiert hast du es aber noch nie?

Denke auch, das wird unkritisch sein.

Gruß,
Avoton
DivideByZero
DivideByZero 13.01.2025 aktualisiert um 07:25:55 Uhr
Goto Top
Wenn der Code von 1989 sein soll, kann er kaum 32 bit sein. Mit 16 bit liefe er auch jetzt schon nicht mehr. Also wohl neuer oder rekompiliert. Ist er denn überhaupt installiert? So alte Software kann normalerweise, wenn die Umgebung passt)(erwartete Pfade anlegen etc) schlicht kopiert werden.

Wenn Du die Abstürze auf die Software eingrenzt, wird es daran liegen. Nicht unbedingt die Anzahl der Dateien, kann alles mögliche sein. Beispielsweise ein Überlauf in einer Programmschleife. Dann hängt das Programm und erzeugt hohe CPU Lasten, und ein ausgelasteter alter Server hat dann auch keine Zeit (im wahrsten Sinne des Wortes), eine Anmeldung zuzulassen.

Überlauf kann aber natürlich auch durch die Anzahl an Dateien passieren. Reduziere Sie mal.

Zeit: ist die nun korrekt, oder nicht?
skeptic
skeptic 13.01.2025 aktualisiert um 07:41:48 Uhr
Goto Top
Moin moin,

was bei mehreren Kunden von uns geholfen hatte, in vmWare den Netzwerkadapter von E1000 auf vmx3net umstellen.
Das Szenario bei den Kunden war wie folgt:
OS 2008R2, viel Datenverarbeitung, meist bei Snapshots oder Dateikopien kein Netzwerkzugriff mehr. Erst nach restart wieder.

Eventuell hilft es ja, wünsche eine angenehme Woche

LG
Marabunta
Marabunta 13.01.2025 um 08:43:59 Uhr
Goto Top
ist bereits vmx3net.

Es verdichten sich die Hinweise, dass es die schlicht Anzahl der Verbindungen ist.
Gibt es in der Richtung ein überprüfbares Limit?
Marabunta
Marabunta 13.01.2025 um 08:45:42 Uhr
Goto Top
Ist ein never touch a running system Ding. Der Klon ist gerade auf Windows Server 2012 R2. Solange die Prozesse nicht laufen, ist Netzwerkseitig alles ok. Die Software selbst ist es nicht, vielleicht werden irgendwo die Verbindungen zu lange aufrecht erhalten
StefanKittel
StefanKittel 13.01.2025 aktualisiert um 09:28:45 Uhr
Goto Top
Ich hatte vor Jahren mal ein Problem auf einem 2008er mit farbigen Dateien die ein Einfrieren des Servers bewirkten.
Da hat ein Mac-User Dateien farbig markiert, man kann am Mac Dateien mit Farben markieren, auf einen Share kopiert.

Unter Windows bedeuten die Farben z.B. verschlüsselt oder komprimitiert.
Beim reinen Browsen am Client in diese Verzeichnis sucht Windows nun die Schlüssel dazu und friert vollständig ein.

Vieleicht ein Fehler im Dateisystem und deshalb irgendwo 1 korrupte Datei?

Stefan
kaiand1
kaiand1 13.01.2025 um 09:27:19 Uhr
Goto Top
Nur mal als zusätzliche Möglichkeit....
Festplatte (Smart Werte) oder Ram mal geprüft ?
Marabunta
Marabunta 13.01.2025 um 09:38:24 Uhr
Goto Top
Festplatten sind in Ordnung
Dateisystem auch
nirgends Fehler
ElmerAcmeee
ElmerAcmeee 13.01.2025 um 10:44:35 Uhr
Goto Top
Moin,
ist der Server in der Domäne? > Kerberos Problem?
Hinter einer internen Firewall (was ich hoffe) > Session Handling?
Schwenkt die interne Windows FW ins Public Profile und macht dicht?
Gruß und viel Erfolg
DivideByZero
DivideByZero 13.01.2025 aktualisiert um 11:57:25 Uhr
Goto Top
Wie ist es denn als Alternative, den Prozess schlicht neu abzubilden, also die Software zu ersetzen? Nach dem, was Du schreibst, sollen es ja sehr einfache Automatismen sein. Da ist es ggf deutlich schnellere und wirtschaftlicher, das neu aufzusetzen (läuft dann ja auch auf modernem System), als mit viel Mühe das alte System irgendwie am Laufen zu halten.
aqui
aqui 13.01.2025 aktualisiert um 13:05:50 Uhr
Goto Top
Hat kein Internet.
Sehr hilfreiche und zielführende Fehleranalyse! Du hast es nicht einmal geschafft nur einmal grob einzugrenzen ob das ggf. ...
  • Ein physisches Problem ist. Interne IP bzw. Router IP pingen, alternative NIC oder USB NIC als Test
  • Ein DNS Problem ist, also mal eine nackte Internet IP wie 8.8.8.8 pingen
    • Mit nslookup <name> mal zu checken ob der DNS Server erreichbar ist.
Respekt!
Bei soviel Dilettantismus staunt der Fachmann und der Laie wundert sich... face-sad
Marabunta
Marabunta 13.01.2025 um 15:49:03 Uhr
Goto Top
Interne Firewall filtert nicht. Es ist lediglich in einem VLAN und das lief unverändert und funktioniert auch stundenlang.
Zum Session Handling kann ich sonst nicht weiter sagen, müsste ich weitergeben.

Serverfirewall ist aus.
Kerberos würde ich fast ausschließen, weil ein Benutzer nach 10h Ticketlaufzeit weiter zugreifen kann und der Ausfall auch in unter 10h stattfindet, neue Verbindungen sind auch mit dem funktionierenden Nutzer, aber nicht mehr möglich.
Neue Useranmeldungen per RDP bekommen die Meldung Zeitproblem und der angemeldete bekommt ein "Der Anmeldeversuch ist fehlgeschlagen"

Nach dem "Ausfall" ist Ping weiterhin Richtung DCs möglich. DNS Auflösung funktioniert. Zeit ist aktuell.


Der LogonServer gibt folgendes zurück:
Test-ComputerSecureChannel
Test-ComputerSecureChannel : Der sichere Kanal kann für den lokalen Computer nicht überprüft werden. Fehler beim
Vorgang mit der folgenden Ausnahme: Die angegebene Domäne ist nicht vorhanden, oder es konnte keine Verbindung
hergestellt werden.
In Zeile:1 Zeichen:1
+ Test-ComputerSecureChannel
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : OperationStopped: (domaincontroller:String) [Test-ComputerSecureChannel], InvalidOperationE
   xception
    + FullyQualifiedErrorId : FailToTestSecureChannel,Microsoft.PowerShell.Commands.TestComputerSecureChannelCommand

PS C:\Windows\system32> Test-ComputerSecureChannel -Repair
False

Der betroffene Server gibt das zurück:
PS C:\Users\server.user> Test-ComputerSecureChannel
Test-ComputerSecureChannel : Der Server ist nicht funktionstüchtig.
Name: 'domain.local'  
Bei Zeile:1 Zeichen:27
+ Test-ComputerSecureChannel <<<<
    + CategoryInfo          : NotSpecified: (:) [Test-ComputerSecureChannel], ActiveDirectoryServerDownException
    + FullyQualifiedErrorId : System.DirectoryServices.ActiveDirectory.ActiveDirectoryServerDownException,Microsoft.Po
   werShell.Commands.TestComputerSecureChannelCommand

PS C:\Users\server.user> Test-ComputerSecureChannel -Repair
Test-ComputerSecureChannel : Der Server ist nicht funktionstüchtig.
Name: 'domain.local'  
Bei Zeile:1 Zeichen:27
+ Test-ComputerSecureChannel <<<<  -Repair
    + CategoryInfo          : NotSpecified: (:) [Test-ComputerSecureChannel], ActiveDirectoryServerDownException
    + FullyQualifiedErrorId : System.DirectoryServices.ActiveDirectory.ActiveDirectoryServerDownException,Microsoft.Po
   werShell.Commands.TestComputerSecureChannelCommand

PS C:\Users\server.user> nltest /sc_query:domain.local
Kennzeichen: 0
Vertrauenswürdiger Domänencontrollername
Vertrauenswürdiger Verbindungsstatus für Domänencontroller Status = 1311 0x51f ERROR_NO_LOGON_SERVERS
Der Befehl wurde ausgeführt.

Anderere Domänencontroller geben beim Test True zurück
Der Domänencontroller mit dem Fehler ist der mit allen FSMO Rollen
Marabunta
Marabunta 13.01.2025 aktualisiert um 15:50:43 Uhr
Goto Top
Ich wünschte es wäre möglich, aber ein einfacher Ersatz ist derzeit undenkbar. Da müssen sich Entwickler hinsetzen und es umschreiben. Ist auch geplant.
Lochkartenstanzer
Lochkartenstanzer 13.01.2025 um 16:21:11 Uhr
Goto Top
Zitat von @Marabunta:

Nach dem "Ausfall" ist Ping weiterhin Richtung DCs möglich. DNS Auflösung funktioniert. Zeit ist aktuell.


o.k. Dann würde ich einfach mal einem scanner, z,B. Advanced IP Scanner oder nmap, einen scan vom server aus und einen scan zum serve rhin machen. Wenn das funktioniert und zummindest ein icmp echo vom Server zurückommt, ist es eher ein Software/OS-Problem und kein generelles Netzwerkproblem.

lks
Marabunta
Lösung Marabunta 16.01.2025 um 10:49:50 Uhr
Goto Top
Lösung gefunden. EaseUS Partition Manager(Version aus 2022) hat 2025 angefangen nach Hause zu telefonieren. Hat ohne Internet nach und nach alle dynamischen Ports blockiert und nicht freigegeben. Ist in TCPView nicht zu sehen gewesen, erst Process Handles waren ungewöhnlich hoch.