scoopy0815
Goto Top

W10 sporadisch von "Außen, übers Netzwerk" NICHT erreichbar

Hallo an die Administratorengemeinde!

Ich wende mich an die geballte Community mit einem für uns sehr leidlichen Thema!
Erstmal kurz, damit Ihr Euch ein Bild machen könnt, einige Fakten zu unserer Systemumgebung:

  • ca. 100 Server (90% über vmware virtualisiert, davon 90% Windows und der Rest Linuxe und deren Derivate)
  • ca. 350 Windowsclients
  • 60 Drucker
  • Zugang zum Netzwerk, über HP IMC (Radius Server) und MAC Authentication
  • Gigabitnetzwerk mit ca. 20 VLANs
  • Endpointsecurity, Antivirus über EgoSecure / Matrix42
  • Dell Desktop Authority Desktopprovisionierung (Bereitstellen von Freigaben, Druckern, Systemumgebung etc.)


So, nun zu unserem Problem. Wir haben das Problem, dass unsere W10 Clients sporadisch von Außen übers Netzwerk
nicht mehr erreichbar sind. Das äußert sich so, dass wir z.B. mit der Fernwartung (VNC) nicht mehr auf den Rechner zugreifen können.
Lokal über USB angeschlossene und freigegebene Drucker nicht mehr funktionieren, weil diese über unseren Terminalserver wo die
Benutzer darauf arbeiten nicht mehr "von Außen" (übers Netzwerk, Druckfreigabe) angesprochen werden können.
Die betroffenen Geräte sind dann z.B. auch über Ping nicht mehr erreichbar. Wenn ich das Netzwerkkabel ziehe und wieder stecke, oder den betreffenden
Port am Switch DOWN und wieder UP geht es erstmal wieder! Ganz Wichtig! Der Benutzer bemerkt davon nichts und kann
ganz normal auf dem Terminalserver arbeiten, auf Netzwerkressourcen zugreifen etc.

Wenn der Problemzustand einmal eingetreten ist, muss erst das o.g. Vorgehen angewendet werden.

Folgende Tätigkeiten zur Problemlösung haben wir schon unternommen:
  • mehrere, verschiedene W10 Versionen
  • Netzwerkanalyse
  • Einstellungen geprüft
  • W10 verboten, die Netzwerkkarte in den Energiesparmodus zu setzen
  • unsere Endpointsecurity geprüft bzw. mal testweise abgeschaltet
  • Einstellungen im Radiusserver geprüft

Beim genaueren Überlegen, welche Komponente so ein selektives Verhalten auslösen kann, fällt mir fast nur die
Windowsfirewall / Defender ein. Die ist allerdings ausgeschaltet.

Vielen Dank im Voraus!
Markus

Content-Key: 3378575240

Url: https://administrator.de/contentid/3378575240

Printed on: April 27, 2024 at 18:04 o'clock

Member: Vision2015
Vision2015 Jul 19, 2022 at 10:40:16 (UTC)
Goto Top
Moin...
Wenn ich das Netzwerkkabel ziehe und wieder stecke, oder den betreffenden
Port am Switch DOWN und wieder UP geht es erstmal wieder! Ganz Wichtig! Der Benutzer bemerkt davon nichts und > kann ganz normal auf dem Terminalserver arbeiten, auf Netzwerkressourcen zugreifen etc.
das glaube ich nicht... der User merkt nix, wenn du den Port Down stellst ?????!!!???

habt ihr Link Aggregation / LACP im einsatz?

Frank
Mitglied: 108012
108012 Jul 19, 2022 at 11:12:24 (UTC)
Goto Top
Hallo,

- Was für einen Internetzugang habt Ihr denn?
Also wie schnell ist die Anbindung und für wie viele Benutzer muss die ausreichen?
WAN Port überlastet?

- Was für Switche habt Ihr denn im Unternehmen verbaut?
ARP Table voll, Switch in das Netzwerke oder im Netzwerk überlastet?

Wenn man Stecker von einem Switch oder einem WAN Gerät zieht und wieder einsteckt
und es funktioniert dann wieder normal, aber eben auch nur zeitlich begrenzt ist das
meiner Meinung nach wohl eher auf das Netzwerkequipment zurückzuführen.

Dobby
Member: Visucius
Visucius Jul 19, 2022 at 11:30:09 (UTC)
Goto Top
Du hast aber nicht zufällig noch ne Wifi-Karte in den Hosts?
Member: scoopy0815
scoopy0815 Jul 19, 2022 at 12:00:51 (UTC)
Goto Top
Danke für die schnellen Anworten!
Hier erstmal 2 Konkretisierungen / Richtigstellungen.

1.
das glaube ich nicht... der User merkt nix, wenn du den Port Down stellst ?????!!!???

--> War vielleicht missverständlich ausgedrückt. Das der Client von Außen (vom lokalen Netzwerk) nicht
erreichbar ist, merkt der User nicht!

2.
Was für einen Internetzugang habt Ihr denn?
Also wie schnell ist die Anbindung und für wie viele Benutzer muss die ausreichen?
WAN Port überlastet?

--> Ich meine mit "von Außen" vom lokalen LAN nicht vom WAN / Internet

habt ihr Link Aggregation / LACP im einsatz?

Ja, der Uplink von den Edge / Etagenswitchen zum Netzwerkcore sind über LACPs realisiert.

Was für Switche habt Ihr denn im Unternehmen verbaut?
ARP Table voll, Switch in das Netzwerke oder im Netzwerk überlastet?

HP Switche (HP 5500-xxx, 3Com S5500G-xxx, Netzwerkcore 4x HP 5820X-24XG-SFP+)
ARP Table ok, Netzwerk nicht überlastet.

Wenn man Stecker von einem Switch oder einem WAN Gerät zieht und wieder einsteckt
und es funktioniert dann wieder normal, aber eben auch nur zeitlich begrenzt ist das
meiner Meinung nach wohl eher auf das Netzwerkequipment zurückzuführen.

Prinzipiell möglich, aber mit W7 (zum Teil auf gleicher Hardware) hatten wir das Problem nicht.
Das lenkt für mich den Fokus eher vom Netzwerk weg und zu W10.

Gruß
Markus
Member: ChriBo
ChriBo Jul 19, 2022 at 14:29:53 (UTC)
Goto Top
Hi,
was für Geräte habt ihr im Einsatz, Laptops oder PCs ?
Habt ihr mal die BIOS Einstellungen geprüft und ggf. geändert ?
Wie @Visucius schon anmerkte: Dieser Fehler kann passieren wenn WLAN und standard NIC vorhanden sind.
Dann muß hier weiter gesucht werden.

Gruß
Ch
Member: MysticFoxDE
MysticFoxDE Jul 19, 2022 updated at 15:53:40 (UTC)
Goto Top
Moin Markus,

Prinzipiell möglich, aber mit W7 (zum Teil auf gleicher Hardware) hatten wir das Problem nicht.
Das lenkt für mich den Fokus eher vom Netzwerk weg und zu W10.

Bei W10 und alles danach und daneben, hat MS leider zu viel an den Eingeweiden des Netzwerk-Stacks verfummelt. 😭

Kannst du bei einem der betroffenen Clients in der PowerShell (als Administrator) mal das folgende reinhauen und das Ergebnis posten, danke.

Get-NetAdapterAdvancedProperty | FT -AutoSize
Get-NetAdapterRss
Get-NetAdapterRsc

Beste Grüsse aus BaWü
Alex
Member: 7Gizmo7
7Gizmo7 Jul 19, 2022 at 20:07:45 (UTC)
Goto Top
Hi,

Was sagt denn das Firewall-Log auf einem betroffenen Client ?

Mit freundlichen Grüßen
Member: MysticFoxDE
MysticFoxDE Jul 20, 2022 updated at 06:45:41 (UTC)
Goto Top
Moin Markus,

kannst du beim nächsten Client der das Problem aufweist, bitte den Taskmanager aufmachen und ein Screenshot von der Arbeitsspeicherzusammensetzung machen und hier posten, danke.
(Taskmanager --> Leistung --> Arbeitsspeicher)

Beste Grüsse aus BaWü

Alex
Member: scoopy0815
scoopy0815 Jul 21, 2022 at 09:35:29 (UTC)
Goto Top
Hallo Zusammen! Vielen Dank für Eure Rückmeldungen, die ich wie folgt beantworten möchte:

Zitat von Visucius: Du hast aber nicht zufällig noch ne Wifi-Karte in den Hosts?

Zitat von ChriBo:
was für Geräte habt ihr im Einsatz, Laptops oder PCs ?
Habt ihr mal die BIOS Einstellungen geprüft und ggf. geändert ?
Wie @Visucius schon anmerkte: Dieser Fehler kann passieren wenn WLAN und standard NIC vorhanden sind.
Dann muß hier weiter gesucht werden.

Doch in den Geräten (Intel INUC) sind WLAN Karten. Kann aber jetzt nicht genau sagen ob auch bei anderen Clients das Problem auftritt die keine WLAN Karten haben.
Ich habe geschaut die WLAN Karten sind nicht verbunden! Ich werde Sie jetzt mal explizit deaktivieren. Zur größten Not könnte man die Module (testweise) ausbauen.

Zitat von 7Gizmo7:
Was sagt denn das Firewall-Log auf einem betroffenen Client ?

Das muss ich mir noch anschauen. Hab das Logging jetzt mal auf LOG dropped Packets "ein. bzw. hochgestellt".
Ich gebe Rückmeldung!

Zitat von MysticFoxDE:
Kannst du bei einem der betroffenen Clients in der PowerShell (als Administrator) mal das folgende reinhauen und > das Ergebnis posten, danke.

PS C:\Windows\system32> Get-NetAdapterAdvancedProperty | FT -AutoSize

Name DisplayName DisplayValue RegistryKeyword Registr
yValue
----------- ------------ --------------- -------
WLAN Sleep on WoWLAN Disconnect Disabled *DeviceSleepOnDisconnect {0}
WLAN Packet Coalescing Enabled *PacketCoalescing {1}
WLAN ARP offload for WoWLAN Enabled *PMARPOffload {1}
WLAN NS offload for WoWLAN Enabled *PMNSOffload {1}
WLAN GTK rekeying for WoWLAN Enabled *PMWiFiRekeyOffload {1}
WLAN Wake on Magic Packet Enabled *WakeOnMagicPacket {1}
WLAN Wake on Pattern Match Enabled *WakeOnPattern {1}
WLAN 802.11n Channel Width for 2.4GHz Auto ChannelWidth24 {1}
WLAN 802.11n Channel Width for 5.2GHz Auto ChannelWidth52 {1}
WLAN Mixed Mode Protection RTS/CTS Enabled CtsToItself {0}
WLAN Fat Channel Intolerant Disabled FatChannelIntolerant {0}
WLAN Transmit Power 5. Highest IbssTxPower {100}
WLAN HT Mode VHT Mode IEEE11nMode {2}
WLAN MIMO Power Save Mode Auto SMPS MIMOPowerSaveMode {0}
WLAN Roaming Aggressiveness 3. Medium RoamAggressiveness {2}
WLAN Preferred Band 1. No Preference RoamingPreferredBandType {0}
WLAN Throughput Booster Disabled ThroughputBoosterEnabled {0}
WLAN U-APSD support Disabled uAPSDSupport {0}
WLAN Wireless Mode 6. 802.11a/b/g WirelessMode {34}
Ethernet Fließkontrolle Rx & Tx aktiviert *FlowControl {3}
Ethernet Interrupt-Moderation Aktiviert *InterruptModeration {1}
Ethernet IPv4 Prüfsummenabladung Rx & Tx aktiviert *IPChecksumOffloadIPv4 {3}
Ethernet Jumbo-Rahmen Deaktiviert *JumboPacket {1514}
Ethernet Abladung großer Übertragung V2 (IPv4) Aktiviert *LsoV2IPv4 {1}
Ethernet Abladung großer Übertragung V2 (IPv6) Aktiviert *LsoV2IPv6 {1}
Ethernet Maximale RSS-Warteschlangenanzahl 4 Warteschlangen *NumRssQueues {4}
Ethernet ARP-Abladen Aktiviert *PMARPOffload {1}
Ethernet NS-Abladen Aktiviert *PMNSOffload {1}
Ethernet Priorität & VLAN Priorität & VLAN aktiviert *PriorityVLANTag {3}
Ethernet Puffer empfangen 512 *ReceiveBuffers {512}
Ethernet Seitenskalierung empfangen Aktiviert *RSS {1}
Ethernet Geschwindigkeit & Duplex Autom. Aushandlung *SpeedDuplex {0}
Ethernet TCP Prüfsummenabladung (IPv4) Rx & Tx aktiviert *TCPChecksumOffloadIPv4 {3}
Ethernet TCP Prüfsummenabladung (IPv6) Rx & Tx aktiviert *TCPChecksumOffloadIPv6 {3}
Ethernet Puffer übertragen 128 *TransmitBuffers {128}
Ethernet UDP Prüfsummenabladung (IPv4) Rx & Tx aktiviert *UDPChecksumOffloadIPv4 {3}
Ethernet UDP-Prüfsummenabladung (IPv6) Rx & Tx aktiviert *UDPChecksumOffloadIPv6 {3}
Ethernet Bei Magic Packet aufwecken Aktiviert *WakeOnMagicPacket {1}
Ethernet Bei Musterübereinstimmung aufwecken Aktiviert *WakeOnPattern {1}
Ethernet Advanced EEE Aktiviert AdvancedEEE {1}
Ethernet Gigabit autom. deaktivieren Deaktiviert AutoDisableGigabit {0}
Ethernet Energy Efficient Ethernet (LAN-Energiesparen, EEE) Aktiviert EEE {1}
Ethernet Green-Ethernet Aktiviert EnableGreenEthernet {1}
Ethernet Gigabit Lite Aktiviert GigaLite {1}
Ethernet Netzwerkadresse -- NetworkAddress {--}
Ethernet Wake-On-Lan herunterfahren Aktiviert S5WakeOnLan {1}
Ethernet WoL / Link-Geschwindigkeit reduzieren 10 Mbit/s zuerst WolShutdownLinkSpeed {0}

PS C:\Windows\system32> Get-NetAdapterRss

Name : Ethernet
InterfaceDescription : Realtek PCIe GBE Family Controller
Enabled : True
NumberOfReceiveQueues : 4
Profile : NUMAStatic
BaseProcessor: [Group:Number] : 0:0
MaxProcessor: [Group:Number] : 0:3
MaxProcessors : 4
RssProcessorArray: [Group:Number/NUMA Distance] : 0:0/0 0:1/0 0:2/0 0:3/0
IndirectionTable: [Group:Number] : 0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3
0:0 0:1 0:2 0:3 0:0 0:1 0:2 0:3

PS C:\Windows\system32> Get-NetAdapterRsc

Name IPv4Enabled IPv6Enabled IPv4Operational IPv6Operational IPv4FailureReason IPv6FailureR
State State eason
----------- ----------- --------------- --------------- ----------------- ------------
WLAN True True

Zitat von MysticFoxDE:
kannst du beim nächsten Client der das Problem aufweist, bitte den Taskmanager aufmachen und ein Screenshot > > von der Arbeitsspeicherzusammensetzung machen und hier posten, danke.
(Taskmanager --> Leistung --> Arbeitsspeicher)

Mach ich!

Vielen Grüße!
Markus
Member: MysticFoxDE
MysticFoxDE Jul 21, 2022 updated at 10:23:42 (UTC)
Goto Top
Moin Markus,

Ich werde Sie jetzt mal explizit deaktivieren.
das ist eine sehr gute Idee.

Zur größten Not könnte man die Module (testweise) ausbauen.
Das ist wiederum nicht notwendig.

So jetzt zu der Kupfer-NIC.

Ethernet Fließkontrolle Rx & Tx aktiviert *FlowControl {3}
das solltest du auschalten.

Ethernet Interrupt-Moderation Aktiviert *InterruptModeration {1}
das auch.

Ethernet Maximale RSS-Warteschlangenanzahl 4 Warteschlangen *NumRssQueues {4}
Was deneken sich die Hersteller überhaupt bei dieser Defaulteinstellung.
4 RSS-Queues bei einem 1G Adapter ... 🙈 ... das ist absoluter Blödsinn.
Entweder wenn möglich auf 1 stellen oder RSS vollständig deaktivieren.

Ethernet Puffer empfangen 512 *ReceiveBuffers {512}
kannst auf 2048 erhöhen, wird dir in deinem Anwendungsfall aber wahrscheinlich nicht viel bringen.

Ethernet Seitenskalierung empfangen Aktiviert *RSS {1}
Siehe oberen Kommentar bei RSS-Queues.

Ethernet Puffer übertragen 128 *TransmitBuffers {128}
Den kannst du auch auf ruhig auf 2048 stellen.

Ethernet Advanced EEE Aktiviert AdvancedEEE {1}
Ethernet Energy Efficient Ethernet (LAN-Energiesparen, EEE) Aktiviert EEE {1}
Ethernet Green-Ethernet Aktiviert EnableGreenEthernet {1}
Ethernet Gigabit Lite Aktiviert GigaLite {1}
Energiesparmodus + Erweiterter Energiesparrmodus + Green-Ethernet + Gigabit Lite ... 😱 ... bitte alles ausschalten.

OK, jetzt noch zu RSS. Wie schon oben erwähnt, ist RSS bei 1G ein volkommener Blödsin, weil ein einzelner Kerne der CPU's der letzten mindestens 10 Jahre,
absolut locker mit diesen Datenraten umgehen kann. RSS mach erst bei > 5G Sinn.
Ja, OK, wenn man RSS komplett abschaltet, dann wird die Netzwerklast sturr auf einem Kern abgewickelt,
das sollte in dem von dir beschriebenen Anwendungsfall jedoch kein Problem darstellen.

Alternativ kannst du mit dem folgenden Befehl mal versuchen die RSS-Engine etwas zu optimieren.

Set-NetAdapterRss -Name "Ethernet" -NumberOfReceiveQueues 1 -MaxProcessors 1 -Profile ClosestStatic  

Und das noch hinterherjagen, damit auch der SMB-Client passt.

Set-SmbClientConfiguration -ConnectionCountPerRssNetworkInterface 1

Wenn du den SMB-Client vollends optimieren möchtest, dann noch das hier hinterherjagen.

Set-SmbClientConfiguration -DirectoryCacheLifetime 0
Set-SmbClientConfiguration -EnableBandwidthThrottling $false
Set-SmbClientConfiguration -FileInfoCacheLifetime 0
Set-SmbClientConfiguration -FileNotFoundCacheLifetime 0
Set-SmbClientConfiguration -WindowSizeThreshold 1
Set-SmbClientConfiguration -EnableLargeMtu $true
Set-SmbClientConfiguration -MaxCmds 100
Set-SmbClientConfiguration -EnableSecuritySignature $true
Set-SmbClientConfiguration -RequireSecuritySignature $false

(Taskmanager --> Leistung --> Arbeitsspeicher)

Mach ich!

Ganz ehrlich, ich vermute dein Hauptproblem eher in der RAM Belegung, aber die oberen Optimierungen werden ganz sicher nicht schaden.

Wie kommt es eigentlich dazu, dass du einen NUC mit einer Realtek NIC hast, die haben doch normalerweise die Intel eigene I2xx Serie verbaut.

Beste Grüsse aus BaWü
Alex
Member: scoopy0815
scoopy0815 Jul 22, 2022 at 08:37:27 (UTC)
Goto Top
Hallo zusammen!
Erstmal danke Alex für die ausführliche Rückmeldung!

Ich werde das jetzt mal gestaffelt testen. Damit ich auch später weis welche Einstellung / Änderung den Erfolg gebracht hat. (das Problem wird, wenn nicht gelöst, innerhalb einer Woche wieder auftreten)

1. WLAN Karte(n) deaktiviert (22.07.2022)
2. deine (Alex / MysticFoxDE) Änderungen für die LAN Schnittstelle (ausstehend)
3. ...

Ganz ehrlich, ich vermute dein Hauptproblem eher in der RAM Belegung, aber die oberen Optimierungen werden
ganz sicher nicht schaden.

Wie sollte die RAM Belegung da ursächlich sein? Die lokale Auslastung des RAMs ist eher gering, weil die Benutzer auf TS arbeiten...

Wie kommt es eigentlich dazu, dass du einen NUC mit einer Realtek NIC hast, die haben doch normalerweise die Intel
eigene I2xx Serie verbaut.

Gute Frage. Für die ich aber erstmal (ohne Nachforschungen) keine Antwort habe.

Ich halte Euch auf dem Laufenden...
Gruß Markus
Mitglied: 108012
108012 Jul 22, 2022 at 10:53:41 (UTC)
Goto Top
1. WLAN Karte(n) deaktiviert (22.07.2022)
Alternativ kannst Du denen auch ein anderes Netzwerk geben!
- LAN 192.xx.xx
- WLAN 172.xx.xx

3. ...
Mehr RAM

Ich halte Euch auf dem Laufenden...
Das wäre nett.

Dobby
Member: MysticFoxDE
MysticFoxDE Jul 22, 2022 at 18:20:43 (UTC)
Goto Top
Moin Markus,

Ganz ehrlich, ich vermute dein Hauptproblem eher in der RAM Belegung, aber die oberen Optimierungen werden
ganz sicher nicht schaden.

Wie sollte die RAM Belegung da ursächlich sein? Die lokale Auslastung des RAMs ist eher gering, weil die Benutzer auf TS arbeiten...

du nutzt die NUC's nur als TS-Clients, daher gehe ich davon aus, dass du diesen wahrscheinlich 4-8GB spendiert hast,
aber auch selbst wenn du in diesen 16GB verbaut hast, ist es bei W10 nur eine Frage der Zeit, bis der freie RAM durch das elende "Standby Memory/Software-Block-Caching" aufgefressen wurde. ☹️
Aber keine Sorge, wenn das dein Problem ist, dann habe ich dafür wahrscheinlich eine Lösung.
Und nein keine Sorge, die heisst nicht mehr RAM kaufen, das ist bei einem reinen TS-Client definitiv Perle vor die Säue geschmissen.
4GB sollten die NUC's jedoch mindestens haben.

Beste Grüsse aus BaWü
Alex
Member: scoopy0815
scoopy0815 Aug 12, 2022 at 13:32:54 (UTC)
Goto Top
Hallo zusammen,

ich habe ja das WLAN auf den betreffenden Geräten ausgeschalten, clean reboot. Danach ist das Problem nochmal
auf einem der PCs aufgetreten und jetzt aber länger nicht mehr!! Sehr mysteriös...

Danke für Eure Hilfe! Ich hoffe es bleibt ruhig...
Markus