ennvee
Goto Top

Server: Sporadische Netzwerk-Aussetzer

Liebe Community,

in einer Konfiguration mit einem Windows 2016-Server (s.u.) und 8 Clients beobachten wir unregelmäßige kurze Aussetzer - etwa 10 mal am Tag (unregelmäßig) verlieren alle Clients für maximal 5 Sekunden die Verbindung zum Server. Wir haben bisher folgendes getestet:

- permanente Pings vom Server an alle Clients mit PingPlotter Pro: beobachtetes Fehlerbild, 100% Packet Loss für wenige Sekunden an alle Clients gleichzeitig
- permanente Pings von einem Client zum Server: gleiches Fehlerbild, Zeiten stimmen überein
- permanente Pings zwischen Clients: Keine Ausfälle (!)
- Zusätzliche Anbindung des Servers ins Netzwerk via 2. LAN-Port: Fehlerbild bleibt bestehen, bei einem Ausfall fallen beide Anschlüsse gleichzeitig aus (!)

Treiber sind aktuell, Kabel sowie Switch schließen wir aufgrund des Tests mit 2 verschiedenen Ports am Server aus. Im Windows Event-Log steht unmittelbar vor dem Aussetzer das ominöse "Ereignis 27" von "e1rexpress" - allerdings nur für das eine Netzwerk-Interface! Erhöhter Traffic vor dem Ausfall können wir nicht feststellen, auch sonst scheint nichts ungewöhnliches zu passieren.

Konfiguration des Servers:
- Supermicro X11SSM-F mit 2x Intel I210 Gigabit Interface
- Windows Server 2016
- Offizielle Treiber der Supermicro Support-Seite

Switch: Netgear ProSAFE JGS524PE
DSL-Router: Telekom Digibox Premium (...)

Leider befindet sich das ganze Setup in einer Arztpraxis, sodass wir nur sehr wenig invasiv testen können (mal eben alle Geräte aus dem Netz nehmen geht halt nicht). Hat jemand eine Idee, woran das beobachtete Fehlerbild liegen kann? Oder was ich tun kann, um dem Problem näher zu kommen?

Vielen Dank für alle Hilfe!!

Content-ID: 393201

Url: https://administrator.de/contentid/393201

Ausgedruckt am: 22.11.2024 um 16:11 Uhr

sabines
Lösung sabines 19.11.2018 um 09:49:20 Uhr
Goto Top
Moin,

ist das virtualisiert?
Als erstes mal die Energie Einstellungen der NIC prüfen und alles was irgendwie nach Energiesparen aussieht deaktiveren.
Dann im Eventlog nachschauen, ob es außer der 27er Meldung noch andere zeitgleiche Ereingnisse gibt.

Gruss
erikro
Lösung erikro 19.11.2018 um 09:54:51 Uhr
Goto Top
Moin,

die Fehler-ID bedeutet, dass die Verbindung weggeflogen ist. Als Erstes tausche mal alle Netzwerkkabel, die an der Verbindung des Servers beteiligt sind. Häufig ist das schlicht ein Wackler im Kabel oder Schmutz auf den Kontakten. Dann Switch neu starten oder besser noch versuchsweise gegen ein anderes Gerät tauschen.

hth

Erik
keine-ahnung
keine-ahnung 19.11.2018 um 10:42:56 Uhr
Goto Top
Moin,
mal eben alle Geräte aus dem Netz nehmen geht halt nicht
warum nicht? Arbeiten die da 24/7 durch face-smile ?
Wird Dir nix anderes übrig bleiben, als zu gucken, wer da Sperenzchen macht. Ich würde mal mit einer separaten LAN-Karte anfangen, wenn die Clients am selben switch wie der Server hängen, dürfte der als Ursache ausfallen.

LG, Thomas
117471
117471 19.11.2018 aktualisiert um 11:53:11 Uhr
Goto Top
Hallo,

häng doch mal testweise ein Notebook mit PingPlotter via Crossoverkabel für 1-2 Tage direkt an die 2. Netzwerkkarte.

Hilft beim Eingrenzen face-smile

Gruß,
Jörg
areanod
Lösung areanod 19.11.2018 um 11:57:08 Uhr
Goto Top
Das genannte Symptom kann viele Ursachen haben, ich glaube jedoch, dass es sich hier um kein Treiberproblem handelt.

Probier mal folgendes aus, die Reihenfolge ist relativ egal:

1.) Wenn der Server nicht direkt, sondern z.B. über eine passive Infrastruktur (permanente Hausverkabelung über Patchpanels & Netzwerkdosen) --> probier den Server mal mit einem Patchkabel direkt am Switch anzuhängen, auch wenn's russisch aussehen sollte, für einen Tag zum debuggen ist sowas verkraftbar.

2.) Schalt auf den NICs Auto-Negotiation aus und fixere die Geschwindigkeit. Wenn mit GBit immer noch Verbindungsabbrüche passieren, probier's temporär mit 100MBit.
Wenn das fixieren von GBit das Problem gelöst hat, Congratz. Wenn das Problem mit Geschwindigkeit auf 100MBit gelöst wurde dann solltest du dir die Netzwerkverkabelung durchmessen (lassen), da könnte es evt. defekte geben.

3.) Probier mal temporär einen anderen Switch aus!
niklasschaefer
niklasschaefer 19.11.2018 um 12:22:21 Uhr
Goto Top
Hi,

wenn du beide Netzwerkkarten aktiv hast. Nutzt du dann auch LACP/Teaming? Wenn Nein hast du schonmal ein Problem im selben Netz mit Broadcast etc . Intel Treiber mal probiert? Firmware des Servers sowie der Netzwerkkarten aktuell?

Gruß Niklas
ennvee
ennvee 19.11.2018 um 12:33:10 Uhr
Goto Top
Hallo zusammen,

vielen Dank für die sehr schnellen und guten Anregungen! Ich habe mal eine Reihe der "Sofortmaßnahmen" befolgt (Auto-Negotiation deaktiviert, Energieeinstellungen geprüft - die waren gut in einem eigenen Menü versteckt..., Verkabelung getauscht) - seit knapp 2 Stunden gab es keinen Ausfall mehr. So weit so gut, heißt leider noch nichts...

Als nächstes werde ich - falls später wieder was aussteigt - wohl die Idee von Jörg probieren (konnte ich eben noch nicht, weil ich noch Client <-> 2. NIC Ping-testen wollte). Ggf. dann Mittwoch nach Feierabend die direkt-Verkabelung, vielleicht lege ich auch mal testweise den Server und einen Client direkt zusammen an den Router.

Ich melde mich, sobald ich was habe!
areanod
areanod 19.11.2018 um 12:35:29 Uhr
Goto Top
wir sind gespannt face-smile

lG
fisi-pjm
fisi-pjm 19.11.2018 um 15:55:51 Uhr
Goto Top
Zitat von @ennvee:
Als nächstes werde ich - falls später wieder was aussteigt - wohl die Idee von Jörg probieren (konnte ich eben noch nicht, weil ich noch Client <-> 2. NIC Ping-testen wollte). Ggf. dann Mittwoch nach Feierabend die direkt-Verkabelung, vielleicht lege ich auch mal testweise den Server und einen Client direkt zusammen an den Router.

Kannst dir aber dabei das Crossover Kabel sparen, ich glaube es gibt keine halbwegs nicht aus der Steinzeit stammende Netzwerkkarte die nicht MDI-X unterstützt.

vG
PJM
Heccon
Lösung Heccon 20.11.2018 um 15:21:23 Uhr
Goto Top
Hi,

wir hatten mal ein ähnliches Problem vor langer Zeit, auch Supermicro Boards mit 2x Intel NIC.

Seinerzeit lag es an den Intel NICs vom Board. Die hatten ein Problem mit dem ASPM L1 State.
Nach Deaktivieren im Bios liefen die NICs dann ohne Fehler.

https://communities.intel.com/thread/54064

Ein Versuch ist es wert.

Grüße
ennvee
ennvee 20.11.2018 um 15:50:48 Uhr
Goto Top
Hallo zusammen, seit mehr als 24 Stunden gab es nicht einen Disconnect! Meiner Einschätzung nach liegt das...
  • ... entweder an EEE, das in einem eigenen Reiter der NIC-Settings deaktiviert werden musste
  • ... oder daran, dass Auto Negotiation deaktiviert und die NICs fest auf 1GBps/Duplex gesetzt wurden.
Wie dem auch sei: Vielen Dank euch allen für die hilfreichen Antworten und Ideen! Ich setzte den Thread mal auf "gelöst", beobachte das Netz noch ein bisschen und hoffe, dass es damit tatsächlich erledigt ist. Danke! face-smile