vizman2
Goto Top

Netzwerk - falsche Datenraten und jumping Clients

Hallo Community

Nach langer Zeit wieder da.

Ich habe diesmal ein Problem im Heimnetz, welches weder ich noch involvierte IT experts bisher lösen konnten.

Problem in kürze:
Nach dem Austausch eines Unmanaged Switch gegen einen Managed Switch spinnt das gesamte Netzwerk. Merkwürdigerweise springen manche clients lt. Router Oberfläche zwischen den angeschlossen LANs selbst wenn das nicht möglich ist und noch wichtiger ist, dass teile des Netzwerkes auf einmal nur noch 100er statt zuvor 1000er Datenraten haben.
Vor dem Tausch lief alles stabil und super auf 1000.

Netzwerkaufbau im Detail:
Netzwerk ist im Stern aufgebaut.
Router: FritzBox 7490, alle 4 LANports auf 1Gib eingestellt, kein Gast-lan, im Keller. Alle 4 LAN Anschlüsse sind belegt und die Verbindung wird auch in der FritzBox angezeigt.
DHCP zwischen .20 bis .90. IP range ab 100 ist für statische Adressen reserviert.
IP-Konflikte sind nicht vorhanden.
Insgesamt sind 50+ Clients im Netzwerk. Manche über WiFi, andere über Kabel an einem Switch.
Alle Clients sind stabil im Netzwerk und auch online wie es gewollt ist. Generell keine Stabilitiätsprobleme.


Verkabelung im Gebäude ist seit 9 Jahren unverändert mit Cat6 Installationskabeln aufgebaut. Je 1 Kabel pro Stockwerk (außer Keller) Cat6 Kabeldose im Stockwerk. Alle 3 Stockwerk-kabel kommen im Keller, 50cm von der Fritzbox entfernt, an einem Patchpanel an.
Das längste Installationskabel vom Keller bis zum 2. Stock ist 47 Meter lang.
Kabel aus dem 1. & 2. Stock kommen gemeinsam durch einen Versorgungsschacht im Keller an und werden zum Raum mit der Fritzbox an der Decke weitergeführt. Das EG kommt an einem anderen Kellerraum an, und wird auch an der Kellerdecke bis zum Raum mit der Fritzbox an der Decke weitergeführt.
Der Keller-Switch ist direkt an die Fritzbox angeschlossen, da sie nah beinander stehen.

Switches & WiFi APs:
In allen 4 Stockwerken (Keller, EG, 1. Stock, 2. Stock) ist das gleiche Set aufgebaut:
Managed Switch D-Link DGS-1100-10MPV2 mit je einem D-Link DAPx Access Point (versch. Modelle) inkl. PoE.
Jeder Switch steht nah an der Dose in der Wand. Meistens jedoch mit Cat5e Kurzkabel verbunden.

Problem im Detail und seit wann es besteht:
Die Installation hat sich seit Jahren nicht geändert. Bis vor Kurzem lief auch alles sauber auf 1000 wie gewollt.
Vor ein paar Wochen, habe ich den letzten DGS-1100 ins Netzwerk hinzugefügt.
Im EG lief vorher noch ein Netgear ProSAFE 8-port unmanaged Switch.
Diesen Netgear habe ich einfach gegen einen DGS-1100 getauscht. Mehr nicht.

Seitdem dem Tausch spinnt mein Netzwerk vollkommen rum:
Sowohl EG als auch 1. Stock und 2. Stock sind reduziert auf 100 Mbit Datenrate.
Zudem (halb so wild) springen die Netzwerk Clients von LAN zu LAN laut Fritzbox, selbst bei Clients die rein physikalisch keine 2 Netzwerkoptionen haben.
Z.b. ist mein PC im 2. Stock, welcher nur per Kabel angeschlossen und an Fritzbox an LAN2 angeschlossen ist, mal in LAN1, mal in LAN3 aber nie in LAN2 angezeigt.
Egal an welchem Switch ich dann manuell die Datenrate auf 1000Mbit stelle, geht sofort die Verbindung dauerhaft verloren. Wenn ich alles auf Auto-Negociation belasse, werden nur 100Mbit ausgehandelt. Paradoxer weise ist auch nur eine 100er Verbindung möglich wenn ich statt der FritzBox einen anderen Switch dazwischen schalte.

Folgendes habe ich bereits versucht: Alles jedoch ohne eine einzelne Veränderung.
1. Netzwerk wieder in den vorigen Zustand gebracht mit dem alten Netgear switch.
2. IP Adressen konflikte gesucht und nichts gefunden.
3. Alle Firmware überprüft, alle Netzwerkgeräte laufen auf der jeweils aktuellsten Firmware
4. Sowohl mit "Billo"-Prüfer als auch über die Kabeltest-Funktion der Switche die Kabel geprüft = Alles immer OK.
5. Letzte Woche nach Loops gesucht und jedes Stockwerk bis auf Switch & APs getrennt, und an der Fritzbox ebenfalls alles getrennt und 100% nachvollzogen, dass es keinen Loop gibt.
6. Die vorhanden Switche durch andere Switche getauscht: 2 TP-Link, den Netgear, einen weiteren DGS-1100MPV2 und noch einen DGS-1100MP.
7. Alle Geräte natürlich neu gestartet. Sowohl über das UserInterface, als auch durch Stromstecker ziehen.
8. Zuletzt alle Switche nacheinander im Abstand von 10 Minuten wieder an die Fritzbox verbunden und erst später alle Netzwerkgeräte nacheinander wieder eingeschaltet bzw. verbunden.
9. Alle Kabel zwischen FritzBox und Patchpanel als auch jeweils zwischen Switch und Dose gegen andere getauscht.
10. Alle Verbindungen auf Korrusion o.Ä. geprüft. Genau so im Patchpanel auch ob nicht irgendwo ein Äderchen einen Kurzschluss verursacht.

Die Datenraten zwischen den Netzwerkgeräten zu den jeweiligen Switches läuft stabil auf 1000. Mit Ausnahme von Clients die nur 100 Mbit können.

Ich bin mit meinem Latein am Ende. Es gab weder Blitzeinschläge, Wasser, noch wurde irgendetwas an der Installation/Kabellage geändert.
Ich hoffe jemand von euch hat eine Idee wie ich vor allem das Datenraten-Problem lösen kann.

Vielen Dank schon mal.

Content-ID: 668296

Url: https://administrator.de/contentid/668296

Ausgedruckt am: 27.09.2024 um 01:09 Uhr

Trinatrium
Trinatrium 22.09.2024 um 14:41:22 Uhr
Goto Top
Poste mal die Logs vom Switch.

Dein Hilferuf bringt niemand weiter, weil es nichts Wesentliches nennt.
aqui
aqui 22.09.2024 aktualisiert um 16:17:53 Uhr
Goto Top
Nach langer Zeit wieder da.
Sagt jemand der seit 22.9.24 dabei ist?! 🤔
Alle 4 LAN Anschlüsse sind belegt
Wieso wenn du mit einer Switch Infrastruktur arbeitest?? Zumindesten dürfen 3 der 4 Fritzbox Ports keinesfalls auf der Switch Infrastruktur parallel aufliegen! Ausnahme ist nur das Gastnetz auf LAN-4 sofern das in einem VLAN auf dem managed Switches separiert wurde. Guckst du dazu auch hier.
Da die Fritzbox kein Spanning Tree zum Schutz vor Netzwerk Loops supportet auf dem embeddeten 4 Port Switch besteht hier eine erhöhte Loop Gefahr sofern du das missachtest.
Du solltest zwingend darauf achten das zumindestens auf allen managebaren Switches Spanning Tree aktiv ist. Das verhindert einen Loop sofern du solche Fehler begangen hast und Links doppelt bzw. parallel gesteckt hast!!
springen die Netzwerk Clients von LAN zu LAN
WIE soll das gehen wenn du scheinbar gar kein segmentiertes Netzwerk betreibst und alles in einem dummen, flachen Layer 2 Netz betrieben wird. Mehrfache "LANs" kann es da Prinzip bedingt ja gar nicht geben?! 🤔

Bei Billogeräten kann es in eingen seltenen Fällen zu einem Autonegotiation Mismatch führen so das Speed und Duplex Mode nicht korrekt ausgehandelt werden. Das passiert wenn Hersteller die MDI-X Funktion schlampig implementieren.
https://de.wikipedia.org/wiki/Medium_Dependent_Interface
Das kann man prüfen indem man an solch betroffenen Links einmal einen unmanaged Switch dazwischenhängt und die Speed und Duplexrate überprüft.
Fixen lässt sich das sehr leicht indem man zu mindestens an den managed Switches an diesen betroffenen Ports die Speed und Duplex Rate statisch einstellt.
Alternativ kann man testweise einmal ein Crossover Patchkabel verwenden oder einen Crossover Adapter.

Nach deinen Schilderungen der Symptome muss man aber hier vermuten das du durch falsche oder fehlerhafte Verkabelung sehr wahrscheinlich mit parallelen L2 Verbindungen temporäre Loops erzeugt hast. Dafür sprechen die wechselnden Verbindungen.
Hier solltest du, wie immer strategisch vorgehen...
  • Zuerst allein nur die Switches verbinden ohne aktive Endgeräteports!
    • keine parallelen Switch Verbindungslinks sofern sie nicht als LACP LAGs konfiguriert wurden!
    • bei den managed Switche durchgängig Spanning Tree mit RSTP aktivieren
    • der zentrale "Core" Switch der alle anderen Switches sternförmig versorgt MUSS eine höhere Spanning Tree Priority haben z.B. 8192 (in Vielfachen von 4096! Default ist 32768)
  • steht das o.a. Design, dann nur einbeinig die Fritzbox anhängen und nur einen Test PC idelaerweise an einen Access / Stockwerksswitch.
    • Mit dem Test PC checkst du mit einem parallelen Dauerping die Fritzbox und die Management IP Adressen der managed Switches
  • Klappt obiges fehlerfrei für mindestens 5 Minuten nimmst du einzeln und Schritt für Schritt weitere Geräte ins Netz (NAS, Drucker etc.) und machst weiter den o.a. Ping Check
So hangelt man sich dann auf eine korrekte und sauber gesteckte Netzwerk Infrastruktur.
vizman2
vizman2 24.09.2024 aktualisiert um 11:55:59 Uhr
Goto Top
@Trinatrium.
Keine Ahnung wie man hier csv-dateien hoch laden könnte. daher als bild122.
bild122
bild5333
Die Logs sagen mir leider nichts.

@aqui
Danke für dein Feedback soweit. Hier ein paar Antworten/Gegenfragen.
Ich dachte die FritzBox hat solch eine Funktion?:
fb_st
WIE soll das gehen wenn du scheinbar gar kein segmentiertes Netzwerk betreibst und alles in einem dummen, flachen Layer 2 Netz betrieben wird. Mehrfache "LANs" kann es da Prinzip bedingt ja gar nicht geben?!
--> Ja richtig. War nie segmentiert. Jedoch hat die FritzBox in der Vergangenheit stets korrekt den angeschlossenen LAN-port angezeigt. Z.B. Alle Clients am Switch, welcher an LAN Port1 angeschlossen ist, wurden in der FB als "LAN1" angezeigt.
Aber das ist mir ja vollkommen egal, da es ja wirklich nur ein unsegmentiertes 'basic' Netzwerk ist.


Bei Billogeräten kann es in eingen seltenen Fällen zu einem Autonegotiation Mismatch führen so das Speed und Duplex Mode nicht korrekt ausgehandelt werden. Das passiert wenn Hersteller die MDI-X Funktion schlampig implementieren.

Das war auch meine Idee. Deswegen habe ich ja nach und nach meine Netzwerkinfrastuktur auf D-Link DGS1100 switches migriert. Dies ist kein Consumer Produkt und nicht mit echten 'Billo' Geräten zu vergleichen.

Fixen lässt sich das sehr leicht indem man zu mindestens an den managed Switches an diesen betroffenen Ports die Speed und Duplex Rate statisch einstellt.

Wie ich bereits geschrieben habe, geht die Verbindung komplett verloren, sobald ich an einem oder an beiden Switchen manuell die Datenrate einstelle. Nur bei automatischer Aushandlung besteht eine Verbindung. Dies habe ich auch im Mix mit anderen Switchen von anderen Herstellern getestet, sofern ich mir einen anderen managed Switch ausleihen konnte.

Wie gesagt, die Verkabelung habe ich mehrfach getestet und kann 100% eine fehlerhafte Verkabelung ausschließen.

Ich bin deinem Vorschlag gefolgt und momentan sieht mein Netzwerk wie folgt aus (Vereinfacht):
nw_simple
Die grünen Verbindungen laufen mit 1000Mbit und die roten auf 100Mbit.

Aus Zeitgründen habe ich erstmal nur das Netzwerk so umgebaut. Deiner Empfehlung werde ich noch nachgehen und hoffentlich in den kommenden Tagen ausführen.
Alle switche zeigen den selben RSTP status: "RSTP Root Der Root ist HauptSwitch Switch / Priorität für Root Bridge: 32768"

Was mir noch von anderer Seite angeraten wurde, ist es alle Switche komplett zu resetten und auch in der FB alle 'überbleibsel' dieser Switche zu löschen. Mir wurde gesagt, dass auch bei Switchen z.b. ausgehandelte Datenraten gecached werden, jedoch nicht wie lange der cache gehalten wird. (?). Naja es kann auf jeden Fall nicht schaden.
Daher ist mein Plan, kombiniert mit deinem vorgeschlagenen Vorgehen:
  • Alle Clients deaktivieren und vom Netzwerk trennen (Kabel & WLAN)
  • Alle Switches entfernen und resetten
  • Dann mit dem 'HauptSwitch' beginnend einen Switch nach dem Anderen einzeln anschließen.
  • Bevor ein Switch angeschlossen wird, lasse ich die meisten Einstellungen im Standard, aktiviere natürlich RSTP vor der Verbindung.
  • etc... wie von dir empfohlen


Es ist aber interessant wie sich ein Netzwerk schlagartig anders verhält, wenn man nur eine Komponente ändert. Wie bereits geschrieben, habe ich bloß den Switch im Wohnzimmer getauscht. Anstelle des unmanaged Netgear einen weiteren DGS angeschlossen, ohne sonst etwas an der Verkabelung zu ändern.
Trinatrium
Trinatrium 24.09.2024 um 11:56:28 Uhr
Goto Top
Ich kann nichts erkennen.
Ansonsten der Code Tag.
vizman2
vizman2 24.09.2024 um 11:59:35 Uhr
Goto Top
@Trinatrium:

2024-09-23 09:16:53
Ungültige HTTP-Nachricht
Switch
Switches
192.168.178.118
bc:0f:9a:9a:4f:e2
Reject an invalid message 'Sync Device Configuration Result(1)' due to "subCfgID" does not exit.{"taskInfo":{"_id":"BRD","taskType":{"config":"0xFFFF0550"},"operateType":"syncConfig","execTime":"2000/01/01 00:00:25","execResult":"Success"},"agentGroup":{"uuid":"AC08-A240797B-11EF9962-E118"},"msgVer":"1.5.4","device":{"macAddress":"bc:0f:9a:9a:4f:e2","type":1},"syncState":1,"setDeviceName":{"name":"OfficeSwitch"}}  
2024-09-23 09:16:52
Ungültige HTTP-Nachricht
Switch
Switches
192.168.178.200
e0:1c:fc:aa:94:ea
Reject an invalid message 'Sync Device Configuration Result(1)' due to "subCfgID" does not exit.{"taskInfo":{"_id":"BRD","taskType":{"config":"0xFFFF0550"},"operateType":"syncConfig","execTime":"2000/01/01 00:00:32","execResult":"Success"},"agentGroup":{"uuid":"AC08-A240797B-11EF9962-E118"},"msgVer":"1.5.4","device":{"macAddress":"e0:1c:fc:aa:94:ea","type":1},"syncState":1,"setDeviceName":{"name":"KellerSwitch"}}  
2024-09-23 09:16:37
Ungültige HTTP-Nachricht
Switch
Switches
192.168.178.120
c8:78:7d:09:44:d7
Reject an invalid message 'Sync Device Configuration Result(1)' due to "subCfgID" does not exit.{"taskInfo":{"_id":"BRD","taskType":{"config":"0xFFFF0550"},"operateType":"syncConfig","execTime":"2000/01/01 00:00:19","execResult":"Success"},"agentGroup":{"uuid":"AC08-A240797B-11EF9962-E118"},"msgVer":"1.5.4","device":{"macAddress":"c8:78:7d:09:44:d7","type":1},"syncState":1,"setDeviceName":{"name":"WohnzimmerSwitch"}}  
2024-09-23 09:16:19
Ungültige HTTP-Nachricht
Switch
Switches
192.168.178.190
34:0a:33:2c:80:46
Reject an invalid message 'Sync Device Configuration Result(1)' due to "subCfgID" does not exit.{"taskInfo":{"_id":"BRD","taskType":{"config":"0xFFFF0550"},"operateType":"syncConfig","execTime":"2000/01/01 00:00:12","execResult":"Success"},"agentGroup":{"uuid":"AC08-A240797B-11EF9962-E118"},"msgVer":"1.5.4","device":{"macAddress":"34:0a:33:2c:80:46","type":1},"syncState":1,"setDeviceName":{"name":"HauptSwitch"}}  
aqui
aqui 25.09.2024 aktualisiert um 12:19:41 Uhr
Goto Top
Wie ich bereits geschrieben habe, geht die Verbindung komplett verloren
Das ist die Frage immer:
  • WIE hast du das eingestellt? Normal ist Speed=1000, Duplex=Full
  • WAS ist auf der anderen Seite für ein Gerät

Dein wahrscheinlicher Kardinalsfehler ist aber das du die Fritte fälschlicherweise mehrfach angeschlossen hattest. Das geht so wegen ihres fehlenden Spanning Tree Supportes nicht. Hast du ja nun auch korrigiert.

Alle switche zeigen den selben RSTP status:
Das ist per se nicht falsch aber ein unsauberes Setup, denn damit kaspern sich die Switches selber zufällig aus wer der Root Switch ist was du ja keinesfalls willst!
Der DGS-1100 mit der IP .190 ist ja der zentrale Switch und der sollte immer eine höhere RSTP Priority haben, z.B. 8192!
Das stellt dann auch in einem nicht redundanten Design wie bei dir immer sicher das alle anderen Switches ihn als Root Switch "sehen" und deren Ports als Root Ports im Falle eines netzwerk Loops immer im Forwarding Mode verbleiben. Das solltest du also in jedem Falle noch ändern!
Mir wurde gesagt, dass auch bei Switchen z.b. ausgehandelte Datenraten gecached werden
Ja, aber ausschliesslich nur pro Link und auch nur für die Zeit wo der Link aktiv ist also die Link LED leuchtet. Ziehst du den Link wird logischerweise eine neue Autonegotiation getriggert.
Bis zur Unendlichkeit cached der Switch das also niemals. Wäre ja auch technisch ziemlich unsinnig, denn er muss ja davon ausgehen das an einem Port immer mal unterschiedliche Hardware angeschlossen wird.

Ansonsten ist den Plan aber richtig und auch eine sinnvolle Vorgehensweise. Wenn du als erstes den zentralen DGS-1100 aufsetzt solltest du diesem auch schon immer die höhere RSTP Priority setzen BEVOR du die anderen Switches der Reihe nach anschliesst.

Es ist aber interessant wie sich ein Netzwerk schlagartig anders verhält
Das kann je nach Umständen normal sein. Da du hier aber versäumt hast weder Log Messages noch Konsol Messages der Switches bei einem solchen Event einmal zu posten kann man leider auch nur in die Kristallkugel sehen und raten. face-sad
Solche Log Messages sagen in der Regel im Netzwerk immer WAS passiert und warum. Wozu hast du denn managebare Switches?! face-wink
Trinatrium
Trinatrium 25.09.2024 um 14:11:50 Uhr
Goto Top
Wenn es das STP ist, was dir in die Suppe spuckt, das wäre auch nicht unwahrscheinlich, dann ist die Root Bridge kein Zufall, bei selber Priorität, sondern wird über die MACs ausgerechnet.

Deine Logfiles lassen dahingehend keinen Schlüsse zu.
Es ist aber das was ein Netzwerker als erstes überprüfen würde.
Die andere Frage ist, warum nicht einmal der Baum steht, und hält.