LACP flapping: Ständig wird ein Port entfernt und wieder hinzugefügt
Hallo.
Wir setzen bei uns Cisco SG350X-Switche ein, die z.T. über LAGs miteinander verbunden sind. Einige Doppelleitungen führen auch zu einem Unifi-16XG-Switch, der ebenfalls LACP-LAGs kann. Nun sehe ich im Log unseres Layer3-Routers (ebenfalls ein SG350X-24) ständig Meldungen dieser Art:
Das geht also quasi im Minutentakt so.
Ich habe natürlich schon danach gesucht aber bisher keine gute Lösung für das Problem gefunden. Es tritt übrigens erst auf, seitdem wir auf 10GBit SFP+ gewechselt sind. Vorher liefen diverse LAGs auf Kupfer (nur 1 GBit) -- da gab es dieses Problem imho nie?!?
Hat jemand eine gute Idee, wonach ich schauen kann?
Es ist doch nicht so, dass bei einem LAG ein Port heruntergefahren wird, wenn dort nichts los ist, oder?
Danke.
Wir setzen bei uns Cisco SG350X-Switche ein, die z.T. über LAGs miteinander verbunden sind. Einige Doppelleitungen führen auch zu einem Unifi-16XG-Switch, der ebenfalls LACP-LAGs kann. Nun sehe ich im Log unseres Layer3-Routers (ebenfalls ein SG350X-24) ständig Meldungen dieser Art:
...
2147427869 2020-May-10 16:56:28 Warning %TRUNK-W-PORTREMOVED: Port te1/0/2 removed from Po6
2147427871 2020-May-10 16:55:46 Warning %TRUNK-W-PORTREMOVED: Port gi1/0/9 removed from Po1
2147427874 2020-May-10 16:54:14 Warning %TRUNK-W-PORTREMOVED: Port gi1/0/9 removed from Po1
2147427876 2020-May-10 16:53:28 Warning %TRUNK-W-PORTREMOVED: Port te1/0/2 removed from Po6
2147427879 2020-May-10 16:51:00 Warning %TRUNK-W-PORTREMOVED: Port te1/0/2 removed from Po6
2147427880 2020-May-10 16:50:49 Warning %TRUNK-W-PORTREMOVED: Port gi1/0/9 removed from Po1
2147427882 2020-May-10 16:49:30 Warning %TRUNK-W-PORTREMOVED: Port te1/0/2 removed from Po6
2147427884 2020-May-10 16:48:44 Warning %TRUNK-W-PORTREMOVED: Port gi1/0/9 removed from Po1
2147427886 2020-May-10 16:47:58 Warning %TRUNK-W-PORTREMOVED: Port te1/0/2 removed from Po6
2147427888 2020-May-10 16:45:28 Warning %TRUNK-W-PORTREMOVED: Port te1/0/2 removed from Po6
2147427890 2020-May-10 16:44:46 Warning %TRUNK-W-PORTREMOVED: Port gi1/0/9 removed from Po1
2147427894 2020-May-10 16:43:45 Warning %TRUNK-W-PORTREMOVED: Port te1/0/1 removed from Po6
2147427895 2020-May-10 16:43:45 Warning %TRUNK-W-PORTREMOVED: Port gi1/0/24 removed from Po4
...
Ich habe natürlich schon danach gesucht aber bisher keine gute Lösung für das Problem gefunden. Es tritt übrigens erst auf, seitdem wir auf 10GBit SFP+ gewechselt sind. Vorher liefen diverse LAGs auf Kupfer (nur 1 GBit) -- da gab es dieses Problem imho nie?!?
Hat jemand eine gute Idee, wonach ich schauen kann?
Es ist doch nicht so, dass bei einem LAG ein Port heruntergefahren wird, wenn dort nichts los ist, oder?
Danke.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 666605
Url: https://administrator.de/contentid/666605
Ausgedruckt am: 04.12.2024 um 08:12 Uhr
26 Kommentare
Neuester Kommentar
Ich sehe, dass du scheinbar einen Mischbetrieb hast, also 10GbE und 1GbE-Trunks. Sind die auch vermischt? Also 10GbE-Verbindungen mit 1GbE-Verbindungen in einem LACP-Trunk?
Nein, bei Trunks bleiben alle aktiven und funktionierenden Verbindungen dauerhaft aktiv.
Es tritt übrigens erst auf, seitdem wir auf 10GBit SFP+ gewechselt sind. Vorher liefen diverse LAGs auf Kupfer (nur 1 GBit) -- da gab es dieses Problem imho nie?!?
Kann ich so irgendwie nicht glauben, weil die meisten Ausfälle betreffen ja 1GbE-Verbindungen, die haben mit SFP+ ja nichts zu tun.Nein, bei Trunks bleiben alle aktiven und funktionierenden Verbindungen dauerhaft aktiv.
Moin,
Sprich sind die Messprotokolle der Leitungen 1a?
Gruß,
Dani
Es ist doch nicht so, dass bei einem LAG ein Port heruntergefahren wird, wenn dort nichts los ist, oder?
Nein, dem ist nicht so. Hat jemand eine gute Idee, wonach ich schauen kann?
Tritt das Problem auch auf, wenn du auf den betroffenen Ports Speed und Duplex temporär fest einstellst?Es tritt übrigens erst auf, seitdem wir auf 10GBit SFP+ gewechselt sind.
Handelt es sich um GBICs für LWL oder wird die bisherige Kupferleitung weitergenutzt?Sprich sind die Messprotokolle der Leitungen 1a?
Gruß,
Dani
Moin,
Was ich mir auch vorstellen könnte hatte ich ähnlich schonmal das eine Fehlerhafte Konfiguration von Loop Protection mit disable Timer vorliegt oder ein nahe liegendes Spanning Tree Problem weshalb die Ports auf Forward oder Blocking gehen. Erzeugt im Log meist die selbe Meldung.
Daher würde ich prüfen ob alle Links an alle Stellen sauber in den LAGs Konfiguriert sind. Statisches dynamisches LACP. Dann ob der Spanning Tree Prio sauber auf dem Coreswitch liegt und die restlichen Switche eine geringeren Wert (ID) als der Core haben. Keine Loops im Netzwerk vorhanden sind
Grüße
Niklas
Was ich mir auch vorstellen könnte hatte ich ähnlich schonmal das eine Fehlerhafte Konfiguration von Loop Protection mit disable Timer vorliegt oder ein nahe liegendes Spanning Tree Problem weshalb die Ports auf Forward oder Blocking gehen. Erzeugt im Log meist die selbe Meldung.
Daher würde ich prüfen ob alle Links an alle Stellen sauber in den LAGs Konfiguriert sind. Statisches dynamisches LACP. Dann ob der Spanning Tree Prio sauber auf dem Coreswitch liegt und die restlichen Switche eine geringeren Wert (ID) als der Core haben. Keine Loops im Netzwerk vorhanden sind
Grüße
Niklas
MSTP ist auch deaktiviert? Ansonsten würde ich es mal so probieren jeweils nur 1 Port zu jedem Switch zu haben, ein administratives herunterfahren der Ports reicht und dann prüfen ob du immernoch Portflapping hast.
Ich würde parallel auch die physischen Verbindungen prüfen ob sich nicht wirklich ein Loop eingeschlichen hat kann im Eifer des Gefechtes passieren. Das kannst du imho mit einem simplen Ping auf die Management IP von jedem Switch prüfen, natürlich dann den letzten wissentlichen Port im LAG administrativ herunterfahren.
Übringens ist auf Unifi Switchen per Default Spanning Tree an das muss explizit deaktiviert werden, habe gerade nochmal auf meine im Einsatz befindlichen Unifi Controller geschaut.
Ich würde parallel auch die physischen Verbindungen prüfen ob sich nicht wirklich ein Loop eingeschlichen hat kann im Eifer des Gefechtes passieren. Das kannst du imho mit einem simplen Ping auf die Management IP von jedem Switch prüfen, natürlich dann den letzten wissentlichen Port im LAG administrativ herunterfahren.
Übringens ist auf Unifi Switchen per Default Spanning Tree an das muss explizit deaktiviert werden, habe gerade nochmal auf meine im Einsatz befindlichen Unifi Controller geschaut.
Ja das kommt definitiv zu unerwünschtem Verhalten. Das könnte schon dein Problem sein :/. Was Enterprise Features angeht da bin von Unifi nicht so überzeugt, da sind die Anbieter Cisco, Ruckus, Aruba, HPE wesentlich besser und da lässt sich das auch gut konfigurieren. Selbst bei LACP dreht man sich bei Unifi schon einen wolf.