Packetloss bei Multicast Paketen mehrere Router mit RSTP-Bridges
Hallo!
Folgendes Szenario: ich habe 3 Router CRS112, die im Ring miteinander verbunden sind. (R1->R2->R3->R1)
Die entsprechenden Ports liegen jeweils auf einer Bridge. Dort ist jeweils das RSTP Protokoll aktiviert. So weit so gut, es scheint für Unicast alles ganz gut zu klappen. Nun verursachen die angeschlossenen Geräte aber Multicast Traffic. Je nach Belastung tauchen nun in den Logs der Mikrotik Router folgende Einträge auf:
interface, warning: sfp01: bridge port received packet with own address as source address (01:02:03:04:05:06), probably loop
in blau
Zusätzlich scheinen einige Multicast Pakete irgendwo im Nirvana verschunden zu sein. Die einzelnen Strecken werden selbstverständlich im betrachteten Zeitraum nicht verändert. RSTP musste also nicht umrouten!
Hat Jemand ein ähnliches Problem und evtl. eine Lösung?
Vielen Dank!
Folgendes Szenario: ich habe 3 Router CRS112, die im Ring miteinander verbunden sind. (R1->R2->R3->R1)
Die entsprechenden Ports liegen jeweils auf einer Bridge. Dort ist jeweils das RSTP Protokoll aktiviert. So weit so gut, es scheint für Unicast alles ganz gut zu klappen. Nun verursachen die angeschlossenen Geräte aber Multicast Traffic. Je nach Belastung tauchen nun in den Logs der Mikrotik Router folgende Einträge auf:
interface, warning: sfp01: bridge port received packet with own address as source address (01:02:03:04:05:06), probably loop
in blau
Zusätzlich scheinen einige Multicast Pakete irgendwo im Nirvana verschunden zu sein. Die einzelnen Strecken werden selbstverständlich im betrachteten Zeitraum nicht verändert. RSTP musste also nicht umrouten!
Hat Jemand ein ähnliches Problem und evtl. eine Lösung?
Vielen Dank!
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 316627
Url: https://administrator.de/forum/packetloss-bei-multicast-paketen-mehrere-router-mit-rstp-bridges-316627.html
Ausgedruckt am: 25.04.2025 um 04:04 Uhr
14 Kommentare
Neuester Kommentar
die im Ring miteinander verbunden sind.
Dasi st schon tödlich ! Spanning Tree Protokolle sind generell NICHT für Ring Strukturen gemacht und auch geeignet !Wenn man ein solches Design macht, was per se aus Ethernet Perspektive schon falsch ist, oder machen muss, dann sollte man immer Ring optimierte Redundanz Protokolle nutzen wie REP (Cisco), RRPP (Extreme) oder MRP (Brocade) usw.
Solche Redundanz Protokolle sind auf Ring Strukturen optimiert.
Letztlich ist das auch das grundlegende Problem bei dir bzw. das was du siehst es nur ein Folgeproblem was aus diesem Missdesign resultiert.
Da du deine Multicast Implementation nicht näher beschreibst gehen wir mal davon aus das du kein IGMP Snooping aktiviert hast auf den Switches wie es eigentlich sein sollte.
Dadurch wird der Switch bzw. Router gezwungen die Multicast Pakete auf allen Ports zu fluten und das geschieht nicht über die Port Asics sondern in CPU.
Bei schwachbrüstigen Routern oder Switches wie sie in billigen Consumer Produkten üblich sind, triggert das aber jetzt einen Teufelskreis.
Das Gerät hat soviel CPU Last (Peak) das damit auch das Forwarding der RSTP BPDUs flöten geht oder das Erkennen der BPDUs an diesen Ports. Was sich letztlich dann in der Stabilität des STP zeigt.
Damit denkt der Spanning Tree Prozess dann das der Ring irgendwo offen ist und schaltet die redundanten Ports die vorher im Blocking waren in den Forwarding Mode.
Fatal, denn nun bildet sich ein Loop der im schlimmsten Falle das Netzwerk kollabieren lässt. Es kann aber sein das der STP Prozess sich wieder fängt und einen neu Topologie errechnet die dann wieder die Ports blockt. Das toggelt dann je nach Last wild hin und her.
Das geht dann so lange bis zum nächsten Multicast Peak und das Drama geht von vorn los.
Die Ringstruktur macht das doppelt schlimm, denn Konvergenzzeiten beim STP sind hier horrend höher und können bis in den Minutenbereich gehen.
Dein o.a. Verhalten lässt das ganz klar erkennen, denn das Gerät sieht seine eigenen BPDUs was zu Recht einen Loop anzeigt...und das lässt auf gravierende STP Probleme schliessen.
Fazit:
Wenn du Glück hast kommst du aus der Misere raus wenn du IGMP Snooping aktivierst was ein Muss ist in so einem MC Umfeld ! Das könnte das Verhalten stabilisieren.
Wenn das auch nichts nützt musst du ein Ethernet optimiertes Design verwenden und kein Ring Design was im Ethernet Umfeld nichts zu suchen hat ! Letztlich resultiert der Fehler aus dem falschen Topologie Design bzw. schwacher Hardware.
Musst du zwangsweise einen Ring konstruieren, dann helfen dir nur potente Switches die Ring Protokolle supporten !
Hi,
Gruß,
Peter
Zitat von @aqui:
Bei schwachbrüstigen Routern oder Switches wie sie in billigen Consumer Produkten üblich sind
Hier wird aber wohl der hier verwendet: https://www.mikrotik-store.eu/de/mikrotik-crs112-8g-4s-inBei schwachbrüstigen Routern oder Switches wie sie in billigen Consumer Produkten üblich sind
Gruß,
Peter
Du redest aber klar von eine Ringtopologie ! Was denn nun ?? Als lizensierter Funkamateur sollte man doch gelernt haben technische Sachverhalte sauber zu beschreiben...und auch zu lösen.
Vermascht kann ja viel heissen. L2 oder L3 vermascht.
So oder so beisst die Maus keinen Faden ab, wenn du MC machst ohne IGMP Snooping (dazu hast du auch noch rein gar nichts gesagt...?!) und das in Teilringen mit schwacher Hardware wirst du immer mit den o.a. Problemen kämpfen müssen.
Hast du denn wenigstens IGMP Snooping aktiviert ?
Vermascht kann ja viel heissen. L2 oder L3 vermascht.
So oder so beisst die Maus keinen Faden ab, wenn du MC machst ohne IGMP Snooping (dazu hast du auch noch rein gar nichts gesagt...?!) und das in Teilringen mit schwacher Hardware wirst du immer mit den o.a. Problemen kämpfen müssen.
Hast du denn wenigstens IGMP Snooping aktiviert ?
Die Mikrotik Router unterstützen soweit ich weiss kein IGMP Snooping.
Das ist dann natürlich umso tödlicher in dem Umfeld.... Das Verhalten bei dir spricht ja auch dafür das das Gerät das in CPU fluten muss und damit an die Grenze der Leistungsfähigkeit kommt.
Die CPU Last wird vermutlich nur gemittelt angezeigt, deshalb siehst du da keinen realistischen Werte.
So oder so ist es doch aber etwas blauäugig in einem MC Umfeld einen Router zu verwenden der kein IGMP supportet. Da musst du dich dann nicht wundern wen das Netz kollabiert.
Fazit: Falsche Hardware für die Anwendung !
sollen die CRS Geräte das RSTP Protokoll bereits auf der Switch-Ebene unterstützen.
Ahem... NUR Switche supporten sinnvollerweise RSTP. Ein Router bruacht kein RSTP !! Kann das sein das du da was missverstanden hast ?!Bisher habe ich in jeder beteiligten Bridge RSTP aktiviert.
Das musst du auch zwangsläufig in einem redundanten Netz. Sonst hättest du ja sofort einen Loop !Was sind macht ist im RSTP die Edge Ports und die Uplink Ports zu definieren im Setup. Das reduziert auch schon ziemlich den BPDU Traffic.
Für eine moderne CPU wie du sie kennst ist das sicher ein Kinderspiel. Es sind aber keine modernen CPUs drin in solchen Switches, das ist dein Denkfehler. Dort sind billige, schwachbrüstige SoCs verbaut.
Normal reichen die auch, denn das Paket Forwarding machen zu 98% die Port ASICS und der SoC schickt nur einmalig ein paar Konfig Kommandos dahin. Bei Broadcasts und speziell Multicasts ist das aber nicht so.
Da muss die CPU die Pakete n-mal kopieren (soviel wie aktive Ports vorhanden sind) und an diesen Ports aussenden. Ohne aktives IGMP ist der Switch dazu gezwungen um diese Pakete standardkonform zu übertragen.
Tritt so ein Traffic dann bei SoCs nicht burstartig auf sondern mit konstanter Rate (und da reicht soch eine niedrige) gehen diese CPUs sofort in die Knie so wie bei dir oben.
Sie sind dann primär mit dem Forwarding beschäftigt so das der Scheduler wichtige BPDU Frames nicht mehr forwarden kann und die dann dropped oder einfach "vergisst".
Dadurch sagt der Spanning Tree dann mit einmal das kein Loop mehr da ist, und setzt so einen Port in den Forwarding Mode, was dann sofort wieder einen Loop triggert. Dann beginnt der Teufelskreis....
Ein typisches Verhalten bei billigen Consumerswitches unter Broad- und Multicast Last.
Normal reichen die auch, denn das Paket Forwarding machen zu 98% die Port ASICS und der SoC schickt nur einmalig ein paar Konfig Kommandos dahin. Bei Broadcasts und speziell Multicasts ist das aber nicht so.
Da muss die CPU die Pakete n-mal kopieren (soviel wie aktive Ports vorhanden sind) und an diesen Ports aussenden. Ohne aktives IGMP ist der Switch dazu gezwungen um diese Pakete standardkonform zu übertragen.
Tritt so ein Traffic dann bei SoCs nicht burstartig auf sondern mit konstanter Rate (und da reicht soch eine niedrige) gehen diese CPUs sofort in die Knie so wie bei dir oben.
Sie sind dann primär mit dem Forwarding beschäftigt so das der Scheduler wichtige BPDU Frames nicht mehr forwarden kann und die dann dropped oder einfach "vergisst".
Dadurch sagt der Spanning Tree dann mit einmal das kein Loop mehr da ist, und setzt so einen Port in den Forwarding Mode, was dann sofort wieder einen Loop triggert. Dann beginnt der Teufelskreis....
Ein typisches Verhalten bei billigen Consumerswitches unter Broad- und Multicast Last.
Hallo,
Wie @aqui schon andeutete, wenn du die Laborwerte von https://www.ietf.org/rfc/rfc2544.txt oder von http://xenanetworks.com/xena-networks-gigabit-ethernet-test-software/l2 ... mit deinen echten Traffic übereinstimmen kannst werden die Angaben wieder passen. Aber wer fährt tatsächlich ein Laborzyklus im richtigen Leben? Daher mal schauen was sich dekct un dob du das Labornachgestellt bekommst, besonders die Datenpakte mit Inhalt..... Im Labor fährt auch keine Testwagen mit einen kreischenden Beifahrer und nervenden Kindern auf den Rücksitzen bzw. im Gepäckraum
Gruß,
Peter
Wie @aqui schon andeutete, wenn du die Laborwerte von https://www.ietf.org/rfc/rfc2544.txt oder von http://xenanetworks.com/xena-networks-gigabit-ethernet-test-software/l2 ... mit deinen echten Traffic übereinstimmen kannst werden die Angaben wieder passen. Aber wer fährt tatsächlich ein Laborzyklus im richtigen Leben? Daher mal schauen was sich dekct un dob du das Labornachgestellt bekommst, besonders die Datenpakte mit Inhalt..... Im Labor fährt auch keine Testwagen mit einen kreischenden Beifahrer und nervenden Kindern auf den Rücksitzen bzw. im Gepäckraum
Gruß,
Peter