Cisco SG500 Stack - lange Ping Zeiten
Hallo,
zur Hardware:
zwei Cisco SG500-28 im Stack als L3-Switch, daran einige SG300 als L2-Switches und daran die NW-Geräte in versch. VLANs. Das Routing ins Internet übernehmen zwei Mikrotik RB2011 mit VRRP verbunden mit dem L3-Switch.
Heute hatten wir folgendes Problem:
Am Morgen hatten wir einige Stromausfälle, die einzelne L2-Switches, andere NW-Geräte und Access-Points betroffen haben. Der L3-Switch und die Router sind notstromversorgt und fielen nicht aus.
Auf einmal wurden jedoch die Ping-Latenzzeiten extrem schlecht. Geräte waren zwar erreichbar jedoch mit Latenzzeiten im Bereich 200-500ms. Dieses Verhalten trat sowohl bei einem Ping vom L3-Switch aus als auch von einzelnen NW-Geräten aus auf. Die Latenzzeiten vom Router in das Internet waren normal (ca. 10ms). Latenzzeit vom Router auf ein Gerät im Netzwerk (200-500ms).
Daraufhin wurden die Router einzelnen neugestartet. Brachte jedoch nichts.
Dann wurde der L3-Switch neugestartet und die Latenzzeit ist wieder in Ordnung und alles funktioniert ordnungsgemäß.
Jetzt meine Frage: Wie könnte man es geschickt angehen, dass man den Ursprung eines solchen Fehlers findet? Wo sollte man da am besten zu suchen beginnen?
Vielen Dank,
taschaue
zur Hardware:
zwei Cisco SG500-28 im Stack als L3-Switch, daran einige SG300 als L2-Switches und daran die NW-Geräte in versch. VLANs. Das Routing ins Internet übernehmen zwei Mikrotik RB2011 mit VRRP verbunden mit dem L3-Switch.
Heute hatten wir folgendes Problem:
Am Morgen hatten wir einige Stromausfälle, die einzelne L2-Switches, andere NW-Geräte und Access-Points betroffen haben. Der L3-Switch und die Router sind notstromversorgt und fielen nicht aus.
Auf einmal wurden jedoch die Ping-Latenzzeiten extrem schlecht. Geräte waren zwar erreichbar jedoch mit Latenzzeiten im Bereich 200-500ms. Dieses Verhalten trat sowohl bei einem Ping vom L3-Switch aus als auch von einzelnen NW-Geräten aus auf. Die Latenzzeiten vom Router in das Internet waren normal (ca. 10ms). Latenzzeit vom Router auf ein Gerät im Netzwerk (200-500ms).
Daraufhin wurden die Router einzelnen neugestartet. Brachte jedoch nichts.
Dann wurde der L3-Switch neugestartet und die Latenzzeit ist wieder in Ordnung und alles funktioniert ordnungsgemäß.
Jetzt meine Frage: Wie könnte man es geschickt angehen, dass man den Ursprung eines solchen Fehlers findet? Wo sollte man da am besten zu suchen beginnen?
Vielen Dank,
taschaue
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 295755
Url: https://administrator.de/contentid/295755
Ausgedruckt am: 05.11.2024 um 06:11 Uhr
4 Kommentare
Neuester Kommentar
Hi,
Ich würde auch aufs Routing tippen.
Beispielfall: Durch den Stromausfall hat eins der Geräte oder mehrere eine "Notfall Route" eingetragen und dies aber nach dem ernueten stehen des Netzwerks nicht neu aufgenommen.
Evtl. steht dir ein Log der L3 Switche zur Verfügung wo das Routing oder die Pakete drin stehen?
Evtl. QoS aktiviert, das einzelne Pakete schnell geliefert wurden weil gerade nach dem Neustart des Netzwerks viel Last da war?
Ich würde auch aufs Routing tippen.
Beispielfall: Durch den Stromausfall hat eins der Geräte oder mehrere eine "Notfall Route" eingetragen und dies aber nach dem ernueten stehen des Netzwerks nicht neu aufgenommen.
Evtl. steht dir ein Log der L3 Switche zur Verfügung wo das Routing oder die Pakete drin stehen?
Evtl. QoS aktiviert, das einzelne Pakete schnell geliefert wurden weil gerade nach dem Neustart des Netzwerks viel Last da war?