lcer00
Goto Top

Ursache für Auslösung Storm-Control Cisco SG350X

Hallo zusammen,

heute morgen gab es bei uns einen unplanmäßigen Stomausfall, der zum ungraceful-Shutdown der Server sowie der Switche (2 gestackte SG350) führte. Nach Wiederhochfahren des Systems kam es ca 1 Stunde später nacheinander zum Auslösen der Storm-Control an den Ports von 4 Desktop-PCs (Windows 10). Hat jemand eine Idee, was die Ursache sein könnte? eine Schleife am Switch, die ja als häufigste Ursache genannt wird, kann es wohl nicht sein. Und das nacheinander 4 Netzwerkkarten Defekt sind ist ja auch unwahrscheinlich (4x Onboard Realtek).

Leuchtet bei einem von Euch die Glaskugel? Ich habe gerade keine Idee, wo ich suchen soll.

Grüße

lcer

Content-Key: 1578543999

Url: https://administrator.de/contentid/1578543999

Printed on: April 24, 2024 at 10:04 o'clock

Member: bandit1976
bandit1976 Dec 02, 2021 at 08:44:30 (UTC)
Goto Top
Sicher das die User nicht was an den Netzwerkkabeln gemacht haben!
Hatte das auch mal - Stromausfall nur im Serverraum und die user haben dann in den Büros selbst mal alle kabel neu gesteckt wg. Fehlersuche - aber leider auch ne Schleife eingebaut.
Member: aqui
aqui Dec 02, 2021 at 08:53:45 (UTC)
Goto Top
Waren das Ports an denen Endgeräte mit einem LACP LAG verbunden waren ? Möglich das dann dort mal ein kurzzeitiger Loop aufgetreten ist beim Reboot solcher Maschinen.
Möglich auch das das Ports mit kaskadierten Desktop Switches u.ä. waren und dort ein Loop ausgelöst wurde.
Eine Analyse ist mit den sehr spärlichen Daten sehr schwer da man weder Eimnzelheiten deiner Topologie kennt noch die Triggerpunkte deiner Stormcontrol und daraus resultierende Log oder Syslog Messages. Unter solchen Rahmenbedingungen bleibt dann auch uns häufig nur die Kristallkugel. face-sad
Member: Looser27
Looser27 Dec 02, 2021 at 08:58:06 (UTC)
Goto Top
heute morgen gab es bei uns einen unplanmäßigen Stomausfall, der zum ungraceful-Shutdown der Server sowie der Switche

Hat die USV (die hoffentlich da dran ist) ebenfalls versagt????

Ansonsten würde ich die Switche mal kontrolliert in der entsprechenden Reihenfolge neu starten (sofern das im lfd. Betrieb möglich ist).

Gruß

Looser
Member: lcer00
lcer00 Dec 02, 2021 at 09:19:04 (UTC)
Goto Top
Hallo,

Die Topologie ist eigentlich ganz einfach. 2 Switche als Stack. Daran ein Mikrotik-Switch, zu dem 2 VLANs durchgereicht werden. LACP/LAG läuft für zwei Hyper-V Hosts. Keine Desktop-Switche.

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben, nachdem der Strom gerade wieder da war. OK Unterdimensioniert. Wobei die Switche keine Shutdownfunktion haben und immer "hart" ausgehen.

Die Einstellungen sind: Rate Threshold 100000 kbits/sec für Unknown Unicast, Multicast, Broadcast. Auslöser waren der Statistik zufolge Unknown Unicast Storm Control.
Unknown Unicast Storm Control
Bytes Passed:	13617557
Bytes Dropped:	3264131
Last Drop Time:	2021-Dec-02 08:57:19

Unknown Unicasts - wären das dann eventuell Verbindungsversuche zu Geräten, der MAC noch in der ARP-Tabelle auf dem Client liegen, aber wegen des Switch - Neustarts dort (noch) unbekannt waren? Ich hatte nicht alle Geräte sofort neu gestartet.

Grüße

lcer

Grüße

lcer
Member: Looser27
Looser27 Dec 02, 2021 at 09:24:06 (UTC)
Goto Top
Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben

und die haben jetzt noch alle Finger?????
Member: lcer00
lcer00 Dec 02, 2021 at 09:42:45 (UTC)
Goto Top
Zitat von @Looser27:

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben

und die haben jetzt noch alle Finger?????
bei der aktuellen Arbeitsmarktsituation: ja!

Grüße

lcer
Member: aqui
aqui Dec 02, 2021 at 10:36:33 (UTC)
Goto Top
Daran ein Mikrotik-Switch, zu dem 2 VLANs durchgereicht werden. LACP/LAG läuft für zwei Hyper-V Hosts. Keine Desktop-Switche.
MT nur einbeinig oder auch redundant mit LACP LAG und mit je einem Bein auf einen der Stack Member ?
Waren diese Ports davon betroffen ?
Warum hängen die Switches nicht mit an der USV ? Wäre doch sinnig ?!
Member: lcer00
lcer00 Dec 02, 2021 at 10:49:58 (UTC)
Goto Top
Zitat von @aqui:

Daran ein Mikrotik-Switch, zu dem 2 VLANs durchgereicht werden. LACP/LAG läuft für zwei Hyper-V Hosts. Keine Desktop-Switche.
MT nur einbeinig oder auch redundant mit LACP LAG und mit je einem Bein auf einen der Stack Member ?
einbeinig an nur einem Switch, nicht-redundant, kein LACP
Waren diese Ports davon betroffen ?
nein. auch keine am Miktorik-Switch
Warum hängen die Switches nicht mit an der USV ? Wäre doch sinnig ?!
Tun sie doch. Doch die SG350Xer haben keine Power-OFF/Shutdown-Funktion. Die gehen dann mit der USV direkt aus.

Grüße

lcer
Member: aqui
aqui Dec 02, 2021 at 11:04:42 (UTC)
Goto Top
Weisst du denn WAS für Endgeräte an den betroffenen Ports hängen ?
Member: lcer00
lcer00 Dec 02, 2021 at 11:49:45 (UTC)
Goto Top
Hallo,

Siehe oben. Einfache Windows 10 PCs ohne Extras ( kein Virtueller Switch, kein Linux subsystem etc). Es sind auch alle Kabel überprüft: Kein Desktopswitch, kein IP-Telefon.

Grüße

lcer
Member: aqui
aqui Dec 02, 2021 at 12:44:29 (UTC)
Goto Top
Da wirds dann schwer ohne Traces oder detailiertes Logging. Wenns nur ein einmaliges Ereignis war kannst du das wohl beruhigt ignorieren und auf einen Folgefehler des Shutdowns schieben.
Nur nebenbei:
Spanning Tree im Single Span Verfahren mit RSTP und mit Root Priority (z.B. 8192) auf den Cisco Stack hast du auf beiden Switches aktiviert ?! (Loop Prevention)
Member: lcer00
lcer00 Dec 02, 2021 at 12:56:12 (UTC)
Goto Top
Hallo,
Zitat von @aqui:

Da wirds dann schwer ohne Traces oder detailiertes Logging. Wenns nur ein einmaliges Ereignis war kannst du das wohl beruhigt ignorieren und auf einen Folgefehler des Shutdowns schieben.
Ist bis jetzt nicht wieder aufgetreten. Ich sitz es mal aus. Trace-Logs gibt es natürlich nicht.
Spanning Tree im Single Span Verfahren mit RSTP und mit Root Priority (z.B. 8192) auf den Cisco Stack hast du auf beiden Switches aktiviert ?! (Loop Prevention)
Wenn Du mit beide den Stack und den Mikrotik Switch meinst - natürlich, alles wie empfohlen, der Cisco-Stack hat die niedridigste Prioität.

Grüße

lcer
Member: Ex0r2k16
Ex0r2k16 Dec 02, 2021 at 13:45:56 (UTC)
Goto Top
Zitat von @lcer00:

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben, nachdem der Strom gerade wieder da war. OK Unterdimensioniert. Wobei die Switche keine Shutdownfunktion haben und immer "hart" ausgehen.

Kurze Nachfrage aus neugier dazu: Wieso versagt die USV wenn ein FI fliegt? Genau das muss Sie doch abfangen?
Member: lcer00
lcer00 Dec 02, 2021 at 14:57:59 (UTC)
Goto Top
Zitat von @Ex0r2k16:

Zitat von @lcer00:

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben, nachdem der Strom gerade wieder da war. OK Unterdimensioniert. Wobei die Switche keine Shutdownfunktion haben und immer "hart" ausgehen.

Kurze Nachfrage aus neugier dazu: Wieso versagt die USV wenn ein FI fliegt? Genau das muss Sie doch abfangen?

In etwa so (meine wahrscheinlichste Rekonstruktion der Vorgänge):
  • Lichtschalter drücken
  • Sicherung fliegt raus
  • Mitarbeiter geht zum Sicherungskasten, mach Sicherung rein und FI vom Serverschrank (separater Stromkreis) raus * warum auch immer
  • alles piept
  • Panik
  • nach einigen Minuten hört das Piepen auf weil alle Geräte aus sind (USV am Limit / Akku alle)

Grüße

lcer
Member: aqui
aqui Dec 02, 2021 at 19:57:57 (UTC)
Goto Top
der Cisco-Stack hat die niedridigste Prioität.
Du meinst sicher die höchste oder ?? Bei der STP Priorität bedeutet ein kleinerer Wert modulo 4096 eine größere Priorität. Default ist 32678.
Member: lcer00
lcer00 Dec 02, 2021 at 20:03:38 (UTC)
Goto Top
Zitat von @aqui:

der Cisco-Stack hat die niedridigste Prioität.
Du meinst sicher die höchste oder ?? Bei der STP Priorität bedeutet ein kleinerer Wert modulo 4096 eine größere Priorität. Default ist 32678.

4096

Grüße

lcer
Member: aqui
aqui Dec 02, 2021 at 20:20:19 (UTC)
Goto Top
👍
Member: aqui
aqui Dec 15, 2021 at 13:28:53 (UTC)
Goto Top
Wenns das denn nun war bitte dann auch den Thread als erledigt schliessen !
How can I mark a post as solved?
Member: lcer00
lcer00 Dec 15, 2021 at 13:57:26 (UTC)
Goto Top
Zitat von @aqui:

Wenns das denn nun war bitte dann auch den Thread als erledigt schliessen !
How can I mark a post as solved?

OK, ich leiste Deinem Wunsch folge. Allerdings weiß ich immer noch nicht was genau passiert ist face-smile

Grüße

lcer