Ursache für Auslösung Storm-Control Cisco SG350X

Hallo zusammen,

heute morgen gab es bei uns einen unplanmäßigen Stomausfall, der zum ungraceful-Shutdown der Server sowie der Switche (2 gestackte SG350) führte. Nach Wiederhochfahren des Systems kam es ca 1 Stunde später nacheinander zum Auslösen der Storm-Control an den Ports von 4 Desktop-PCs (Windows 10). Hat jemand eine Idee, was die Ursache sein könnte? eine Schleife am Switch, die ja als häufigste Ursache genannt wird, kann es wohl nicht sein. Und das nacheinander 4 Netzwerkkarten Defekt sind ist ja auch unwahrscheinlich (4x Onboard Realtek).

Leuchtet bei einem von Euch die Glaskugel? Ich habe gerade keine Idee, wo ich suchen soll.

Grüße

lcer

Content-Key: 1578543999

Url: https://administrator.de/contentid/1578543999

Ausgedruckt am: 28.01.2022 um 09:01 Uhr

Mitglied: bandit1976
bandit1976 02.12.2021 um 09:44:30 Uhr
Goto Top
Sicher das die User nicht was an den Netzwerkkabeln gemacht haben!
Hatte das auch mal - Stromausfall nur im Serverraum und die user haben dann in den Büros selbst mal alle kabel neu gesteckt wg. Fehlersuche - aber leider auch ne Schleife eingebaut.
Mitglied: aqui
aqui 02.12.2021 um 09:53:45 Uhr
Goto Top
Waren das Ports an denen Endgeräte mit einem LACP LAG verbunden waren ? Möglich das dann dort mal ein kurzzeitiger Loop aufgetreten ist beim Reboot solcher Maschinen.
Möglich auch das das Ports mit kaskadierten Desktop Switches u.ä. waren und dort ein Loop ausgelöst wurde.
Eine Analyse ist mit den sehr spärlichen Daten sehr schwer da man weder Eimnzelheiten deiner Topologie kennt noch die Triggerpunkte deiner Stormcontrol und daraus resultierende Log oder Syslog Messages. Unter solchen Rahmenbedingungen bleibt dann auch uns häufig nur die Kristallkugel. :-( face-sad
Mitglied: Looser27
Looser27 02.12.2021 um 09:58:06 Uhr
Goto Top
heute morgen gab es bei uns einen unplanmäßigen Stomausfall, der zum ungraceful-Shutdown der Server sowie der Switche

Hat die USV (die hoffentlich da dran ist) ebenfalls versagt????

Ansonsten würde ich die Switche mal kontrolliert in der entsprechenden Reihenfolge neu starten (sofern das im lfd. Betrieb möglich ist).

Gruß

Looser
Mitglied: lcer00
lcer00 02.12.2021 um 10:19:04 Uhr
Goto Top
Hallo,

Die Topologie ist eigentlich ganz einfach. 2 Switche als Stack. Daran ein Mikrotik-Switch, zu dem 2 VLANs durchgereicht werden. LACP/LAG läuft für zwei Hyper-V Hosts. Keine Desktop-Switche.

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben, nachdem der Strom gerade wieder da war. OK Unterdimensioniert. Wobei die Switche keine Shutdownfunktion haben und immer "hart" ausgehen.

Die Einstellungen sind: Rate Threshold 100000 kbits/sec für Unknown Unicast, Multicast, Broadcast. Auslöser waren der Statistik zufolge Unknown Unicast Storm Control.

Unknown Unicasts - wären das dann eventuell Verbindungsversuche zu Geräten, der MAC noch in der ARP-Tabelle auf dem Client liegen, aber wegen des Switch - Neustarts dort (noch) unbekannt waren? Ich hatte nicht alle Geräte sofort neu gestartet.

Grüße

lcer

Grüße

lcer
Mitglied: Looser27
Looser27 02.12.2021 um 10:24:06 Uhr
Goto Top
Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben

und die haben jetzt noch alle Finger?????
Mitglied: lcer00
lcer00 02.12.2021 um 10:42:45 Uhr
Goto Top
Zitat von @Looser27:

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben

und die haben jetzt noch alle Finger?????
bei der aktuellen Arbeitsmarktsituation: ja!

Grüße

lcer
Mitglied: aqui
aqui 02.12.2021 um 11:36:33 Uhr
Goto Top
Daran ein Mikrotik-Switch, zu dem 2 VLANs durchgereicht werden. LACP/LAG läuft für zwei Hyper-V Hosts. Keine Desktop-Switche.
MT nur einbeinig oder auch redundant mit LACP LAG und mit je einem Bein auf einen der Stack Member ?
Waren diese Ports davon betroffen ?
Warum hängen die Switches nicht mit an der USV ? Wäre doch sinnig ?!
Mitglied: lcer00
lcer00 02.12.2021 um 11:49:58 Uhr
Goto Top
Zitat von @aqui:

Daran ein Mikrotik-Switch, zu dem 2 VLANs durchgereicht werden. LACP/LAG läuft für zwei Hyper-V Hosts. Keine Desktop-Switche.
MT nur einbeinig oder auch redundant mit LACP LAG und mit je einem Bein auf einen der Stack Member ?
einbeinig an nur einem Switch, nicht-redundant, kein LACP
Waren diese Ports davon betroffen ?
nein. auch keine am Miktorik-Switch
Warum hängen die Switches nicht mit an der USV ? Wäre doch sinnig ?!
Tun sie doch. Doch die SG350Xer haben keine Power-OFF/Shutdown-Funktion. Die gehen dann mit der USV direkt aus.

Grüße

lcer
Mitglied: aqui
aqui 02.12.2021 um 12:04:42 Uhr
Goto Top
Weisst du denn WAS für Endgeräte an den betroffenen Ports hängen ?
Mitglied: lcer00
lcer00 02.12.2021 um 12:49:45 Uhr
Goto Top
Hallo,

Siehe oben. Einfache Windows 10 PCs ohne Extras ( kein Virtueller Switch, kein Linux subsystem etc). Es sind auch alle Kabel überprüft: Kein Desktopswitch, kein IP-Telefon.

Grüße

lcer
Mitglied: aqui
aqui 02.12.2021 um 13:44:29 Uhr
Goto Top
Da wirds dann schwer ohne Traces oder detailiertes Logging. Wenns nur ein einmaliges Ereignis war kannst du das wohl beruhigt ignorieren und auf einen Folgefehler des Shutdowns schieben.
Nur nebenbei:
Spanning Tree im Single Span Verfahren mit RSTP und mit Root Priority (z.B. 8192) auf den Cisco Stack hast du auf beiden Switches aktiviert ?! (Loop Prevention)
Mitglied: lcer00
lcer00 02.12.2021 um 13:56:12 Uhr
Goto Top
Hallo,
Zitat von @aqui:

Da wirds dann schwer ohne Traces oder detailiertes Logging. Wenns nur ein einmaliges Ereignis war kannst du das wohl beruhigt ignorieren und auf einen Folgefehler des Shutdowns schieben.
Ist bis jetzt nicht wieder aufgetreten. Ich sitz es mal aus. Trace-Logs gibt es natürlich nicht.
Spanning Tree im Single Span Verfahren mit RSTP und mit Root Priority (z.B. 8192) auf den Cisco Stack hast du auf beiden Switches aktiviert ?! (Loop Prevention)
Wenn Du mit beide den Stack und den Mikrotik Switch meinst - natürlich, alles wie empfohlen, der Cisco-Stack hat die niedridigste Prioität.

Grüße

lcer
Mitglied: Ex0r2k16
Ex0r2k16 02.12.2021 um 14:45:56 Uhr
Goto Top
Zitat von @lcer00:

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben, nachdem der Strom gerade wieder da war. OK Unterdimensioniert. Wobei die Switche keine Shutdownfunktion haben und immer "hart" ausgehen.

Kurze Nachfrage aus neugier dazu: Wieso versagt die USV wenn ein FI fliegt? Genau das muss Sie doch abfangen?
Mitglied: lcer00
lcer00 02.12.2021 um 15:57:59 Uhr
Goto Top
Zitat von @Ex0r2k16:

Zitat von @lcer00:

Die USV hat übrigens versagt, nachdem die Mitarbeiter zum beheben des Piepens im Serverschrank den FI-Schutzschalter ausgeschaltet haben, nachdem der Strom gerade wieder da war. OK Unterdimensioniert. Wobei die Switche keine Shutdownfunktion haben und immer "hart" ausgehen.

Kurze Nachfrage aus neugier dazu: Wieso versagt die USV wenn ein FI fliegt? Genau das muss Sie doch abfangen?

In etwa so (meine wahrscheinlichste Rekonstruktion der Vorgänge):
  • Lichtschalter drücken
  • Sicherung fliegt raus
  • Mitarbeiter geht zum Sicherungskasten, mach Sicherung rein und FI vom Serverschrank (separater Stromkreis) raus * warum auch immer
  • alles piept
  • Panik
  • nach einigen Minuten hört das Piepen auf weil alle Geräte aus sind (USV am Limit / Akku alle)

Grüße

lcer
Mitglied: aqui
aqui 02.12.2021 um 20:57:57 Uhr
Goto Top
der Cisco-Stack hat die niedridigste Prioität.
Du meinst sicher die höchste oder ?? Bei der STP Priorität bedeutet ein kleinerer Wert modulo 4096 eine größere Priorität. Default ist 32678.
Mitglied: lcer00
lcer00 02.12.2021 um 21:03:38 Uhr
Goto Top
Zitat von @aqui:

der Cisco-Stack hat die niedridigste Prioität.
Du meinst sicher die höchste oder ?? Bei der STP Priorität bedeutet ein kleinerer Wert modulo 4096 eine größere Priorität. Default ist 32678.

4096

Grüße

lcer
Mitglied: aqui
aqui 02.12.2021 um 21:20:19 Uhr
Goto Top
👍
Mitglied: aqui
aqui 15.12.2021 um 14:28:53 Uhr
Goto Top
Wenns das denn nun war bitte dann auch den Thread als erledigt schliessen !
https://administrator.de/faq/32
Mitglied: lcer00
lcer00 15.12.2021 um 14:57:26 Uhr
Goto Top
Zitat von @aqui:

Wenns das denn nun war bitte dann auch den Thread als erledigt schliessen !
https://administrator.de/faq/32

OK, ich leiste Deinem Wunsch folge. Allerdings weiß ich immer noch nicht was genau passiert ist :) face-smile

Grüße

lcer
Heiß diskutierte Beiträge
general
Generator für endlose, kostenlose Energie? Ein gut gemachter Schwindel? gelöst beidermachtvongreyscullVor 1 TagAllgemeinOff Topic35 Kommentare

Mahlzeit Kollegen! Wenn ich mich strikt an physikalische Grundsätze halte, müsste ich sagen: Nein. Es ist nicht möglich. Ich stieß aber im Internet auf ein ...

general
FYI: In zwei Tagen zieht LetsEncrypt zahlreiche Zertifikate zurückipzipzapVor 1 TagAllgemeinVerschlüsselung & Zertifikate1 Kommentar

Hallo, zur Info, falls bei Euch übermorgen was knallt: Ruhiges Wochenende! ipzipzap ...

question
"minimale" Cloud-Telefonanlage gesuchtDatenreiseVor 1 TagFrageVoice over IP13 Kommentare

Hallo zusammen, ich bin auf der Suche nach einer Cloud-Telefonanlage, die sich für einen einzelnen Arbeitsplatz eignet und wollte hier fragen, ob jemand dazu einen ...

question
Abschätzung Nutzungsdauer von neuer Serverhardware gelöst lcer00Vor 21 StundenFrageHardware9 Kommentare

Hallo zusammen, bei uns stehen 2022 Neuanschaffungen an. Dabei geht es um einen Backupserver (das Cloud-Konzept überzeugt mich immer noch nicht vollständig ) und demnächst ...

tutorial
IKEv2 VPN Server für Windows und Apple Clients mit Raspberry PiaquiVor 1 TagAnleitungLAN, WAN, Wireless1 Kommentar

Einleitung Das folgende Tutorial erhebt keinen Anspruch auf Vollständigkeit und ist ein einfaches Framework was die Funktion eines IPsec VPN Servers im groben Rahmen aufzeigt. ...

question
Vorkehrungen für einen StromausfallahussainVor 22 StundenFrageNetzwerke10 Kommentare

Hallo, wir betreiben ein Netzwerk mit 8 Clients, Router, Switches, IP-Telefonen, NAS und einem kleinen Anwendungsserver. Unsere einzige Vorkehrung gegen einen Stromausfall/Blackout ist aktuell eine ...

question
PfSense: nach 27-stündigem Ausfall der Deutschen Telekom streiken IPSec + OpenVPN gelöst vafk18Vor 1 TagFrageNetzwerke9 Kommentare

Einen Gruß aus der Eifel, nachdem wir wieder mal von einer großflächigen Störung der Telekom-Anschlüsse (Ausfall eines DSLAM mit mehreren Tausend Teilnehmern) heimgesucht wurden, deren ...

question
Backup Software für PostgreSQLDaniVor 1 TagFrageDatenbanken11 Kommentare

Moin, für eine Anwendung kommt PostgreSQL 13.5 zum Einsatz. Leider nicht unter Linux, sondern läuft unter Windows Server 2019. Nun gibt es für jeden Kollegen ...