joedevlin
Goto Top

Konzept Aruba Core-Stack

Guten Morgen,

wir haben zurzeit ein Layer 3 Core-Stack mit vier Aruba 3810M-Switchen, auf dem Stack läuft die aktuellste Firmware. Wir haben kürzlich einen softwareseitigen Ausfall gehabt, wodurch der gesamte Stack nicht mehr funktionsfähig war und wir massive Beeinträchtigungen im gesamten Unternehmen hatten.

Ich habe nun mehrfach gelesen, das im Core-Bereich genau aus diesen Gründen oft von einem Stacking abgesehen wird und dies nur bei den Access-Switchen gemacht wird. Ich benötige daher Gedankenanstöße, wie man das in unserer Konstellation wohl umsetzen kann.

An den vier Core-Switchen sind folgende Komponente angeschlossen:

- Mehrere Access-Switche über 10G-LWL (nicht redundant)
- 2 Providerrouter (Haupt- und Backupleitung über HSRP)
- 3 ESXi-Server über 10G-LWL (jeweils redundant)

Die Core-Switche übernehmen das vollständige L3-Routing und es werden ACLs verwendet.

Über Ideen bin ich dankbar, ein Austausch der Switche kommt aktuell nicht in Frage.

Content-Key: 51268492686

Url: https://administrator.de/contentid/51268492686

Printed on: May 28, 2024 at 08:05 o'clock

Member: Spirit-of-Eli
Spirit-of-Eli Dec 24, 2023 at 23:29:53 (UTC)
Goto Top
Member: JoeDevlin
JoeDevlin Dec 25, 2023 at 02:00:31 (UTC)
Goto Top
Hm, aber VSF ist doch das gleiche wie physikalisches Stacking, nur mit anderer Konfiguration, oder sehe ich da etwas falsch?
Member: Spirit-of-Eli
Spirit-of-Eli Dec 25, 2023 at 08:32:55 (UTC)
Goto Top
Ne, die Switche agieren eigenständig.
Features wie LACP lassen sich aber über den virtual LinkTrunk auf mehrere Switche aufteilen. Du kannst auch einzelne Geräte durchstarten ohne die anderen zu beeinträchtigen.

Das ist in aller kürze. Es ist Weihnachten.
So wird derzeit jedenfalls ein Core gebaut.
Bei Stack, wie von dir beschrieben, mus ja z.b. bei einem Update alles durchgefahren werden.
Member: fre4ki
fre4ki Dec 25, 2023 updated at 11:23:08 (UTC)
Goto Top
Ein Hoch Verfügbares Stacking ist bei Aruba ein VSX. Gibt es in den Modellen 6400 und 83xx (CX Betriebssystem). Verwendet man für den Core Bereich.

Eigentlich sind die 3810M sehr robust und es gibt kaum Probleme.

Hast du in den Logs mal geschaut ob etwas zu sehen ist, was auf den Fehler hindeutet?

Du kannst natürlich auch ein Spine-Leaf aufbauen und auf das Stacking verzichten. Das macht das Netzwerk aber unnötig komplex, man sollte dann auf dynamische Routing Protokolle wie OSPF oder BGP setzen. Das macht Migrationen zwischen den Datacentern aber unnötig kompliziert.

Wie viele Clients befinden sich denn im gesamten Netzwerk?
Member: fre4ki
fre4ki Dec 25, 2023 updated at 11:25:49 (UTC)
Goto Top
Ein Hoch Verfügbares Stacking ist bei Aruba ein VSX. Gibt es in den Modellen 6400 und 83xx (CX Betriebssystem). Verwendet man für den Core Bereich.

Eigentlich sind die 3810M sehr robust und es gibt kaum Probleme.

Hast du in den Logs mal geschaut ob etwas zu sehen ist, was auf den Fehler hindeutet?

Du kannst natürlich auch ein Spine-Leaf aufbauen und auf das Stacking verzichten. Das macht das Netzwerk aber unnötig komplex, man sollte dann auf dynamische Routing Protokolle wie OSPF oder BGP setzen. Das macht Migrationen zwischen den Datacentern aber unnötig kompliziert.

Wie viele Clients befinden sich denn im gesamten Netzwerk?


Zitat von @Spirit-of-Eli:

Ne, die Switche agieren eigenständig.
Features wie LACP lassen sich aber über den virtual LinkTrunk auf mehrere Switche aufteilen. Du kannst auch einzelne Geräte durchstarten ohne die anderen zu beeinträchtigen.

Das ist in aller kürze. Es ist Weihnachten.
So wird derzeit jedenfalls ein Core gebaut.
Bei Stack, wie von dir beschrieben, mus ja z.b. bei einem Update alles durchgefahren werden.

Nein, siehst du schon richtig. Hardware Stacks müssen bei Software Updates in einem Stück (alle Member gleichzeitig) durchgebootet werden.
Member: Spirit-of-Eli
Spirit-of-Eli Dec 25, 2023 updated at 11:31:20 (UTC)
Goto Top
Member: fre4ki
fre4ki Dec 25, 2023 at 11:28:49 (UTC)
Goto Top
Wenn ein Austausch der Switches nicht in Frage kommt würde ich einen Case aufmachen wenn das nochmal vorkommt. Oft können es Broadcast Storms sein was das ganze Netzwerk zum erliegen bringt. Ohne die Config kennen ist es schwer einen Tipp zu geben.

Deshalb: schau ins Log, dafür ist es da.
Member: JoeDevlin
JoeDevlin Dec 25, 2023 at 14:03:09 (UTC)
Goto Top
Vielen Dank für eure Rückmeldungen! Das Thema VSF hat sich geklärt, wir haben auch ein paar VSF-Stacks und das Verhalten ist wie bei physikalischen Stacks.

Bezüglich der Logs: Leider hat ein etwas unerfahrener Mitarbeiter den Core in der Not stromlos gemacht, dadurch wurden die Logs gelöscht. Da der Stack komplett ausgefallen war, wurde der Logeintrag zum Fehler auch nicht zum Syslogserver übertragen.

Ich habe einen Case aufgemacht, die aktuellen Logs zeigen keine Fehler und mehr kann nicht analysiert werden.

Es ist leider etwas deprimierend, dass man das jetzt so hinnehmen muss, aber dass die Logs fehlen ist natürlich unsere Schuld.
Member: fre4ki
fre4ki Dec 25, 2023 at 14:40:08 (UTC)
Goto Top
Zitat von @JoeDevlin:

Vielen Dank für eure Rückmeldungen! Das Thema VSF hat sich geklärt, wir haben auch ein paar VSF-Stacks und das Verhalten ist wie bei physikalischen Stacks.

Bezüglich der Logs: Leider hat ein etwas unerfahrener Mitarbeiter den Core in der Not stromlos gemacht, dadurch wurden die Logs gelöscht. Da der Stack komplett ausgefallen war, wurde der Logeintrag zum Fehler auch nicht zum Syslogserver übertragen.

Ich habe einen Case aufgemacht, die aktuellen Logs zeigen keine Fehler und mehr kann nicht analysiert werden.

Es ist leider etwas deprimierend, dass man das jetzt so hinnehmen muss, aber dass die Logs fehlen ist natürlich unsere Schuld.

Warum sollte der Logeintrag nicht zum Syslog Server geschickt worden sein? Normalerweise passiert das sofort bei Ereignis.

Geht die "show log" Ausgabe denn über den reboot hinaus?
Member: JoeDevlin
JoeDevlin Dec 25, 2023 at 15:04:19 (UTC)
Goto Top
Zitat von @fre4ki:
Warum sollte der Logeintrag nicht zum Syslog Server geschickt worden sein? Normalerweise passiert das sofort bei Ereignis.

Ich vermute, dass Logeintrag und Ausfall zeitgleich eingetreten sind und deshalb das Ereignis nicht mehr zum Syslog-Server gesendet wurde. Die Einträge dort gehen bis vor dem Crash.

Geht die "show log" Ausgabe denn über den reboot hinaus?

Nein, die Logs sind weg und das hat auch Aruba bestätigt. Der Reboot hätte über die Reset-Taste erfolgen müssen.