Handling Firewall am Hauptstandort
Moinsen.
Im Moment bin ich etwas mit dem Thema Disaster Recovery beschäftigt und in diesem Zusammenhang tauchen dann auch einige Fragen auf, die nicht damit direkt zu tun haben aber für Business Continuity eine wichtige Rolle spielen.
Wir haben einen Hauptstandort von wo aus einige Webdienste und die IP-Telefonie bereitgestellt wird. An diesen Standort sind aktuell drei weitere Standorte über ISP-Standortvernetzung sowie über "EDGE" (hier Sophos SD-RED) Geräte angebunden.
Nun schwirrt bei mir im Kopf die Frage, was passiert bzw. wie vorgehen, wenn die XGS Firewall am Hauptsitz defekt ist. Aktuell wäre eine Neubeschaffung nach 2-3 Werktagen bei uns, aber 2-3 Tage ohne Erreichbarkeit ist schon nicht ohne. Ein Tausch gegen "Irgendwas" ist auch nicht möglich, da die SD-RED nur mit der Sophos XGS "reden" möchten. Vom VPN ganz zu schweigen.
Die Alternative wäre also eine weitere XGS der gleichen Baureihe und diese im "HA Active Passive" laufen lassen.
Wie ist das bei Euch so umgesetzt bzw. was sind Eure Erfahrungen? Was würde passieren, wenn die aktive Firewall "sich verschluckt" (ist schon bei uns passiert und musste händisch neu gestartet werden)? Springt die passive dann ein?
Im Moment bin ich etwas mit dem Thema Disaster Recovery beschäftigt und in diesem Zusammenhang tauchen dann auch einige Fragen auf, die nicht damit direkt zu tun haben aber für Business Continuity eine wichtige Rolle spielen.
Wir haben einen Hauptstandort von wo aus einige Webdienste und die IP-Telefonie bereitgestellt wird. An diesen Standort sind aktuell drei weitere Standorte über ISP-Standortvernetzung sowie über "EDGE" (hier Sophos SD-RED) Geräte angebunden.
Nun schwirrt bei mir im Kopf die Frage, was passiert bzw. wie vorgehen, wenn die XGS Firewall am Hauptsitz defekt ist. Aktuell wäre eine Neubeschaffung nach 2-3 Werktagen bei uns, aber 2-3 Tage ohne Erreichbarkeit ist schon nicht ohne. Ein Tausch gegen "Irgendwas" ist auch nicht möglich, da die SD-RED nur mit der Sophos XGS "reden" möchten. Vom VPN ganz zu schweigen.
Die Alternative wäre also eine weitere XGS der gleichen Baureihe und diese im "HA Active Passive" laufen lassen.
Wie ist das bei Euch so umgesetzt bzw. was sind Eure Erfahrungen? Was würde passieren, wenn die aktive Firewall "sich verschluckt" (ist schon bei uns passiert und musste händisch neu gestartet werden)? Springt die passive dann ein?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 7451237241
Url: https://administrator.de/contentid/7451237241
Ausgedruckt am: 21.11.2024 um 13:11 Uhr
26 Kommentare
Neuester Kommentar
Hallo,
einige Distris halten solche Geräte vor, kombiniert mit einem Express-Versand.
Sonst bleiben ja nur die beiden Varianten:
A) 1:1 Reserve
B) Alternative Reserve mit Nachteilen
Primär geht es ja um Kosten. Sonst würdest Du einfach eine 2. kaufen und gut ist.
Ich habe bei einem KMU-Kunden mit einer Firewall eine virtuelle PFSense in Reserve.
Die Firewall macht allerdings auch nur Web-Proxy. VLANs- und VPN laufen woanders.
Stefan
einige Distris halten solche Geräte vor, kombiniert mit einem Express-Versand.
Sonst bleiben ja nur die beiden Varianten:
A) 1:1 Reserve
B) Alternative Reserve mit Nachteilen
Primär geht es ja um Kosten. Sonst würdest Du einfach eine 2. kaufen und gut ist.
Ich habe bei einem KMU-Kunden mit einer Firewall eine virtuelle PFSense in Reserve.
Die Firewall macht allerdings auch nur Web-Proxy. VLANs- und VPN laufen woanders.
Stefan
Moin,
nur eine Büchse zu kaufen ist da echt sparen am falschen Ende.
Ein active-passive HA Cluster sollte die erste Wahl sein da wir hier von einer Appliance reden.
Ich denke nicht, dass du dir bei Problemen die Zeit nehmen willst alles irgendwie für den Notbetrieb umzubauen.
Das Budget wird durch deine Arbeitszeit im Disasterfall sehr schnell wieder raus sein.
Das Ersatz Gerät ist im live betrieb schnell integriert.
Gruß
Spirit
nur eine Büchse zu kaufen ist da echt sparen am falschen Ende.
Ein active-passive HA Cluster sollte die erste Wahl sein da wir hier von einer Appliance reden.
Ich denke nicht, dass du dir bei Problemen die Zeit nehmen willst alles irgendwie für den Notbetrieb umzubauen.
Das Budget wird durch deine Arbeitszeit im Disasterfall sehr schnell wieder raus sein.
Das Ersatz Gerät ist im live betrieb schnell integriert.
Gruß
Spirit
hast du doch selbst schon gesagt: HA-System, dabei bestenfalls nicht beide Firewalls im selben Raum u. auf selber Stromleitung legen. Denn damit kannst du auch bei Updates natürlich (normalerweise) nen rolling-reboot machen und bist nicht offline - und wenn dir eine verreckt dann läufts halt über die zweite...
Es ist nur dann unsinnig wenn alles im selben Raum und selben Rack hängt - weil dann hast du natürlich zB.bei ner überhitzung trotzdem die a-karte...
Es ist nur dann unsinnig wenn alles im selben Raum und selben Rack hängt - weil dann hast du natürlich zB.bei ner überhitzung trotzdem die a-karte...
N'Abend.
Einziges Manko: Die XGS haben beim HA in einem von 10.000 Fällen das Problem, dass der HA-Sync sich weghängt und der passive Node plötzlich auf Werkseinstellungen gesetzt wird.
Wir gehen aber nach und nach dazu über, "business critical applications" im (eigenen) RZ zu betreiben. Der ganze HA-Kram nutzt dir nix, wenn am Hauptstandort der Strom weg ist, alle Internetleitungen ausfallen etc. - alles schon gehabt. Die Wahrscheinlichkeit, dass so etwas in einem RZ passiert, ist bedeutend geringer.
*Just my 5 Cent*
Cheers,
jsysde
Zitat von @DerMaddin:
[...]Die Alternative wäre also eine weitere XGS der gleichen Baureihe und diese im "HA Active Passive" laufen lassen.
Wie ist das bei Euch so umgesetzt bzw. was sind Eure Erfahrungen?
Genau so und die Erfahrungen mit dem HA sind durchweg gut. Das waren sie auch schon zu Zeiten der SG-Serie.[...]Die Alternative wäre also eine weitere XGS der gleichen Baureihe und diese im "HA Active Passive" laufen lassen.
Wie ist das bei Euch so umgesetzt bzw. was sind Eure Erfahrungen?
Einziges Manko: Die XGS haben beim HA in einem von 10.000 Fällen das Problem, dass der HA-Sync sich weghängt und der passive Node plötzlich auf Werkseinstellungen gesetzt wird.
[...]Was würde passieren, wenn die aktive Firewall "sich verschluckt" (ist schon bei uns passiert und musste händisch neu gestartet werden)? Springt die passive dann ein?
Der Failover auf den passive Node hat bisher immer zuverlässig funktioniert, obiges Problem mal außen vor gelassen.Wir gehen aber nach und nach dazu über, "business critical applications" im (eigenen) RZ zu betreiben. Der ganze HA-Kram nutzt dir nix, wenn am Hauptstandort der Strom weg ist, alle Internetleitungen ausfallen etc. - alles schon gehabt. Die Wahrscheinlichkeit, dass so etwas in einem RZ passiert, ist bedeutend geringer.
*Just my 5 Cent*
Cheers,
jsysde
Hmm... warte kurz, im RZ geringer? Sag das mal dem RZ hier in Süddeutschland was letztes Jahr länger weg war (ich meine nen Problem mit den Generatoren,...). Oder das natürlich andere im RZ an der Infra drehen - und ggf. mal plötzlich Routings weg sind, Firewallregeln geändert wurden,... BEIDES hat Vor- und Nachteile. Diese Frage würde ich also eher dahin schieben was man im Haus überhaupt an möglichkeiten hat (und dabei eben auch die Fähigkeiten der Mitarbeiter realistisch sehen). Realität ist ja leider das es eher dahin geht das wer "in house" den Win-Assistenten für Cluster einmal installiert bekommen hat schon als Experte zählt und dann natürlich das ganze auch betreiben kann... DA würde ich dann auch eher nach Extern wechseln ;)
Moin.
Noch ein kurzer Hinweis - weiß nicht, ob das die XGS schon/auch betrifft:
Für HA/Cluster musste bei der SG-Serie die identische Hardware-Revision genutzt werden. Das HA nur mit gleichen Modellen geht, ist sowieso klar.
Aber eine richtig alte SG210 mit Hardware-Revision 1 und eine neuere SG210 mit Hardware-Revision 2 liessen sich ums verplatzen nicht als HA/Cluster konfigurieren. Wird bei der XGS wohl genauso sein, allerdings weiß ich nicht, ob es da überhaupt schon unterschiedliche Hardware-Revisionen gibt.
Cheers,
jsysde
Noch ein kurzer Hinweis - weiß nicht, ob das die XGS schon/auch betrifft:
Für HA/Cluster musste bei der SG-Serie die identische Hardware-Revision genutzt werden. Das HA nur mit gleichen Modellen geht, ist sowieso klar.
Aber eine richtig alte SG210 mit Hardware-Revision 1 und eine neuere SG210 mit Hardware-Revision 2 liessen sich ums verplatzen nicht als HA/Cluster konfigurieren. Wird bei der XGS wohl genauso sein, allerdings weiß ich nicht, ob es da überhaupt schon unterschiedliche Hardware-Revisionen gibt.
Cheers,
jsysde
Zitat von @DerMaddin:
Selber Raum muss schon allein wg. der zwei WAN Leitungen sein, macht ja kaum Sinn WAN durch das halbe Gebäude zu patchen Stromleitung ist egal. In den Serverräumen sind alle aktiven Geräte an einer USV, die Battery-Time ist zwischen 1,5h und 2,25h.
Überhitzung nur möglich, wenn der komplette Gebäudestrom inkl. PVA ausfällt und selbst dann senden die Temperatursensoren eine entsprechende Meldung ans Monitoring und nach Überschreiten des Schwellen- und Zeitwertes wird das Cluster heruntergefahren.
Zitat von @maretz:
hast du doch selbst schon gesagt: HA-System, dabei bestenfalls nicht beide Firewalls im selben Raum u. auf selber Stromleitung legen. Denn damit kannst du auch bei Updates natürlich (normalerweise) nen rolling-reboot machen und bist nicht offline - und wenn dir eine verreckt dann läufts halt über die zweite...
Es ist nur dann unsinnig wenn alles im selben Raum und selben Rack hängt - weil dann hast du natürlich zB.bei ner überhitzung trotzdem die a-karte...
hast du doch selbst schon gesagt: HA-System, dabei bestenfalls nicht beide Firewalls im selben Raum u. auf selber Stromleitung legen. Denn damit kannst du auch bei Updates natürlich (normalerweise) nen rolling-reboot machen und bist nicht offline - und wenn dir eine verreckt dann läufts halt über die zweite...
Es ist nur dann unsinnig wenn alles im selben Raum und selben Rack hängt - weil dann hast du natürlich zB.bei ner überhitzung trotzdem die a-karte...
Selber Raum muss schon allein wg. der zwei WAN Leitungen sein, macht ja kaum Sinn WAN durch das halbe Gebäude zu patchen Stromleitung ist egal. In den Serverräumen sind alle aktiven Geräte an einer USV, die Battery-Time ist zwischen 1,5h und 2,25h.
Überhitzung nur möglich, wenn der komplette Gebäudestrom inkl. PVA ausfällt und selbst dann senden die Temperatursensoren eine entsprechende Meldung ans Monitoring und nach Überschreiten des Schwellen- und Zeitwertes wird das Cluster heruntergefahren.
Nun - warum macht es keinen Sinn da mal eben übers Patchfeld zu gehen?
Und ja - die hängen an einer USV, was schon mal gut ist. Wenn die dann ausfällt is nur blöd. Wenn dir die Klimaanlage unbemerkt ausfällt is ebenfalls ziemlich blöd. Je nach Umgebung gibts da noch div. andere Gründe die eben genau dafür sagen "nimm 2 räume wenns geht". Und dabei gehts auch nicht nur um das Modem nach aussen - sondern oft genug ist die Firewall ja auch das Gateway für die div. Netze und d.h. wenn die ausfällt is auch das interne Routing platt... Daher würde ich wenns geht immer versuchen das zu trennen. Hier ist es - für mich! - einfach: Wenn ich einmal diese Arbeit habe und in x Jahren da stehe und sage "nu werden die Geräte mal wieder getauscht, das ganze war nie nötig weils nie nen Ausfall gab" dann kann ich GUT damit leben vor meinem Chef diese "verschwendete" Arbeitszeit zu vertreten. Stehe ich aber innerhalb der X Jahre _EINMAL_ da und sage "mist, der ganze Laden steht, mit etwas Umstrukturierung wären wenigstens noch 30, 50 oder 75% möglich gewesen" wirds schwer... Wobei das natürlich auch von der Umgebung abhängt: Ist es am Standort selbst und da is 24/7 auch eh jemand in der IT da ist es natürlich was anderes als wenn sich deine Server permanent durch die verschiedenen Länder bewegen....
Zitat von @DerMaddin:
Weil die Verbindung eine Fiberstrecke ist, da kann ich die Firewall nicht einfach so zum anderen Gebäudeteil patchen.
Aber das ist doch gerade optimal dafür. Ich betreibe einen unserer Fortinet Cluster gerade genau so.Weil die Verbindung eine Fiberstrecke ist, da kann ich die Firewall nicht einfach so zum anderen Gebäudeteil patchen.
Die zweite WAN Anbindung ist auch so rüber geführt da es baulich nicht anders möglich ist.
Worst Case wäre bei uns wäre wenn ein Raum abbrennt. Aber dann habe wir auch echt andere Sorgen.
Edit:
Wobei deine Schilderung so klingt, als wenn die Räume nicht in unterschiedlichen Brandabschnitten stehen.
Dann kannst du dir das ganze wirklich sparen.
naja - es ist doch ganz einfach: Wäre es optimal das in verschiedene Abschnitte zu packen? Ja, wäre es. Aber wie so oft: Es wäre ja auch zB. optimal das Gebäude auf "Dämpfer" zu setzen und somit schwingend zu lagern - bei einem Erdbeben wäre das sicher ne gute Idee... In der Theorie gut, in der Praxis eben manchmal nicht umsetzbar... (also ich würde selbst hier protestieren wenn morgen jemand kommt und sagt "du, geh mal aus deiner Bude für nen paar wochen raus, wir müssen kurz das Haus abreissen um nen paar Dämpfer unterzubauen" ;) ).
Wenns also nicht geht dann ist es so - punkt. Sowas nennt sich eben "kalkuliertes Risiko" und es kann durchaus sein das man das absichtlich eingeht weil alles andere einfach finanziell oder organisatorisch deutlich zu komplex wäre. Das ist weder schlecht, schlimm noch irgendwie ungewöhnlich...
Wenns also nicht geht dann ist es so - punkt. Sowas nennt sich eben "kalkuliertes Risiko" und es kann durchaus sein das man das absichtlich eingeht weil alles andere einfach finanziell oder organisatorisch deutlich zu komplex wäre. Das ist weder schlecht, schlimm noch irgendwie ungewöhnlich...
Also wenn es doch zwei Brandabschnitte sind, macht es immer Sinn.
Auch wenn du eine USV an den Geräten hast. Diese kann ebenfalls ausfallen. Mein Vorgänger ist bei uns daher gegangen und hat alle Systeme redundant auf zwei USVs verteilt.
Die Frage ist also, wie viele Fasern hast? Sind die Core Stacks mit zwei Faser "gekoppelt"?
Der Heart-beat könnt auch Kupfer sein. Alles weitere darf eh über Switche laufen.
Auch wenn du eine USV an den Geräten hast. Diese kann ebenfalls ausfallen. Mein Vorgänger ist bei uns daher gegangen und hat alle Systeme redundant auf zwei USVs verteilt.
Die Frage ist also, wie viele Fasern hast? Sind die Core Stacks mit zwei Faser "gekoppelt"?
Der Heart-beat könnt auch Kupfer sein. Alles weitere darf eh über Switche laufen.
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Zitat von @137431:
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Nö - warum? Siehe oben: Jetzt sagen wir: Ok, nen Ausfall darf keine 2h dauern. Würdest du dann also auch das Gebäude abreissen um es schwingend zu lagern weil ggf. nen Erdbeben ja kommen könnte? Wohl kaum - da es eben weder vom Eintrittsrisiko wahrscheinlich genug ist als auch das die Kosten dafür einfach nicht relevant sind.
Von daher ist die reine Ausfallzeit eben kein Kriterium... Denn beim Gebäudeeinsturz hättest du nen Ausfall von mehreren Tagen/Wochen/Monaten, das wird wohl keiner als relevant ansehen, trotzdem gibt es nur ganz wenige Einrichtungen die sich so absichern...
Zitat von @maretz:
Nö - warum? Siehe oben: Jetzt sagen wir: Ok, nen Ausfall darf keine 2h dauern. Würdest du dann also auch das Gebäude abreissen um es schwingend zu lagern weil ggf. nen Erdbeben ja kommen könnte? Wohl kaum - da es eben weder vom Eintrittsrisiko wahrscheinlich genug ist als auch das die Kosten dafür einfach nicht relevant sind.
Von daher ist die reine Ausfallzeit eben kein Kriterium... Denn beim Gebäudeeinsturz hättest du nen Ausfall von mehreren Tagen/Wochen/Monaten, das wird wohl keiner als relevant ansehen, trotzdem gibt es nur ganz wenige Einrichtungen die sich so absichern...
Zitat von @137431:
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Nö - warum? Siehe oben: Jetzt sagen wir: Ok, nen Ausfall darf keine 2h dauern. Würdest du dann also auch das Gebäude abreissen um es schwingend zu lagern weil ggf. nen Erdbeben ja kommen könnte? Wohl kaum - da es eben weder vom Eintrittsrisiko wahrscheinlich genug ist als auch das die Kosten dafür einfach nicht relevant sind.
Von daher ist die reine Ausfallzeit eben kein Kriterium... Denn beim Gebäudeeinsturz hättest du nen Ausfall von mehreren Tagen/Wochen/Monaten, das wird wohl keiner als relevant ansehen, trotzdem gibt es nur ganz wenige Einrichtungen die sich so absichern...
Und als nächstes kommst mit Asteroiden. Ist klar. Hast echt den Durchblick. Bin raus
Zitat von @137431:
Und als nächstes kommst mit Asteroiden. Ist klar. Hast echt den Durchblick. Bin raus
Zitat von @maretz:
Nö - warum? Siehe oben: Jetzt sagen wir: Ok, nen Ausfall darf keine 2h dauern. Würdest du dann also auch das Gebäude abreissen um es schwingend zu lagern weil ggf. nen Erdbeben ja kommen könnte? Wohl kaum - da es eben weder vom Eintrittsrisiko wahrscheinlich genug ist als auch das die Kosten dafür einfach nicht relevant sind.
Von daher ist die reine Ausfallzeit eben kein Kriterium... Denn beim Gebäudeeinsturz hättest du nen Ausfall von mehreren Tagen/Wochen/Monaten, das wird wohl keiner als relevant ansehen, trotzdem gibt es nur ganz wenige Einrichtungen die sich so absichern...
Zitat von @137431:
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Ihr müsst definieren, wie lange ein Ausfall max dauern darf. Danach fällt sich die Entscheidung wie von selbst 😉
Nö - warum? Siehe oben: Jetzt sagen wir: Ok, nen Ausfall darf keine 2h dauern. Würdest du dann also auch das Gebäude abreissen um es schwingend zu lagern weil ggf. nen Erdbeben ja kommen könnte? Wohl kaum - da es eben weder vom Eintrittsrisiko wahrscheinlich genug ist als auch das die Kosten dafür einfach nicht relevant sind.
Von daher ist die reine Ausfallzeit eben kein Kriterium... Denn beim Gebäudeeinsturz hättest du nen Ausfall von mehreren Tagen/Wochen/Monaten, das wird wohl keiner als relevant ansehen, trotzdem gibt es nur ganz wenige Einrichtungen die sich so absichern...
Und als nächstes kommst mit Asteroiden. Ist klar. Hast echt den Durchblick. Bin raus
nun - zumindest genug durchblick um zu verstehen das eben die reine Ausfallzeit NICHT das einzige Kriterium sind... sondern eben dazu noch Eintrittwahrscheinlichkeit, Wirtschaftliche Faktoren,... kommen. Und um bei deinem Beispiel zu bleiben: Nun, die Dinos hatten sich eben NICHT gegen Asteroiden abgesichert - blöd gelaufen für die... Macht trotzdem heute auch noch keiner... Eben weil die Wahrscheinlichkeit u. die Kosten das nicht rechtfertigen würden.