Probleme eines Win 2003 Clusters bei Netzausfall abfangen
Hallo, wir haben hier in der Firma einen Windows 2003 Cluster auf 2 identischen Servern aufgesetzt.
Nun besteht bei uns öfters das Problem, daß das komplette Netz ausfällt, weil die Netzwerktruppe andauernd irgendwas vermurkst.
Das Netz war neulich 10 Minuten ausgefallen, mit der Folge daß der Node der die IP- und die Namensresource hält den Fehler erkennt und versucht die Resourcen auf den anderen Node zu schieben.
Die Sache hat allerdings den Haken, daß beide Nodes vom Netzausfall auf dem Public-Link betroffen sind und auch der Übertrag auf den 2. Node fehlschlägt, da auch dort ein Fehler aufgetreten ist.
Dadurch werden die Resourcen solange versucht zwischen den beiden Nodes hin- und herzuschieben bis die Threshold überschritten ist und der Cluster mit einem Fehlerzustand stoppt.
Weiß irgendjemand eine Möglichkeit wie man diese Problem umgehen kann?
Danke im Voraus.
Viel Grüße
_Kerberos_
Nun besteht bei uns öfters das Problem, daß das komplette Netz ausfällt, weil die Netzwerktruppe andauernd irgendwas vermurkst.
Das Netz war neulich 10 Minuten ausgefallen, mit der Folge daß der Node der die IP- und die Namensresource hält den Fehler erkennt und versucht die Resourcen auf den anderen Node zu schieben.
Die Sache hat allerdings den Haken, daß beide Nodes vom Netzausfall auf dem Public-Link betroffen sind und auch der Übertrag auf den 2. Node fehlschlägt, da auch dort ein Fehler aufgetreten ist.
Dadurch werden die Resourcen solange versucht zwischen den beiden Nodes hin- und herzuschieben bis die Threshold überschritten ist und der Cluster mit einem Fehlerzustand stoppt.
Weiß irgendjemand eine Möglichkeit wie man diese Problem umgehen kann?
Danke im Voraus.
Viel Grüße
_Kerberos_
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 6625
Url: https://administrator.de/contentid/6625
Ausgedruckt am: 13.11.2024 um 22:11 Uhr
15 Kommentare
Neuester Kommentar
Einfach nen Switch davor der die beiden Server beherbergt und von dort der Uplink (am besten per VLAN) in das eigentliche Netz? Dann haben die Kisten immer Link und sollten nicht durchdrehen wenn einer im Laufenden Betrieb am Netz rumsaut! Was ich übrigends unmöglich finde! -> http://pcsv.de
Hallo,
so ein Problem habe ich auch .
4 Node Cluster mit Oracle Fail Safe.
Alles läuft sauber.
Aber wenn der Core Switch ausfällt sind die IP- Adressen weg ist gleich Failover
die Ressourcen werden solange hin und her gemoved bis die Schwellwerte erreicht sind.
Dann ist nicht einmal ein Zugriff über den Cluster Manager möglich.
Es hilft nur noch booten.
Hat jemand eine Idee wie das zu vermeiden ist.
Ich denke ein kleiner Switch mit eigenem Uplink ist schon eine gute Idee aber versau ich mir damit nicht die Performance übers Netz.
Ich hab 4 Gigabit Karten die direkt zum Core Switch gehen mit einem kleinen Switch vorgeschaltete aber nurn noch eine.
little
so ein Problem habe ich auch .
4 Node Cluster mit Oracle Fail Safe.
Alles läuft sauber.
Aber wenn der Core Switch ausfällt sind die IP- Adressen weg ist gleich Failover
die Ressourcen werden solange hin und her gemoved bis die Schwellwerte erreicht sind.
Dann ist nicht einmal ein Zugriff über den Cluster Manager möglich.
Es hilft nur noch booten.
Hat jemand eine Idee wie das zu vermeiden ist.
Ich denke ein kleiner Switch mit eigenem Uplink ist schon eine gute Idee aber versau ich mir damit nicht die Performance übers Netz.
Ich hab 4 Gigabit Karten die direkt zum Core Switch gehen mit einem kleinen Switch vorgeschaltete aber nurn noch eine.
little
Hallo zusammen,
wir haben folgendes Problem
Alle Gruppen wurden offline geschaltet auch die Clustergruppe um am System Wartungsarbeiten vorzunehemen.
Nach einem Neustart des System startet zwar der Clusterdienst und so wie es aussieht auch ohne Probleme
aber eine Anmeldung mit dem Clusteradmin am Cluster selbst ist nicht möglich.
Am Montag muß das System wieder laufen .
Unsere Wartungsfirma hat einen Call bei Microsoft aufgemacht.
Wer hatte den schon mal so einen Fall. und kann weiterhelfen.
Die Server starten alle ohne Problem aber eine zugriff auf die Ressourccen ist nicht oder nur begrenzt von außen möglich
little
wir haben folgendes Problem
Alle Gruppen wurden offline geschaltet auch die Clustergruppe um am System Wartungsarbeiten vorzunehemen.
Nach einem Neustart des System startet zwar der Clusterdienst und so wie es aussieht auch ohne Probleme
aber eine Anmeldung mit dem Clusteradmin am Cluster selbst ist nicht möglich.
Am Montag muß das System wieder laufen .
Unsere Wartungsfirma hat einen Call bei Microsoft aufgemacht.
Wer hatte den schon mal so einen Fall. und kann weiterhelfen.
Die Server starten alle ohne Problem aber eine zugriff auf die Ressourccen ist nicht oder nur begrenzt von außen möglich
little