Dieser Beitrag ist schon älter. Bitte vergewissern Sie sich, dass die Rahmenbedingungen oder der enthaltene Lösungsvorschlag noch dem aktuellen Stand der Technik entspricht.

Probleme eines Win 2003 Clusters bei Netzausfall abfangen

Mitglied: Kerberos_
Hallo, wir haben hier in der Firma einen Windows 2003 Cluster auf 2 identischen Servern aufgesetzt.
Nun besteht bei uns öfters das Problem, daß das komplette Netz ausfällt, weil die Netzwerktruppe andauernd irgendwas vermurkst.
Das Netz war neulich 10 Minuten ausgefallen, mit der Folge daß der Node der die IP- und die Namensresource hält den Fehler erkennt und versucht die Resourcen auf den anderen Node zu schieben.
Die Sache hat allerdings den Haken, daß beide Nodes vom Netzausfall auf dem Public-Link betroffen sind und auch der Übertrag auf den 2. Node fehlschlägt, da auch dort ein Fehler aufgetreten ist.
Dadurch werden die Resourcen solange versucht zwischen den beiden Nodes hin- und herzuschieben bis die Threshold überschritten ist und der Cluster mit einem Fehlerzustand stoppt.

Weiß irgendjemand eine Möglichkeit wie man diese Problem umgehen kann?

Danke im Voraus.


Viel Grüße
_Kerberos_

Content-Key: 6625

Url: https://administrator.de/contentid/6625

Ausgedruckt am: 20.06.2021 um 00:06 Uhr

15 Kommentare
Mitglied: meinereiner
In der Clusterkonfiguration tauchen doch deine beiden Netzwerke auf.

Wie sind die denn konfiguriert? Getrennt für internen und externen Verkehr, oder im gemischten Modus?
Mitglied: HedgeHog
Einfach nen Switch davor der die beiden Server beherbergt und von dort der Uplink (am besten per VLAN) in das eigentliche Netz? Dann haben die Kisten immer Link und sollten nicht durchdrehen wenn einer im Laufenden Betrieb am Netz rumsaut! Was ich übrigends unmöglich finde! -> http://pcsv.de
Mitglied: Kerberos_
Die Nodes hängen an zwei unterschiedlichen Subnets.
Eine NIC pro Node hängt als Public-Link an dem einen Netz und die andere Karte hängt als Heartbeat an dem anderen Netz (Private Netz).
Bei dem Ausfall war zwar der Heartbeat noch da, aber beide Nodes wiesen eben den Fehler auf der Public-Karte auf.
Der Publick Link ist auf Mixed gestellt und der Private Link ist auf nur auf Internal (Private).
Mitglied: meinereiner
Ich würde mal versuchen den Public Link nur für den Clientzugriff zu konfigurieren, so dass die ClusterKommunikation wirklich nur noch über die Heartbeatleitung läuft.
Mitglied: Kerberos_
Hallo, danke erstmal.
Das hört sich schon mal nach einer guten Lösung an.
Der Switch sollte in diesem Fall aber nach Möglichkeit nicht ausfallen.
Mitglied: meinereiner
Nur das du dann einen Single Point of failure hast, der dem Gedanken eines Clusters eher entgegensteht.
Mitglied: HedgeHog
Kannst ja anstelle des VLANs auch zwei einzelne Switches benutzen die dann jeweils Ihren eigenen Uplink an unterschiedlichen Zugangspunkten verwenden.
Mitglied: Kerberos_
Dann würde der Cluster aber doch trotzdem ein Problem an der Karte registrieren bzw. der Resource IP-Adresse, oder irre ich mich da?
Mitglied: meinereiner
ich denke das hängt davon ab wo dein Netz wegbricht.
Die Recource IP sollte nur offline gehen, wenn kein Link mehr da ist. Das passiert aber nur wenn die Strecke zwischen Node und Switch unterbrochen ist.
Mitglied: Kerberos_
Hallo, Leute ich danke euch für die Antworten.
Das hat mir schon weitergeholfen.
Mitglied: little
Hallo,
so ein Problem habe ich auch .
4 Node Cluster mit Oracle Fail Safe.
Alles läuft sauber.
Aber wenn der Core Switch ausfällt sind die IP- Adressen weg ist gleich Failover
die Ressourcen werden solange hin und her gemoved bis die Schwellwerte erreicht sind.
Dann ist nicht einmal ein Zugriff über den Cluster Manager möglich.
Es hilft nur noch booten.

Hat jemand eine Idee wie das zu vermeiden ist.
Ich denke ein kleiner Switch mit eigenem Uplink ist schon eine gute Idee aber versau ich mir damit nicht die Performance übers Netz.
Ich hab 4 Gigabit Karten die direkt zum Core Switch gehen mit einem kleinen Switch vorgeschaltete aber nurn noch eine.

little
Mitglied: Kerberos_
Hallo,
ich kenn Oracle Fail Safe zwar nicht.
Aber eventuell kannst du das Problem auch anders lösen.

Du kannst versuchen pro Server noch eine zusätzliche Karte unterzubringen und über verschiedene Switche zu gehen. Weis aber nicht ob das bei dir möglich ist.
Mitglied: little
Hallo zusammen,
wir haben folgendes Problem
Alle Gruppen wurden offline geschaltet auch die Clustergruppe um am System Wartungsarbeiten vorzunehemen.

Nach einem Neustart des System startet zwar der Clusterdienst und so wie es aussieht auch ohne Probleme
aber eine Anmeldung mit dem Clusteradmin am Cluster selbst ist nicht möglich.

Am Montag muß das System wieder laufen .
Unsere Wartungsfirma hat einen Call bei Microsoft aufgemacht.
Wer hatte den schon mal so einen Fall. und kann weiterhelfen.

Die Server starten alle ohne Problem aber eine zugriff auf die Ressourccen ist nicht oder nur begrenzt von außen möglich

little
Mitglied: meinereiner
so einen Fall hatte ich zwar noch nicht..aber mal schaun..

Was für eine Fehlermeldung kommt denn wenn du dich mit dem Clusteradmin anmeldest?
Steht was im Eventlog, oder Clusterlog?
funktioniert DNS sauber?
Mitglied: little
Hallo, Problem ist gelöst
anmelden mit '.' dann wird die Namesauflösung umgangen
und das anmelden ist OK.
little
Heiß diskutierte Beiträge
Windows 10
Austritt Mitarbeiter - Windows- u. M365 Konto
gelöst NixVerstehenVor 1 TagFrageWindows 1011 Kommentare

Moin zusammen, ich habe hier im Kleinunternehmen tatsächlich zum ersten Mal die Situation, das eine Mitarbeiterin aus dem kaufmännischen Bereich ausscheiden wird. Die Kollegin ist ...

Netzwerke
Kassen freezen ohne ersichtlichen Grund
Ronic1Vor 15 StundenFrageNetzwerke12 Kommentare

Hallo Zusammen, ich schreibe heute zum ersten Mal in diesem Forum. Also weißt mich bitte auf etwaige Fehler meinerseits hin. Wie ich in anderen Beiträgen ...

Microsoft
Wird die durch den DHCP zugewiesene IP-Adresse in der Ereignisanzeige gespeichert?
stephan.csVor 1 TagFrageMicrosoft6 Kommentare

Guten Morgen zusammen, leider bin ich mit meiner Recherche bis jetzt nicht weiter gekommen. Darum die Frage Wir haben folgende Situation: - Windows 10 Clients ...

Windows Server
Always-on-VPN mit einer Netzwerkkarte
bluelightVor 1 TagFrageWindows Server11 Kommentare

Hallo zusammen, ich bin tatsächlich einmal auf eure Hilfe angewiesen! Ich habe für unser Unternehmen ein Domänennetzwerk auf einem Rootserver von Netcup erstellt und weitestgehend ...

Installation
Setup mit automatischen Klicks
akadawaVor 1 TagFrageInstallation9 Kommentare

Moin, ich habe eine Installation welche ich gerne über das Softwarecenter vom SCCM installieren lassen möchte. Leider lassen die Parameter der Setup.exe es nicht zu, ...

Windows Netzwerk
PRTG Probe erkennt Lancom Router nicht mehr
gelöst blackarchVor 1 TagFrageWindows Netzwerk6 Kommentare

Hallo zusammen, die o.g. Probe ist auf dem Server eines Standortes installiert und lief bis dato problemlos. Gestern fiel nun der Ping für den Router ...

Windows 10
PDF Datei wird falsch angezeigt
ben1300Vor 1 TagFrageWindows 107 Kommentare

Hallo zusammen, habe hier eine PDF Datei, welche auf einem Macbook (Big Sur) und einem Windows 10 Prof. x64 Client problemlos dargestellt wird. Nun kommt ...

TK-Netze & Geräte
Starface mit NGN verliert Gateway
FabezzVor 14 StundenFrageTK-Netze & Geräte9 Kommentare

Guten Morgen zusammen, ich hoffe dass ich das richtige Thema getroffen habe. In unserer Firma wurde beschlossen dass die in die Tage gekommene Openscape ausgetauscht ...