dante2191
Goto Top

Cluster-IP plötzlich nicht mehr erreichbar!!!

Hallo allerseits,

bin gerade am verzweifeln...

Hab ein Cluster aus 3 Windows Server 2008R2 Terminalservern auf einem VMWare ESX aufgesetzt.
Unsere Testuser melden sich unter der Cluster-IP .161 an.
Aus Auslastungsgründen ist momentan nur ein oder zwei Server hochgefahren.
Bisher hat auch alles super funktioniert und wir wollten die neuen Server demnächst in den Produktivbetrieb nehmen.

Nun ist heute ohne ersichtlichen Grund die IP .161 nicht mehr erreichbar und die User verlieren ihre RDP-Sitzungen.
Erst durch einen Neustart der Server ist diese IP wieder erreichbar.

Die Ereignisanzeige der Server zeigt mir auch nichts aufschlussreiches.

Wo kann ich mit der Fehlersuche weitermachen??

Bitte dringend um Hilfe

Content-Key: 268635

Url: https://administrator.de/contentid/268635

Printed on: March 1, 2024 at 00:03 o'clock

Member: killtec
killtec Apr 09, 2015 at 09:25:12 (UTC)
Goto Top
Hi,
hast du dir denn schon mal die Clusterconfig angeschaut? GGf. die Neu aufbauen?

Gruß
Member: falscher-sperrstatus
falscher-sperrstatus Apr 09, 2015 at 09:26:11 (UTC)
Goto Top
Hallo,

wenn aus Performancegründen nur zwei von drei oben sind - wer sagt dir, dass die Performance dann noch genügt um diesen zu bedienen?

Grüße
Member: SeaStorm
SeaStorm Apr 09, 2015 at 09:26:44 (UTC)
Goto Top
sagt der ESX was dazu? Evtl. hat der ja ein Problem mit dem Netzwerk?
Sind noch andere Server auf dem ESX ? Die müssten dann ja das gleiche Problem haben.

Was ist die "ClusterIP" ? Ein Connectionbroker/NLB ? Evtl. ist nur da das Problem?
Ein bisschen mehr Infos zum Aufbau wären evtl. hilfreich
Member: Dante2191
Dante2191 Apr 09, 2015 updated at 10:10:15 (UTC)
Goto Top
Auf dem ESX betreiben wir mehrere Server, hatten noch nie ein solches Problem.
Das Cluster ist folgendermaßen konfiguriert:

Server 1: 192.168.1.162
Server 2: 192.168.1.163
Server 3: 192.168.1.164
Cluster-IP: 192.168.1.161

Mit der Cluster-IP ist die IP gemeint, über welche das Cluster angesprochen werden muss, bevor man auf einen der 3 Server geschmissen wird.
Weiterhin hab ich den Verbindungsbroker auf unseren Fileserver installiert.

Könnte es vielleicht mit den VMWare-Tools o.ä. zusammenhängen?
Member: SeaStorm
SeaStorm Apr 09, 2015 at 10:18:32 (UTC)
Goto Top
OK also ist 161 ein Loadbalancer.
Sind zum Zeitpunkt des Ausfalls die IPS 162-164 auch nicht erreichbar?
Wenn nein, dann hat ja nur der Balancer das Problem und man kann davon ausgehen, das es kein allgemeines Netzwerkproblem ist, sondern irgendwie mit dieser einen Maschine zusammenhängt.
Was läuft denn auf dem 161?

Funktioniert es erst wieder, wenn du den Server mit 161 neu startest, oder wenn du die anderen neu startest ?

Kannst du während der Ausfälle von 161 aus ins Netzwerk pingen ?

Evtl. reserviert sich ein anderes Gerät die IP 161 ?
Member: Dante2191
Dante2191 Apr 09, 2015 at 10:32:04 (UTC)
Goto Top
Die Server IP´s (162-164) sind erreichbar. Lediglich geht es um die 161.

Vielleicht sollte ich noch dazuschreiben, dass ich das Cluster nach folgender Anleitung installiert hab:
http://openbook.rheinwerk-verlag.de/windows_server_2008/windows_server_ ...

Unter der 161 läuft keine Maschine. So wie ich das verstanden wird auf der 161 lediglich gelauscht, dass die ankommenden RDP-Sessions verteilt werden können. Oder lieg ich da falsch?? Oo

Ich könnte mir vorstellen, dass es daran liegt, dass nicht alle Server hochgefahren sind. Die Server sind ja alle 3 in den NLB-Einstellungen hinterlegt. Vielleicht liegt da das Problem??
Member: Dante2191
Dante2191 Apr 09, 2015 at 10:35:31 (UTC)
Goto Top
@certifiedit.net
Meinst du die Performance um den Cluster zu bedienen?
Momentan arbeiten nur 3 User auf dem Cluster, also kann ich mir nicht vorstellen, dass das so viel Ressourcen zieht, oder?

Gruß
Member: Dani
Dani Apr 10, 2015 updated at 07:22:45 (UTC)
Goto Top
Moin,
du nutzt also den NLB für den "Cluster"... ich kann dazu unter Server 2008(R2) leider nur negatives berichten. An deiner Stelle würde ich mir als Loadbalancer haproxy anschauen. Läuft unter Linux und sollte in 2-3 Stunden laufen. Du brauchst ja kein spezielles Setup. Mit Server 2012R2 sieht es besser aus, da geht es mit OnBoard-Mitteln.


Gruß,
Dani
Member: Dante2191
Dante2191 Apr 10, 2015 at 08:31:35 (UTC)
Goto Top
Moin,

danke für die Info. Ich schaus mir mal an. Bin für alles was unter Linux läuft face-wink
Was für Probleme könnten denn noch beim Server 2008 auf mich zukommen?

Gruß
Member: Dani
Solution Dani Apr 11, 2015, updated at Apr 15, 2015 at 08:01:01 (UTC)
Goto Top
Moin,
ansonsten ist die Rolle "Remote-Desktopverbindungsbroker" ebenfalls eine Alternative. Zwar kann haproxy auch Sessionbased-Verbindungen umgehen, ob er allerdings sauber bei RDP arbeitet, weiß ich leider nicht.

Was für Probleme könnten denn noch beim Server 2008 auf mich zukommen?
Bei uns war von heute auf morgen der Cluster im NLB wech... nicht einmal der Microsoft Support konnte sich einem Reim dadrauf machen.


Gruß,
Dani
Member: Dante2191
Dante2191 Apr 13, 2015 at 10:55:04 (UTC)
Goto Top
Moin,

langsam bin ich am überlegen, ob ich das Thema Load-Balancing nicht ganz sausen lasse. Da wir 3 Standorte mit relativ gleicher Userzahl haben, was das Cluster e nur "Nice-to-have".

Nur noch eine Frage dazu:
Wenn ich nun erreichen will, dass sich bei Ausfall der IP .161 der Client direkt zum Server verbinden soll, reicht es dann wenn ich in der Konfiguration des Remoteserver-Sitzungshost unter "Für erneute Verbindungen zu verwendende IP-Adressen" die IP des Servers direkt eintrage und den Haken hier neben der .161 setze?

Danke schon mal face-smile
Member: Dani
Dani Apr 13, 2015 at 11:02:12 (UTC)
Goto Top
Moin,
langsam bin ich am überlegen, ob ich das Thema Load-Balancing nicht ganz sausen lasse. Da wir 3 Standorte mit relativ gleicher Userzahl haben, was das Cluster e nur "Nice-to-have".
Warum, ist doch kein Hexenwerk...


Gruß,
Dani
Member: Dante2191
Dante2191 Apr 13, 2015 at 11:56:21 (UTC)
Goto Top
Ja bis jetzt hab ich mir das auch gedacht und was bisher auch recht zufrieden.
Aber nun ist mein Vertrauen zu Windows wieder ein wenig mehr verloren gegangen face-wink

Zu meiner letzten Frage: Könnte mir da auch jemand weiterhelfen?
Member: Dani
Dani Apr 13, 2015 at 17:06:50 (UTC)
Goto Top
Ja bis jetzt hab ich mir das auch gedacht und was bisher auch recht zufrieden. Aber nun ist mein Vertrauen zu Windows wieder ein wenig mehr verloren gegangen
Wasn los? Klappt es mit haproxy nicht wie gewünscht oder woher kommt die Depression? face-big-smile

Wenn ich nun erreichen will, dass sich bei Ausfall der IP .161 der Client direkt zum Server verbinden soll, reicht es dann wenn ich in der Konfiguration des Remoteserver-Sitzungshost unter "Für erneute Verbindungen zu verwendende IP-Adressen" die IP des Servers direkt eintrage und den Haken hier neben der .161 setze?
Gute Frage, probier's aus. Aber das ist nicht Sinn eines Clusters. Dann kannst du dir den Aufwand sparen.


Gruß,
Dani
Member: Dante2191
Dante2191 Apr 14, 2015 at 10:06:30 (UTC)
Goto Top
Den HAProxy konfiguriere ich gerade. Hab momentan recht viel um die Ohren, deswegen könnte die ganze Geschichte mit Test noch ein wenig dauern face-wink
Ich melde mich auf jeden Fall noch mal wenn ich mehr weis.

Vorerst vielen Dank an euch alle face-smile
Member: Dante2191
Dante2191 Apr 15, 2015 updated at 08:00:45 (UTC)
Goto Top
Guten Morgen,

hammer klasse Teil dieser HAProxy face-big-smile
Debian aufgesetzt, Grundkonfig drauf, haproxy installiert und die Konfig angepasst. Mehr war hier nicht zu machen, damit eine RDP-Verbindung aufgebaut werden kann.
Hatte nur noch ein kleines Problemchen über das ich mich noch hermachen musste:
Nach ca 10 Minuten ist in der Sitzung der Bildschirm schwarz und baut sich nach ca 1 sek wieder auf. Ist halt ziemlich nervig face-confused

Lösung: Ein falsch konfigurierter Timeout im Config-File

Viele Grüße und ein großes DANKESCHÖÖÖN!!!!
Member: Dani
Dani Apr 15, 2015 at 15:45:42 (UTC)
Goto Top
Moin,
freut mich zuhören... würdest du eine anonymisierte Konfiguration von haproxy für die Nachwelt posten?!


Gruß,
Dani
Member: Dante2191
Dante2191 May 08, 2015 at 08:37:10 (UTC)
Goto Top
Grüß euch,
sorry hatte in letzter Zeit ein wenig zu viel um die Ohren face-wink

Die Lösung mit haproxy habe ich bisher keinesfalls bereut. Läuft bisher vollkommen stabil *thumbsup*

Hier mal meine Config:
Der Load-Ballancer bekommt die IP 192.168.1.5
Die drei Server die IPs 192.168.1.1 bis .3

global
log /dev/log	local0
log /dev/log	local1 notice
chroot /var/lib/haproxy
stats socket /run/haproxy/admin.sock mode 660 level admin
stats timeout 30s
user haproxy
group haproxy
	
daemon
# Default SSL material locations
ca-base /etc/ssl/certs
crt-base /etc/ssl/private

# Default ciphers to use on SSL-enabled listening sockets.
# For more information, see ciphers(1SSL).
ssl-default-bind-ciphers kEECDH+aRSA+AES:kRSA+AES:+AES256:RC4-SHA:!kEDH:!LOW:!EXP:!MD5:!aNULL:!eNULL        
ssl-default-bind-options no-sslv3

defaults
log	global
mode	tcp
option	tcpka
option	tcplog
timeout connect 1h
timeout client  1h
timeout server  1h
	
errorfile 400 /etc/haproxy/errors/400.http
errorfile 403 /etc/haproxy/errors/403.http
errorfile 408 /etc/haproxy/errors/408.http
errorfile 500 /etc/haproxy/errors/500.http
errorfile 502 /etc/haproxy/errors/502.http
errorfile 503 /etc/haproxy/errors/503.http	
errorfile 504 /etc/haproxy/errors/504.http

listen cattail 
192.168.1.5:3389

mode tcp
tcp-request inspect-delay 5s
tcp-request content accept if RDP_COOKIE
persist rdp-cookie
balance leastconn
option tcpka
option tcplog

server Servername1 192.168.1.1:3389 weight 1 check inter 2000 rise 2 fall 3
server Servername2 192.168.1.2:3389 weight 1 check inter 2000 rise 2 fall 3
server Servername3 192.168.1.3:3389 weight 1 check inter 2000 rise 2 fall 3

option redispatch