fireglow
Goto Top

Citrix Presentation Server 4.5 - User oder Clients werden ständig disconnectet - Keine erkennbare Ursache

Hallo,
seit Jahren bin ich nun schon leser der Zeitschrift Administrator.
Nun habe ich aber ein Problem, bei dem mir scheinbar niemand weiterhelfen kann.
Auch findet man bei google niemand der dieser Problem schonmal beschreibt.

Ausgangslage:
- Windows Server 2003 Umgebung
- 4x Citrix Presentaionserver 4.5 virtualisiert mit vmWare aufgeteilt auf zwei ESX3.5
- neighborhood agent
- Anwender mit ThinClient der Marke Wyse, Igel und HP
- Die Terminalserver werden einmal in der Woche rebootet per Task

Problem:
Vor ca. 6 Wochen hatten wir das Problem, dass einzelne Benutzer mit ThinClients (egal welcher marke) einfach
disconnectet sind. Sie mussten sich dann erneut anmelden. (es kommt eine meldung, dass die verbindugn nicht mehr besteht und man sich neu verbinden muss). Wir haben dann die Terminalserver neugestartet und das Problem schien im Griff.

Nun taucht das Problem aber ständig auf. Es kann nicht auf einzelne Terminalserver oder Benutzer eingeschränkt werden. Es sind immer anderen Benutzer aber: manche Benutzer sind gar nicht betroffen. Bei denen die betroffen sind, bricht die verbindung auch mehrmals innerhalb kürzester zeit ab und dann wieder lange nicht. Anzumerken ist noch, dass die Benutzer es so schildern, dass es vor der Unterbechung scheinbar sehr ruckelt bei den Anwendungen bevor man rausfliegt.
Bei Nutzern mit PCs die nur einzelne Anwendungen über den NeighborhoodAgent erhalten, brechen diese Anwendungen auch mehrmals ab.

Was auch noch auffällt, dass wir auf den einzelnen Terminalservern und dem Lizenzverwaltungsserver (bei uns der Printserver) ständig das "discovery" durchführen müssen - Fehlermeldung: "Kontakt zum Discoveryserver der Farm XY wurde unterbrochen - Führen Sie discovery erneut aus"
Man muss dazu sagen, dass wir die Citrix Delivery Service Console immer geöffnet haben. Wenn man sie jedes mal aufmachen würde, würde diese ja automatisch discovery durchführen.


Wir dachten Anfangs an ein Lizenzproblem, da auch ab und zu eine Lizenzfehlermeldung kam. Aber nach neustart der Terminalserver ist diese Meldung dann nicht mehr gekommen.


Hat irgendjemand eine Idee wo wir ansetzen können?
Wir wissen echt nicht weiter. Selbst die Firma die es bei uns installiert hat, weiß keinen Rat.
Im Citrix-Forum konnte mir auch keiner helfen. Unter google findet sich auch niemand mit diesem Problem.

Ich wäre echt froh wenn jemand eine Idee hat.
Sofern ich was neue raus bekomme, melde ich mich!

DANKE!
Gruß
J.

Content-ID: 157996

Url: https://administrator.de/contentid/157996

Ausgedruckt am: 22.11.2024 um 16:11 Uhr

YotYot
YotYot 05.01.2011 um 14:18:46 Uhr
Goto Top
Mahlzeit,

Du hast nichts darüber geschrieben, ob Du schon Netzwerkkomponenten und Kabel geprüft hast, eine defekte Schnittstelle am Switch macht sich gerne mal so bemerkbar, ein geknicktes Kabel vielleicht, ein neu hinzugekommenes Gerät. eine defekte Netzwerkkarte in irgendeinem Rechner oder Drucker...

Es fällt Euch immer bei Citrix auf, wie sieht denn das mit anderen Sachen aus, hat Ihr Datenbankzugriffe, die das übelnehmen würden? Also, wenn jetzt der TS die Verbindung zum Fileserver verliert? Ich meine: Die komplette Citrixgeschichte einschließlich Lizenzproblemen kann ja eine Folge von was anderem sein, das vermute ich sogar in erster Linie, wegen dem Ruckeln kurz vorher. Sieht für mich nach Netzwerk-Ärger aus.

Ergebnisse dazu vorhanden?

Jörg
Fireglow
Fireglow 05.01.2011 um 22:40:33 Uhr
Goto Top
Netzwerkprobleme haben wir auch schon gedacht.
An der Hardware fältt aber nichts auf. Die Probleme lassen sich auch nicht auf einen Stockwerk und Gebäudeflügel eingrenzen.
also auch nicht auf einzelne Switche oder so.
Was wir haben, wir haben seit ca. 2 Monaten neue Kopiegeräte die auch im Netzwerk sind. Aber ob es daran liegen kann?
Fireglow
Fireglow 05.01.2011 um 22:43:02 Uhr
Goto Top
Kollege meint grad das es schon vorher war.
YotYot
YotYot 05.01.2011 um 23:49:18 Uhr
Goto Top
Ich hatte ein ähnliches Verhalten in zwei Netzwerken. Eins war unser eigenes, knapp 30 PCs am lokalen Standort und nochmal acht oder neun Remote. Wir haben damals auf Terminalservern gearbeitet, nur RDP, kein Citrix. Die Auffälligkeiten gab es nur an drei PCs, einer davon mit einer lokalen Installation und Anmeldung, servergespeichertes Profil. An diesen drei PCs gab es immer wieder mal Probleme mit der Anmeldung, dann wieder wurde RDP unterbrochen, dann mal wieder dies und dann das. Nichts gleichmäßiges. Und nach der Behebung ist uns aufgefallen, dass das ganze Netzwerk insgesamt schneller war, die Terminalserver hatten diese bis dahin ungeklärten Spitzenlasten nicht mehr. Wir haben da auch erst keinen Zusammenhang gesehen. Ursache waren die Ports 23 und 24 eines Switches, da hingen der DC und ein Switch für Drucker dran. Die Ports funktionierten eigentlich. Meistens. Zu 98%. Test, Messung, alles sah gut aus. Der Remotestandort hat nur die zeitweise schlechte Performance mitbekommen.
Bis wir den Fehler gefunden hatten, sind Monate vergangen (IT-Dienstleister, Kundennetze gingen immer vorface-wink). Und wir haben hundertmal darüber diskutiert, dass die Switches ja in Ordnung sind und die Kabel neu und es ging ja alles. Bis wir wirklich jedes einzelne Gerät nacheinander durchgetauscht haben. Immer, wenn das Problem wieder aufgetaucht ist, haben wir die nächste Komponente getauscht. Gut, dass wir gleich im Serverraum angefangen sind.

Der zweite Fall dieser Art war in einem reinen Client-Server-Netzwerk, keine TS. Immer, wenn ein bestimmter Rechner an war, ging fast nichts mehr. Der Rechner war ok, aber in einem Zimmer gegenüber war eine Netzwerkdose offensichtlich von von einem blinden Parkinsonpatienten aufgelegt worden. An der Abschirmung waren dann wohl auch schon Mäuse dran oder so. Das war die eigentliche Ursache. Offensichtliche und tatsächliche Fehlerquelle hatten nicht viel miteinander zu tun... Aber bis dahin haben wir 20 Dosen aufgemacht, einen Rechner getauscht, graue Haare bekommen und nach dem Raufen verloren und so weiter.

Wenn es einfach zu finden wäre, hättest Du das Problem schon gefunden. Und wenn Du an den Citrix-Servern nichts findest und auch am Lizenzserver nicht, wirst Du um die ganzen Basics nicht herum kommen. Die beiden Server selbst fallen für mich sowieso aus, weil dann immer alle Rechner betroffen sein müssten.
Sowas macht sich manchmal eben nur bemerkbar, wenn eine gewisse Last auf einer Leitung liegt oder wenn beim Anspringen der Heizung ein Erdungsproblem auftritt und das Netzteil von PC XY die Schwankungen fett über die Netzwerkkarte ableitet.
Ich sage nicht, dass die Suche Spaß macht. Deswegen einfach nur:

Viel Erfolg!

Wenn Dir irgendeine Gleichmäßigkeit auffällt, Uhrzeit, Wetter, Reihenfolge, Anwesenheit eines bestimmten Mitarbeiters, Mikrowelle wird eingeschaltet, was auch immer: verfolgen! Und hier reinschreiben, vielleicht fällt ja irgendwem dazu was ein.

Gruß

Jörg
Fireglow
Fireglow 11.01.2011 um 08:41:05 Uhr
Goto Top
Danke für Jörg für diesen ausführlichen Beitrag.
Wir gehen jetzt wie folgt vor:
- Alle Anwender sind aufgefordert jede Unregelmäßigkeit mit Uhrzeit zu melden
- Bei Unregelmäßigkeiten schauen wir sofort die Ereignisanzeigen der Server zu diser Uhrzeit durch
- Bei Unregelmäßigkeiten schauen wir sofort auf die Auslastung der VMs bzw. der ESX
- Wir notieren die welche Mitarbeiter an welchem Tag da sind und welche nicht.

Ich hoffe, dass wir dadurch schonmal weiter kommen. I
ch vermute irgendwie die VMs oder ESX. Aus dem Bauch heraus. Irgendein Performanceproblem. Wobei in den Leistungskurfen nichts Auffälliges ist. Das vermute ich deshalb, da manche Benutzer meinen es würde kurz vor dem Absturz alles sehr langsam von statten gehen und auch ruckeln.

Was sich noch interessant anhört ist das Thema Heizung. Das Problem tritt so ca. seit Oktober auf. Allerdings war zwischendurch mal Pause von 4 Wochen wo sich keiner beschwert hat.
Ab ca. Oktiober ist auch die Heizung in Betrieb.

Mal schaun wie es weiter geht.

Aufjedenfall ein sehr nerviges Thema auch für die Anwender.
YotYot
YotYot 11.01.2011 um 20:19:59 Uhr
Goto Top
Du hast anfangs geschrieben, dass es User gibt, die gar nicht betroffen sind. Das schließt für mich die VMs bzw. ESX aus.
Haben diese nicht betroffenen User eine Gemeinsamkeit? Z.B. dass sie alle das Programm XY [-nicht-] benutzen oder alle haben einen Umlaut im Benutzernamen oder sie werden von einem anderen Server verwaltet (Benutzeranmeldung, logonserver), sind User, die noch aus NT4-Zeiten immer mit übernommen wurden oder die nie Office 97 hatten, irgendsowas.

Du hast auch geschrieben, dass nach einem Serverneustart das Problem behoben zu sein scheint. Hast Du schon mal die Last der Server vor dem Neustart gecheckt? Also jetzt innerhalb von Windows, nicht am ESX. Die ESX-Last ist gar nicht so dramatisch, wenn die Kiste nicht gerade hoffnungslos überlastet ist. Bei normaler Auslegeung darf das mal an die Grenzen gehen, dann wird's ein bisschen langsam, aber das war's dann auch.

Was habt Ihr eigentlich für ein Festplattensystem dahinter und habt Ihr direkt auf Linux-Ebene (also auf den ESX) einen Virenscanner laufen?

Wenn mir nochmal wieder was einfällt, schreib ich meinen Senf hier rein, vielleicht hilft's ja face-smile

A pro pos Hilfe: Hat mal einer 'ne neue Tastatur für mich? Die blöden Brötchenkrümel machen mich wahnsinnig!

Jörg
Fireglow
Fireglow 12.01.2011 um 14:52:18 Uhr
Goto Top
Hallo Jörg,

wir suchen auch noch nach Gemeinsamkeiten bzwl. Unterschieden.
In dieser Richtung konnten wir es aber noch nicht viel weiter eingrenzen.

Storage haben wir ein SAN. Auf den ESX direkt läuft kein Virenscanner.

Heute läuft es ohne Probleme. Bisher hat sich kein User gemeldet. Wir haben jetzt notiert wer heute nicht da war und wer da war.
Fireglow
Fireglow 13.01.2011 um 16:36:53 Uhr
Goto Top
Es ist festzustellen, dass gestern und heute bisher alles läuft.
Wir wissen aber nicht warum. Im Kreis der Verdächtigen ist jetzt alles was irgendwas mit den Benutzern zu tun hat, die heute nicht da sind.

Halte euch auf dem laufenden
YotYot
YotYot 13.01.2011 um 20:04:38 Uhr
Goto Top
Das ist doch wieder die Sache mit der Badewanne und dem Telefon. Den ganzen Tag ist Ruhe, aber kaum liegst Du entspannt im Wasser... rrrring! oder meinetwegen tüdelüdelüt! Oder die Sache mit dem Bus und der Zigarette. Erst zwanzig Minuten Verspätung kommentarlos vergehen lassen, aber kaum hast Du Dir 'nen Glimmstengel ins Gesicht gesteckt... pfffft!

Wir haben 800m von der Verwaltung entfernt ein Produktionswerk. Da stehen so etwa 10 PCs und drei Drucker. Anbindung per EthernetConnect, es ist aber auch noch ein Router/Firewall da, um im Falle eines Falles eine Notverbindung über DSL herstellen zu können. Immer, wenn es nachts oder am Wochenende stark regnet, also zu Zeiten, wo kein Betrieb ist, ist am nächsten Morgen die Verbindung weg. Anscheinend ist die Stromversorgung da nicht so prall, irgendwas muss. Dann steigt immer wieder mal der NT von der EC-Leitung aus oder der Router. Komischerweise nur, wenn kein Betrieb ist, tagsüber kann es regnen, was es will. Wir haben da wegen drei Kleingeräten keine USV, starten die Dinger dann eben neu, das reicht.
Ich weiß nicht, ob Du damit was anfangen kannst, aber behalt das vielleicht auch noch im Kopf, wer weiß, wann Dir mal ein gleicher Stromkreis oder eine USV mit Lastspitzen auffällt.

Jörg
Fireglow
Fireglow 24.01.2011 um 09:55:42 Uhr
Goto Top
Also wir kommen weiter. Aber nicht ins positive. Es ist kein reines Citrix-Problem. Es schien bisher so, weil es keinem aufgefallen ist.
Wir haben auch einige ThinClients von IGEL mit VMWareView Desktopvirtualisierung. Bei diesen Usern ist das gleiche Problem. Die Verbindung bricht unerwartet ab.

Wir wollen das gesamte Netzwerk mal durchmessen lassen ob in die richtugn was auffällt.

Wie gesagt sind ja einige User gar nicht betroffen. Hier haben wir gestgestellt, dass es die User sind die immer auf dem gleichen Terminalserver connecten. Die anderen User werden aufgeteilt nach Auslastung.

Ich habe jetzt schon überlegt, ob der Terminalserver bei Überlast einfach die User disconnectet die nicht zwingend nur auf ihm sein müssen. Wenn die User sich dann wieder anmelden sind sie nämlich dann auf einem anderen Server.


Echt, die Nadel im Heuhaufen
Fireglow
Fireglow 14.02.2011 um 11:21:09 Uhr
Goto Top
Die Anzeichen verdichten sich auf ein reines Hardware-Problem.
Auf dem Switch an dem die ESX angeschlossen sind, werden Fehler gemeldet.
Wir haben jetzt alles Netzwerkkabel ausgetauscht. Seitdem geht es. Nächster Schritt wäre die Netzwerkkarte auszutauschen und evtl. das Portmodul am Switch zu wechseln.

Daumen drücken, das es die Kabel waren bzw. eins davon.
YotYot
YotYot 14.02.2011 um 22:08:20 Uhr
Goto Top
Zitat von @Fireglow:
Wir haben jetzt alles Netzwerkkabel ausgetauscht. Seitdem geht es. Nächster Schritt wäre die Netzwerkkarte auszutauschen
und evtl. das Portmodul am Switch zu wechseln.

Womit es dann meinem Vorschlag vom 5. Januar recht nahe komme würde...

Daumen drücken, das es die Kabel waren bzw. eins davon.

Ich drücke face-wink
Fireglow
Fireglow 22.02.2011 um 08:07:43 Uhr
Goto Top
Es lag an einem Netzwerkkabel das am ESX angeschlossen war.