gruenesossemitspeck
Goto Top

Windows 2016 Server - gravierende Netzprobleme

hi,
ich hab gerade ein Problem mit einer Testumgebung.... vom Prinzip her wollten wir die Inbetriebnahme einer Serverfarm testen, mit 10x Windows 2016 / Xenapp 7.15
Die VMs sind auf dem Patchstand November, die Virtualisierung ESX 6.0 CU2, VMware Tools in aktueller Version in den VMs installiert, VMXNET3 als Adapter.
Die Hardware darunter ist ein halbwegs aktuelles Blade-System das auch auf der HCL steht, CPU ein Xeon E5 26xx v4

Solange nur ein paar Testuser aktiv sind, arbeiten sie auf dem jeweils durch die Lastverteilung zugeteilten Zielserver praktisch alleine. Wenn aber bei allen Servern bis auf einem der Wartungsmodus aktiv ist, dann landen die 10 Testuser auf einer einzigen Maschine.

Und die haben da gigantische Netzprobleme, sprich sporadisch Latenzen ohne Ende (> 1000 ms RTT) zu Serverdiensten, die innerhalb der Umgebung sind. Das tritt immer sporadisch auf, aber manchmal kommen sich die User so ins Gehege daß Netzzugriffe pratksich einfrieren. Das passiert übrigens auch, wenn man direkt eine RDP Verbindung herstellt.

Das Problem konnten wir also herunterbrechen auf eine gewisse Anzahl von Sessions - 10 oder mehr als einen bestimmenden Faktor und die müssen Traffic zu derselben Zieladdresse verursachen... das ganze wurde auf dem Terminalserver auch gewiresharkt (aber ohne Befund durch einen Externen), wir ham auch einen SQL Server getract, aber der war es nicht (Mein Fachgebiet: keine langen Waits, keine ungewöhnlichen Antwortzeiten auf TSQL Batch Anforderungen, Indizes sind ok...)

ich hab so den Windows Netzwerkstack im Verdacht, denn vor ein paar Jahren gab es da schon mal heftigste Probleme mit Windows 2012 R2 auf ESX6 und dem VMware Tools Stand von 2016 (10.0.0) wenn das RSS in der VM aktiv war. Allerdings sind an der Netzwerkkarte sind 30 oder 40 Optionen, da wollte ich nicht einfach aufs Geratewohl daran herumspielen weil ein Teil davon auch nur nach nem Neustart seine Wirkung zeigt.

Hat das hier schon jemand mal gehabt?

Content-Key: 398052

Url: https://administrator.de/contentid/398052

Printed on: April 23, 2024 at 07:04 o'clock

Member: falscher-sperrstatus
falscher-sperrstatus Jan 12, 2019 at 11:06:44 (UTC)
Goto Top
Hallo,

Treiber/Bios/Firmware alle Uptodate?

VG
Member: Vision2015
Vision2015 Jan 12, 2019 at 11:41:58 (UTC)
Goto Top
Moin..
Zitat von @GrueneSosseMitSpeck:

hi,
ich hab gerade ein Problem mit einer Testumgebung.... vom Prinzip her wollten wir die Inbetriebnahme einer Serverfarm testen, mit 10x Windows 2016 / Xenapp 7.15
hm....

Die VMs sind auf dem Patchstand November, die Virtualisierung ESX 6.0 CU2, VMware Tools in aktueller Version in den VMs installiert, VMXNET3 als Adapter.
da würde ich auf 6.5 U2 gehen.. aber nicht weiter!
Die Hardware darunter ist ein halbwegs aktuelles Blade-System das auch auf der HCL steht, CPU ein Xeon E5 26xx v4
was für ein storage... ram ? anzahl der CPU´s

Solange nur ein paar Testuser aktiv sind, arbeiten sie auf dem jeweils durch die Lastverteilung zugeteilten Zielserver praktisch alleine. Wenn aber bei allen Servern bis auf einem der Wartungsmodus aktiv ist, dann landen die 10 Testuser auf einer einzigen Maschine.
was sagt den der Delivery Controller dazu?

Und die haben da gigantische Netzprobleme, sprich sporadisch Latenzen ohne Ende (> 1000 ms RTT) zu Serverdiensten, die innerhalb der Umgebung sind. Das tritt immer sporadisch auf, aber manchmal kommen sich die User so ins Gehege daß Netzzugriffe pratksich einfrieren. Das passiert übrigens auch, wenn man direkt eine RDP Verbindung herstellt.
du hast keine reinen RDP verbindungen mehr...
was bedeutet genau, "aber manchmal kommen sich die User so ins Gehege daß Netzzugriffe pratksich einfrieren" ?
was eigentlich nicht möglich ist!

Das Problem konnten wir also herunterbrechen auf eine gewisse Anzahl von Sessions - 10 oder mehr als einen bestimmenden Faktor und die müssen Traffic zu derselben Zieladdresse verursachen... das ganze wurde auf dem Terminalserver auch gewiresharkt (aber ohne Befund durch einen Externen), wir ham auch einen SQL Server getract, aber der war es nicht (Mein Fachgebiet: keine langen Waits, keine ungewöhnlichen Antwortzeiten auf TSQL Batch Anforderungen, Indizes sind ok...)

ich hab so den Windows Netzwerkstack im Verdacht, denn vor ein paar Jahren gab es da schon mal heftigste Probleme mit Windows 2012 R2 auf ESX6 und dem VMware Tools Stand von 2016 (10.0.0) wenn das RSS in der VM aktiv war. Allerdings sind an der Netzwerkkarte sind 30 oder 40 Optionen, da wollte ich nicht einfach aufs Geratewohl daran herumspielen weil ein Teil davon auch nur nach nem Neustart seine Wirkung zeigt.

Hat das hier schon jemand mal gehabt?
eigentlich nicht...
Frank
Member: maxblank
maxblank Jan 12, 2019 updated at 12:20:32 (UTC)
Goto Top
Moin,

welche Switche? Wie angebunden?
Storage? Anbindung?

Du vermischst oben auch viel Citrix mit VMware. Erkläre mal näher den Aufbau. klingt für mich irgendwie nach nested Virtualisierung.

Gruß
maxblank
Member: Vision2015
Vision2015 Jan 12, 2019 at 13:12:23 (UTC)
Goto Top
Moin...
Zitat von @maxblank:

Moin,

welche Switche? Wie angebunden?
Storage? Anbindung?

Du vermischst oben auch viel Citrix mit VMware. Erkläre mal näher den Aufbau. klingt für mich irgendwie nach nested Virtualisierung.
uhhhhhh.... Fachlich kompetente Aussage face-smile
nee nee, wir reden über Desktop-Virtualisierung / bzw. Apps... auf 10 Host Server, die über einen Delivery Controller gesteuert werden!
ich würde eher mal die frage stellen, ob der AD, SQL, License, StoreFront, Delivery Controllers in einer VM rennt, oder
gibbet noch einen secundary Delivery Controller und Unified Gateway?
in der Größenordnung würde ich die dienste schon aufteilen wollen... müssen...
wurden die 10 x 2016er Host Server alle einzeln installiert, oder aus dem Master Imge im Citrix Studio?
was du selbstverständlich erstellt hast, dafür.... fragen über fragen
als erstes würde die Virtual Delivery Agents Neu Installieren...

im Citrix Director würde ich als erstes mal Im bereich Maschinenauslastung nachsen, was da so los ist...
meine vermutung geht richtung datenträgerlatenz....
aber ohne wissen über das setup incl. storage ist rätseln angesagt...

Hinweis an den TO.. wenn du magst, schreib mir eine PN, dann sehen wir uns dein setup mal an.... kostenlos selbstverständlich

Frank



Gruß
maxblank
Member: maxblank
maxblank Jan 12, 2019 updated at 14:48:09 (UTC)
Goto Top
@Vision2015:
Du schreibst, dass du von Problemen mit der Datenträgerlatenz ausgehst und das keine Erklärung zum Storage vom TO da ist.
Ich frage vorher genau danach. Und dann kommt von dir eine Aussage zur fachlichen Kompetenz.
Schönes Eigentor! face-smile

Mit der Virtualisierung war ein Zusatz, da es für mich nicht klar ersichtlich ist, wie der Aufbau ist.
Member: Vision2015
Vision2015 Jan 12, 2019 at 15:15:58 (UTC)
Goto Top
Zitat von @maxblank:

@Vision2015:
Du schreibst, dass du von Problemen mit der Datenträgerlatenz ausgehst und das keine Erklärung zum Storage vom TO da ist.
Ich frage vorher genau danach. Und dann kommt von dir eine Aussage zur fachlichen Kompetenz.
Schönes Eigentor! face-smile
ja neee... is klar face-smile

Mit der Virtualisierung war ein Zusatz, da es für mich nicht klar ersichtlich ist, wie der Aufbau ist.
Member: maxblank
maxblank Jan 12, 2019 updated at 15:38:40 (UTC)
Goto Top
Alles gut, jeder hat mal keinen so guten Tag. Und heute ist scheinbar nicht so deiner. face-smile Aber zurück zum Thema.
Member: falscher-sperrstatus
falscher-sperrstatus Jan 12, 2019 at 17:15:38 (UTC)
Goto Top
Ich glaube, Frank bemängelt eher deine Anmerkung zu Citrix, wobei Citrix am Ende des Tages nur weit über dem Anmerkungslevel von Frank steht.

PS: Frank, seid wann bist du hier auch außerhalb des Forums kostenlos unterwegs - Frühjahrsangebot? face-wink
Member: Vision2015
Vision2015 Jan 12, 2019 at 17:31:03 (UTC)
Goto Top
Moin..
Zitat von @falscher-sperrstatus:

Ich glaube, Frank bemängelt eher deine Anmerkung zu Citrix, wobei Citrix am Ende des Tages nur weit über dem Anmerkungslevel von Frank steht.

PS: Frank, seid wann bist du hier auch außerhalb des Forums kostenlos unterwegs - Frühjahrsangebot? face-wink
och das mach ich oft genug....wir haben genug geld verdient... und bevor mir langweilig wird....

Frank
Member: falscher-sperrstatus
falscher-sperrstatus Jan 12, 2019 at 17:53:48 (UTC)
Goto Top
Zitat von @Vision2015:

Moin..
Zitat von @falscher-sperrstatus:

Ich glaube, Frank bemängelt eher deine Anmerkung zu Citrix, wobei Citrix am Ende des Tages nur weit über dem Anmerkungslevel von Frank steht.

PS: Frank, seid wann bist du hier auch außerhalb des Forums kostenlos unterwegs - Frühjahrsangebot? face-wink
och das mach ich oft genug....wir haben genug geld verdient... und bevor mir langweilig wird....

Frank

Lass mal drüber reden, wie wir dafür sorgen, dass es dir nicht langweilig wird face-wink

Schönen Abend!
Member: Vision2015
Vision2015 Jan 12, 2019 at 19:12:48 (UTC)
Goto Top
Moin...
Zitat von @falscher-sperrstatus:

Zitat von @Vision2015:

Moin..
Zitat von @falscher-sperrstatus:

Ich glaube, Frank bemängelt eher deine Anmerkung zu Citrix, wobei Citrix am Ende des Tages nur weit über dem Anmerkungslevel von Frank steht.

PS: Frank, seid wann bist du hier auch außerhalb des Forums kostenlos unterwegs - Frühjahrsangebot? face-wink
och das mach ich oft genug....wir haben genug geld verdient... und bevor mir langweilig wird....

Frank

Lass mal drüber reden, wie wir dafür sorgen, dass es dir nicht langweilig wird face-wink
ich habe ja euch... da wird mir nicht langweilig face-smile

Schönen Abend!

Frank
Member: GrueneSosseMitSpeck
GrueneSosseMitSpeck Jan 14, 2019 at 12:41:22 (UTC)
Goto Top
ich glaub den Aspekt mit dem "auf Citrix ist kein reiner RDP Betrieb mehr möglich" werden wir noch mal weiterverfolgen. Sprich Citrix Statistiken. Normalen Anwendern verweigert ein Citrix VDA nämlich eine reine RDP Anmeldung.

Ansonsten haben hier ein Problem wo VM 1 auf Blade 1 mit VM2 auf Blade 1 ein Netzproblem hat. Der Traffic geht in virtuelle VMware Router rein und raus, und ESX6.0 kann noch keine blade-übergreifenden virtuellen Router.

Die Peripherie (sprich Storage, SAN, NAS) ist ok, das AD wird auf anderen Systemen gemanagt und funktioniert ansonsten auch tagellos, auch ein parallel dazu noch laufendes Altsystem kämpft nicht mit diesen Problemen... nur deren Hard/Software wird allzubald nicht mehr supportet.
Member: GrueneSosseMitSpeck
GrueneSosseMitSpeck Jan 22, 2019 at 23:10:56 (UTC)
Goto Top
ein Schritt weiter... beim Versuch das mal auf ner alten ESX 5.5 (Update 2 Stand) nachzuspielen gelang mir noch nicht mal ein 100 MB Download, selbst RDP war eher schwierig, die Verbindung brach dauernd ab, und das lag nicht an meim Netz. Nun ja, schon das Update 3 mit dem Stand 302994 (April 2015) hats gerichtet.