dani
Goto Top

Probleme nach Aktualisierung von VMWare Horizon und Co

Guten Abend zusammen,
es geht - mal wieder - um Virtual Desktop Infrastructure welche unter VMWare Horizon 7 betrieben wird.

Für den Zugriff aus dem Internet gibt es mehrere Unified Access Gateways (UAG), welche hinter Load Balacaner "versteckt" sind. Die UAGs zeigen widerrum auf einem Load Balancer (via DNS-Name der Farm) hinter dem mehrere Connection Server (CS) sich befinden. Die CSs bedienent ausschließlich die Zugriffe aus dem Internet. Es wird der Zugriff via PCoIP als auch Blast (Extreme) zur Verfügung gestellt. Das hängt davon ab, was der Anwender macht.

Seit wir die Komponenten auf die jeweils neuste Version (ESXi 6.7, vCenter Server Appliance 6.7, Horizon: 7.9, UAG: 3.6) aktualisiert haben stellen wir fest, dass es die durschnittliche Auslastung auf den Load Balancer bzw. UAGs zugenommen hat. Obwohl die Anzahl der parallelen Verbindungen bzw. notwendigen Bandbreite fast gleich geblieben ist. Es kommt sogar zu Verbindungsfehlern oder sogar Abbrüche.

Wir haben bereits
  • die Internetleitungen auf Paketeverluste bzw. das QoS überprüfen lassen.
  • die Router durch den ISP tauschen lassen.
  • die Firmware auf dem Load Balancer und Firewalls aktualisiert.
  • den UAG mehr CPUs und Arbeitsspeicher zugewiesen.
  • Kown Issue durchgearbeitet - nichts relevantes gefunden.
  • Tonnen an Protokolldateien an VMWare übermittelt.

Teile der Infrakstruktur (Firewalls, Load Balancer) werden auch für andere Services genutzt. Dort läuft vermeidlich alles rund. Die Anzahl der Tickets im ServiceDesk sind im normalen Bereich. Somit hätte ich die genannten Komponenten erst einmal ausgeschlossen. Das größte Problem für uns ist, wir können es nicht absichtlich reproduzieren.

Hat jemand bei sich oder einem Kunden ähnliche Beobachtungen gemacht?


Gruß,
Dani

Content-Key: 488802

Url: https://administrator.de/contentid/488802

Printed on: April 16, 2024 at 14:04 o'clock

Member: GrueneSosseMitSpeck
GrueneSosseMitSpeck Aug 26, 2019 updated at 06:13:47 (UTC)
Goto Top
willkommen im Updatedjungel von VMware... sowas macht man normalerweise mit einem Servicetechniker zusammen, weil das schon mal vorkommen kann daß eine komplette Farm oder ein Loadbalancer-Cluster tot ist wenn man das nicht 100% richtig macht. Ernsthaft, laß da jemand kommen, das sind unternehmenskritische Infrastrukturelemente, wo das Schwarmwissen nicht gut genug ist.

Angenommen hier sagt jemand "oh das hatten wir auch dann haben wir in der Datei soundso ein Flag von 1 auf 0 gesetzt dann war alles gut", du tust das und nächste Woche ist dein Netz gehackt. Also ehrlich, dafür ist man haftbar.... so wie auch der Architekt dran ist wenn eine Brücke einstürzt.
Member: Dani
Dani Aug 26, 2019 updated at 07:44:55 (UTC)
Goto Top
Moin,
sowas macht man normalerweise mit einem Servicetechniker zusammen, weil das schon mal vorkommen kann daß eine komplette Farm oder ein Loadbalancer-Cluster tot ist wenn man das nicht 100% richtig macht
Keine Sorge. Wir haben eigene, zertifizierte VMWare Teams hier, die den ganzen Tag nichts anders machen.

Angenommen hier sagt jemand "oh das hatten wir auch dann haben wir in der Datei soundso ein Flag von 1 auf 0 gesetzt dann war alles gut", du tust das und nächste Woche ist dein Netz gehackt.
Einfach so wird nichts übernommen. Und schon gar nicht von mir. Evtl. Vorschläge und Lösungsansätze werden erst einmal intern geprüft und ggf. mit dem Hersteller diskutiert.

Also ehrlich, dafür ist man haftbar.... so wie auch der Architekt dran ist wenn eine Brücke einstürzt.
Ist uns allen bewusst.


Gruß,
Dani
Member: holli.zimmi
holli.zimmi Aug 27, 2019 at 07:13:41 (UTC)
Goto Top
Hi Dani,

schon mal Wireshark gestartet?

Gruß

Holli
Member: Dani
Dani Aug 27, 2019, updated at Sep 11, 2019 at 15:34:17 (UTC)
Goto Top
Moin Holli,
von wo nach wo sollen wir Wireshark laufen lassen?
Wir bekommen die Problematik bis dato nicht absichtlich reproduziert.


Gruß,
Dani
Member: holli.zimmi
holli.zimmi Sep 02, 2019 at 08:48:53 (UTC)
Goto Top
Hi,

für mich klingt das eher so, das beim Update die Netzwerk-treiber fehlerhaft sind. Da es ja vorher lief.
Das mit dem Wireshark war so gemeint, ob die Pakete öfters verlorengehen bzw. abgewiesen werden.

gruß

Holli
Member: Dani
Dani Sep 05, 2019 at 19:43:33 (UTC)
Goto Top
Guten Abend Holli,
für mich klingt das eher so, das beim Update die Netzwerk-treiber fehlerhaft sind. Da es ja vorher lief.
Hab ich mich mal so weitergegeben. Wobei der betroffene Port auf dem Router/Switch dann brav die Counter hochzählen müsste, oder?

Das mit dem Wireshark war so gemeint, ob die Pakete öfters verlorengehen bzw. abgewiesen werden.
Ist leider nicht so einfach zu Implementieren. Neben der Vielzahl an Servern, mussten wir erstmal ein bisschen Speicherplatz bekommen. Am Tag sind es knapp 60GB an Daten, wo wir mitschneiden. Da kommt innerhalb kurzer Zeit etwas zusammen.


Gruß,
Dani
Member: holli.zimmi
holli.zimmi Sep 06, 2019 at 10:07:39 (UTC)
Goto Top
HI Dani,

jetzt fällt mir gerade ein, wir hatten mal ein Problem mit Broadcom-Netzwerkkarten.
Problem war hierbei das Zusammenspiel von Firmware mit Treiber.

Gruß

Holli
Member: Dani
Dani Sep 18, 2019, updated at Jan 01, 2020 at 16:53:10 (UTC)
Goto Top
Moin,
die Ursache für das Problem konnte gefunden werden. Schuld war die neue Firmware/Software der LoadBalancer. Und zwar sorgte ein Bug in Sticky Sessions dafür, dass die Verbindung warum auch immer über einen anderen VMWare Connection Server verteilt wurde. Das Ganze trat aber nur bei einer bestimmten Anzahl von aktiven Sessions auf dem Load Balancer auf... face-confused


Gruß,
Dani