dani
Goto Top

Probleme nach Aktualisierung von VMWare Horizon und Co

Guten Abend zusammen,
es geht - mal wieder - um Virtual Desktop Infrastructure welche unter VMWare Horizon 7 betrieben wird.

Für den Zugriff aus dem Internet gibt es mehrere Unified Access Gateways (UAG), welche hinter Load Balacaner "versteckt" sind. Die UAGs zeigen widerrum auf einem Load Balancer (via DNS-Name der Farm) hinter dem mehrere Connection Server (CS) sich befinden. Die CSs bedienent ausschließlich die Zugriffe aus dem Internet. Es wird der Zugriff via PCoIP als auch Blast (Extreme) zur Verfügung gestellt. Das hängt davon ab, was der Anwender macht.

Seit wir die Komponenten auf die jeweils neuste Version (ESXi 6.7, vCenter Server Appliance 6.7, Horizon: 7.9, UAG: 3.6) aktualisiert haben stellen wir fest, dass es die durschnittliche Auslastung auf den Load Balancer bzw. UAGs zugenommen hat. Obwohl die Anzahl der parallelen Verbindungen bzw. notwendigen Bandbreite fast gleich geblieben ist. Es kommt sogar zu Verbindungsfehlern oder sogar Abbrüche.

Wir haben bereits
  • die Internetleitungen auf Paketeverluste bzw. das QoS überprüfen lassen.
  • die Router durch den ISP tauschen lassen.
  • die Firmware auf dem Load Balancer und Firewalls aktualisiert.
  • den UAG mehr CPUs und Arbeitsspeicher zugewiesen.
  • Kown Issue durchgearbeitet - nichts relevantes gefunden.
  • Tonnen an Protokolldateien an VMWare übermittelt.

Teile der Infrakstruktur (Firewalls, Load Balancer) werden auch für andere Services genutzt. Dort läuft vermeidlich alles rund. Die Anzahl der Tickets im ServiceDesk sind im normalen Bereich. Somit hätte ich die genannten Komponenten erst einmal ausgeschlossen. Das größte Problem für uns ist, wir können es nicht absichtlich reproduzieren.

Hat jemand bei sich oder einem Kunden ähnliche Beobachtungen gemacht?


Gruß,
Dani

Content-Key: 488802

Url: https://administrator.de/contentid/488802

Ausgedruckt am: 29.03.2024 um 14:03 Uhr

Mitglied: GrueneSosseMitSpeck
GrueneSosseMitSpeck 26.08.2019 aktualisiert um 08:13:47 Uhr
Goto Top
willkommen im Updatedjungel von VMware... sowas macht man normalerweise mit einem Servicetechniker zusammen, weil das schon mal vorkommen kann daß eine komplette Farm oder ein Loadbalancer-Cluster tot ist wenn man das nicht 100% richtig macht. Ernsthaft, laß da jemand kommen, das sind unternehmenskritische Infrastrukturelemente, wo das Schwarmwissen nicht gut genug ist.

Angenommen hier sagt jemand "oh das hatten wir auch dann haben wir in der Datei soundso ein Flag von 1 auf 0 gesetzt dann war alles gut", du tust das und nächste Woche ist dein Netz gehackt. Also ehrlich, dafür ist man haftbar.... so wie auch der Architekt dran ist wenn eine Brücke einstürzt.
Mitglied: Dani
Dani 26.08.2019 aktualisiert um 09:44:55 Uhr
Goto Top
Moin,
sowas macht man normalerweise mit einem Servicetechniker zusammen, weil das schon mal vorkommen kann daß eine komplette Farm oder ein Loadbalancer-Cluster tot ist wenn man das nicht 100% richtig macht
Keine Sorge. Wir haben eigene, zertifizierte VMWare Teams hier, die den ganzen Tag nichts anders machen.

Angenommen hier sagt jemand "oh das hatten wir auch dann haben wir in der Datei soundso ein Flag von 1 auf 0 gesetzt dann war alles gut", du tust das und nächste Woche ist dein Netz gehackt.
Einfach so wird nichts übernommen. Und schon gar nicht von mir. Evtl. Vorschläge und Lösungsansätze werden erst einmal intern geprüft und ggf. mit dem Hersteller diskutiert.

Also ehrlich, dafür ist man haftbar.... so wie auch der Architekt dran ist wenn eine Brücke einstürzt.
Ist uns allen bewusst.


Gruß,
Dani
Mitglied: holli.zimmi
holli.zimmi 27.08.2019 um 09:13:41 Uhr
Goto Top
Hi Dani,

schon mal Wireshark gestartet?

Gruß

Holli
Mitglied: Dani
Dani 27.08.2019, aktualisiert am 11.09.2019 um 17:34:17 Uhr
Goto Top
Moin Holli,
von wo nach wo sollen wir Wireshark laufen lassen?
Wir bekommen die Problematik bis dato nicht absichtlich reproduziert.


Gruß,
Dani
Mitglied: holli.zimmi
holli.zimmi 02.09.2019 um 10:48:53 Uhr
Goto Top
Hi,

für mich klingt das eher so, das beim Update die Netzwerk-treiber fehlerhaft sind. Da es ja vorher lief.
Das mit dem Wireshark war so gemeint, ob die Pakete öfters verlorengehen bzw. abgewiesen werden.

gruß

Holli
Mitglied: Dani
Dani 05.09.2019 um 21:43:33 Uhr
Goto Top
Guten Abend Holli,
für mich klingt das eher so, das beim Update die Netzwerk-treiber fehlerhaft sind. Da es ja vorher lief.
Hab ich mich mal so weitergegeben. Wobei der betroffene Port auf dem Router/Switch dann brav die Counter hochzählen müsste, oder?

Das mit dem Wireshark war so gemeint, ob die Pakete öfters verlorengehen bzw. abgewiesen werden.
Ist leider nicht so einfach zu Implementieren. Neben der Vielzahl an Servern, mussten wir erstmal ein bisschen Speicherplatz bekommen. Am Tag sind es knapp 60GB an Daten, wo wir mitschneiden. Da kommt innerhalb kurzer Zeit etwas zusammen.


Gruß,
Dani
Mitglied: holli.zimmi
holli.zimmi 06.09.2019 um 12:07:39 Uhr
Goto Top
HI Dani,

jetzt fällt mir gerade ein, wir hatten mal ein Problem mit Broadcom-Netzwerkkarten.
Problem war hierbei das Zusammenspiel von Firmware mit Treiber.

Gruß

Holli
Mitglied: Dani
Dani 18.09.2019, aktualisiert am 01.01.2020 um 17:53:10 Uhr
Goto Top
Moin,
die Ursache für das Problem konnte gefunden werden. Schuld war die neue Firmware/Software der LoadBalancer. Und zwar sorgte ein Bug in Sticky Sessions dafür, dass die Verbindung warum auch immer über einen anderen VMWare Connection Server verteilt wurde. Das Ganze trat aber nur bei einer bestimmten Anzahl von aktiven Sessions auf dem Load Balancer auf... face-confused


Gruß,
Dani