Bluescreen virtualisierte Maschinen (VMWare)
Guten Morgen zusammen,
seit dem wir unsere Hardware Server auf unsere neue VMWare Umgebung migriert haben gibt es öfters Probleme mit 2 Servern (Server 2008 & Server 2008 R2) die öfters mit einem Bluescreen crashen. Die beiden Server laufen auf unterschiedlichen Hosts, somit können wir einen Hardwaredefekt ausschließen. Minidump zeigt von insgesamt 8 Bluescreens, 2 mal ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY, 5 mal PAGE_FAULT_IN_NONPAGED_AREA und in einem keinem Check String. Anscheinend hat die Maschine ein Problem mit den VMWare Treibern.
Anbei die Links zu den Minidumps der einzelnen Server:
Server #1: http://cloud.hilgenberg.cc/public.php?service=files&t=2cec895afb112 ...
Server #2: http://cloud.hilgenberg.cc/public.php?service=files&t=e44c2e6a6fff1 ...
Das schlimmste an der Sache ist, dass dies Terminalserver mit insgesamt ca. 70 User sind und wir echt auf'm Schlauch stehen.
Daher bitte ich um Tipps was wir ändern können damit es wieder stabil läuft.
Danke im Voraus!
seit dem wir unsere Hardware Server auf unsere neue VMWare Umgebung migriert haben gibt es öfters Probleme mit 2 Servern (Server 2008 & Server 2008 R2) die öfters mit einem Bluescreen crashen. Die beiden Server laufen auf unterschiedlichen Hosts, somit können wir einen Hardwaredefekt ausschließen. Minidump zeigt von insgesamt 8 Bluescreens, 2 mal ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY, 5 mal PAGE_FAULT_IN_NONPAGED_AREA und in einem keinem Check String. Anscheinend hat die Maschine ein Problem mit den VMWare Treibern.
Anbei die Links zu den Minidumps der einzelnen Server:
Server #1: http://cloud.hilgenberg.cc/public.php?service=files&t=2cec895afb112 ...
Server #2: http://cloud.hilgenberg.cc/public.php?service=files&t=e44c2e6a6fff1 ...
Das schlimmste an der Sache ist, dass dies Terminalserver mit insgesamt ca. 70 User sind und wir echt auf'm Schlauch stehen.
Daher bitte ich um Tipps was wir ändern können damit es wieder stabil läuft.
Danke im Voraus!
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 259657
Url: https://administrator.de/contentid/259657
Ausgedruckt am: 24.11.2024 um 12:11 Uhr
18 Kommentare
Neuester Kommentar
Hi,
Was ist das denn für Hardware? Steht die auf der HCL von VMware?
Wird die Hardware überbucht? (RAM, CPU)
E.
Zitat von @Julian94:
Die beiden Server laufen auf unterschiedlichen Hosts, somit können wir einen Hardwaredefekt ausschließen.
Äh, sorry. Nein, kann man nicht wirklich. Die Wahrscheinlichkeit mag jetzt geringer sein, aber ausgeschlossen ist es deswegen nicht!Die beiden Server laufen auf unterschiedlichen Hosts, somit können wir einen Hardwaredefekt ausschließen.
Was ist das denn für Hardware? Steht die auf der HCL von VMware?
Wird die Hardware überbucht? (RAM, CPU)
E.
Moin,
die ESXi's, die Windows VMs und die VMWare Tools sind auf akteuellesten Stand gepatcht?
Ggfs. einfach mal einen Case bei VMware aufmachen.
/EDIT:
Schraub das mal zurück, das max. die Anzahl der vorhandenen Cores verwendet wird. Ggfs. auch mal HT in den VMs abschalten.
lg,
Slainte
die ESXi's, die Windows VMs und die VMWare Tools sind auf akteuellesten Stand gepatcht?
... Terminalserver ...
Sind alle verwendeten Druckertreiber für den TS-Betrieb zugelassen/zertifiziert?Ggfs. einfach mal einen Case bei VMware aufmachen.
/EDIT:
CPUs aber voll ausgereizt mit 32 verteilten Kernen.
Der Xeon hat doch nur 8 kerne...x2 = 16 - also doch überbucht.Schraub das mal zurück, das max. die Anzahl der vorhandenen Cores verwendet wird. Ggfs. auch mal HT in den VMs abschalten.
lg,
Slainte
Zitat von @Julian94:
Ja sind so gut wie auf dem neusten Stand wurden Anfang Januar aktualisiert.
Nein sind nicht alle zertifiziert, laufen aber im Typ 3 Benutzermodus, also sollte im schlimmsten Fall nur der Benutzer crashen.
Wenn diese das problem wären, dann hätten sie doch auch schon Probleme bereiten müssen, als das teil noch auf Blech lief.Ja sind so gut wie auf dem neusten Stand wurden Anfang Januar aktualisiert.
Nein sind nicht alle zertifiziert, laufen aber im Typ 3 Benutzermodus, also sollte im schlimmsten Fall nur der Benutzer crashen.
Habe ich nicht durch Hyperthreading statt 16 - 32 Kerne zur Verfügung?
Jaein.Logisch ja. Physisch natürlich nein, wie auch bei einer Hardware-Kiste.
VMware ist inzischen so weit, dass bei aktiviertem HT die vCPU so lange wie möglich auch auf einem Core bzw. Sockel zusammengefasst bleiben.
Das hängt im wesentlichen davon ab, wie diese Core verteilt sind. Alle auf einen Gast, auf weinige Gäste oder viele Gäste.
E.
grade mal die Server1.zip angeschaut. Scheinen noch alte (Chipsatz)teiber im System zu hängen.
Bluescreenview von nirsoft bringt da einiges an .sys Dateien die im Zusammenhang mit den Crashs zu sehen sind (usbccbd.sys, parport.sys,....). Musst mal recherchieren wofür die im einzelnen verantwortlich sind oder waren.
server2.zip ist da weniger Aufschlussreich auf den ersten Blick vermute aber durch den Umzug ähnliche Ursachen
Edit zum Screenshot: Welche Version vom vSphere (nehme ich jetzt mal an) habt ihr am laufen? Gibts einen Grund warum die HW Version der VMs noch auf Version 8 ist?
Habt ihr auf den 4 IBM Servern je eine VM? oder sieht jeder IBM Server so aus wie auf dem Screenshot?
Da sind 3 2003er Server, die ja laut deiner Beschreibung nicht crashen, aber nur eine 2008er, der crasht?
Welche Server Edition hat der 2008er Server? Standard? Dann kannst den dem zB gar nicht soviel RAM zuweisen (max 32GB).
Langsam kommen da noch mehr Fragen bzgl. der Umgebung auf bei mir. Wäre sinnig die nochmal genau und ausführlich zu skizzieren.
Bluescreenview von nirsoft bringt da einiges an .sys Dateien die im Zusammenhang mit den Crashs zu sehen sind (usbccbd.sys, parport.sys,....). Musst mal recherchieren wofür die im einzelnen verantwortlich sind oder waren.
server2.zip ist da weniger Aufschlussreich auf den ersten Blick vermute aber durch den Umzug ähnliche Ursachen
Edit zum Screenshot: Welche Version vom vSphere (nehme ich jetzt mal an) habt ihr am laufen? Gibts einen Grund warum die HW Version der VMs noch auf Version 8 ist?
Habt ihr auf den 4 IBM Servern je eine VM? oder sieht jeder IBM Server so aus wie auf dem Screenshot?
Da sind 3 2003er Server, die ja laut deiner Beschreibung nicht crashen, aber nur eine 2008er, der crasht?
Welche Server Edition hat der 2008er Server? Standard? Dann kannst den dem zB gar nicht soviel RAM zuweisen (max 32GB).
Langsam kommen da noch mehr Fragen bzgl. der Umgebung auf bei mir. Wäre sinnig die nochmal genau und ausführlich zu skizzieren.
Nene schraub das mal auf 16 Cores - also 2 CPUs a 8 Cores - zurück. Und bei RAM >64GB wäre ich auch vorsichtig, da das (Performance-)Probleme mit NUMA geben kann.
Meiner Erfahrung nach sollte man übrigens ~30 User pro TS nicht überschreiten. Lieber ein paar mehr VMs aufsetzen mit 4-6 Cores und 16 od 24 GB RAM und die Sache läuft um einiges sauberer.
Meiner Erfahrung nach sollte man übrigens ~30 User pro TS nicht überschreiten. Lieber ein paar mehr VMs aufsetzen mit 4-6 Cores und 16 od 24 GB RAM und die Sache läuft um einiges sauberer.
... von der Telekom angeboten und ausgeführt und er sagte uns das wir von 32 Cores ausgehen.
lol - danke das Bestätigt mein Bild von "denen" sind die 2003er Server (die mit den 8GB RAM) Standard oder Enterprise/Datecenter?Zitat von @SlainteMhath:
Meiner Erfahrung nach sollte man übrigens ~30 User pro TS nicht überschreiten. Lieber ein paar mehr VMs aufsetzen mit
4-6 Cores und 16 od 24 GB RAM und die Sache läuft um einiges sauberer.
So pauschal kann man das (leider) nicht sagen.Meiner Erfahrung nach sollte man übrigens ~30 User pro TS nicht überschreiten. Lieber ein paar mehr VMs aufsetzen mit
4-6 Cores und 16 od 24 GB RAM und die Sache läuft um einiges sauberer.
Wir habe hier bei uns 60 User auf
- 8 vCPU
- 32 GB RAM
- Windows 2008 R2
- VMware 5.1
Und davon jeweils 4 VM auf einem Blech. (2x E5-2680, mit HT, zusammen = 32 log. Core)
Und das Ganze läuft performant.
E.
Wenns die 2008 (oderR2) Standard ist, machen 73664MB Ram schon keinen Sinn. Limit ist 32GB. Zumal laut Screenshot nur 22% belegt sind. Sollte also kein Problem sein, diese runter zu setzen.
Die 12 User auf dem zweiten sind doch okay. 60 User sind in der Tat viele, aber nicht unmöglich. Je nach Anwendung halt.
Auch die Verteilung der VMs auf die Hosts klingt realistisch.
Schau dir wie oben geschrieben mal die Dumps mit Blescreenview an und prüfe welche (vermutlich) Treiber oder andere Software dahinter stecken.
Die 12 User auf dem zweiten sind doch okay. 60 User sind in der Tat viele, aber nicht unmöglich. Je nach Anwendung halt.
Auch die Verteilung der VMs auf die Hosts klingt realistisch.
Schau dir wie oben geschrieben mal die Dumps mit Blescreenview an und prüfe welche (vermutlich) Treiber oder andere Software dahinter stecken.
Guten Abend,
Die erste Variante würde bedeuten, dass alle unnötigen Treiber natürlich nach wie vor installiert sind und gelöscht werden müssen. Ich habe auch schon erlebt, dass VMs die nicht nach Best Practice konfiguriert sind ebenfalls Bluescreens auslösen können.
Gruß,
Dani
Was ist das denn für Hardware? Steht die auf der HCL von VMware?
Steht die Server in der Liste, Ja oder Nein?seit dem wir unsere Hardware Server auf unsere neue VMWare Umgebung migriert
Migration heißt . Mit VMWare Converter oder frisch installiert nach den Best Practice-Vorgaben seitens VMWare?Die erste Variante würde bedeuten, dass alle unnötigen Treiber natürlich nach wie vor installiert sind und gelöscht werden müssen. Ich habe auch schon erlebt, dass VMs die nicht nach Best Practice konfiguriert sind ebenfalls Bluescreens auslösen können.
Gruß,
Dani