Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

ESXi Host Crash beim Herunterfahren einer VM mit Passthrough

Mitglied: TCS2408

TCS2408 (Level 1) - Jetzt verbinden

08.07.2019, aktualisiert 09.07.2019, 649 Aufrufe, 9 Kommentare, 4 Danke

Hallo zusammen,

ich war vor Kurzem mit dem Problem konfrontiert, dass sich mein ESXi 6.7 U2 mit dem Purple Screen of Death verabschiedet hat, als ich eine VM heruntergefahren habe. Ich habe leider auf deutsch keine Beiträge gefunden, in denen das Problem gelöst wurde. Im Englischen gibt es dazu gefühlt hunderte Beiträge, bei denen ich 2 mit der 'Lösung' gefunden habe.

Zum Symptom:
Beim Herunterfahren der VM mit PCI-E Passthrough stürzt die VM und der Host (Purple Screen of Death) gemeinsam ab (Bild im Anhang)

Mein Testszenario:
HP DL 560 G8
Bios vom 24.05.2019 & Bios vom 30.06.2013
4x E5-4650L
128GB DDR3 ECC RAM
2x AMD Sky 500 für Passthrough
VMware ESXi 6.5 U2 & VMware ESXi 6.7 U1 & VMware ESXi 6.7 U2
2x HP Netzteil 750w

Grundlegende Informationen:
Das Problem tritt allen getesteten ESXi Konstellationen auf, woraufhin ich das Hostsystem nahezu ausgeschlossen habe. Laut anderen Berichten aus dem Netz, soll das Problem bei VMware ESXi 5.5 deutlich weniger auftreten, aber dennoch bei einigen vorhanden sein. Ich habe dies selbst leider nicht gegen geprüft.
Die verwendete Hardware scheint auch keine Rolle zu spielen, da unter anderen Comsumer Boards von MSI, sowie Systeme von Supermicro mit beteiligt waren.
Laut dem was ich gelesen habe begrenzt sich das Problem jedoch auf ältere PCI-E Geräte. Beispielsweise meine eingesetzte AMD Sky500 (baugleich AMD S7000), was die Generation Radeon HD 7700 HD 7800 ist. Andere hatten Probleme mit Consumer Karten der Radeon HD6700 & 6800 Serien, sowie mit AMD Karten aus der Fury Serie. Auch Nvidia Karten der GeForce 600er Serie kamen in einigen Beiträgen vor. Mit neueren Grafikkarten Generationen konnte ich keine Beiträge mit solchen Problemen finden. Auch betroffen sind Raid Controller, sowie Netzwerk Adapter. Bei diesen habe ich jedoch aktuell keine Auflistung. Sobald ich die Beiträge wieder finde und es jemanden interessiert, werde ich diese ergänzen.

Das Problem beschränkt sich auf den PCI-E Bus, der beim Beenden der VM scheinbar nicht vollständig zurückgesetzt wird. Dies führt zu einer fehlerhaften Kommunikation des PCI-E Gerätes bei der Übergabe an den Host. Unter Vorbehalt, da auch das nur von anderen Nutzern in anderen Foren geschrieben wurde und ich die Richtigkeit nicht überprüfen kann. Dies klingt jedoch für mich einleuchtend, weshalb ich es nicht vorenthalten wollte.

Die Problemlösung:
Eine offizielle Lösung seitens VMware, konnte ich leider nicht finden.

Als provisorische Lösung hat ein Nutzer geschrieben, dass unter Windows die Deaktivierung des Gerätes im Gerätemanager den Absturz des Hostsystems verhindert. Dies habe ich unter allen oben genannten ESXi Versionen mit beiden Bios Versionen getestet.
Ohne die Deaktivierung der Grafikkarte im Gerätemanager liegt die Absturzwahrscheinlichkeit bei ca. 90%. Seit der händischen Deaktivierung im Gerätemanager vor dem Herunterfahren der VM habe ich keine Abstürze in den Testreihen gehabt. Unter ESXi 6.5 U2 & ESXi 6.7 U1 waren es jeweils 3 Testläufe, die problemlos klappten. Da ich jedoch ESXi 6.7 U2 im täglichen Einsatz habe habe ich es hierbei entsprechend häufiger getestet. Hierbei verliefen die letzten 15 Versuche problemlos.

Zusatzinformationen:
Bis bei meinem Server das POST durchgelaufen ist vergehen mal locker 5 Minuten, dann noch der Boot des ESXi und der Virtuellen Maschinen. Bis alles für den Test Bereit ist vergehen Schnell mal 15-20 Minuten, sowie diverse Testeinstellungen im Bios. Insgesamt hat mich das Testen, sowie die Suche nach Informationen mehrere Tage gekostet. Daher dachte ich mit bevor es noch mehr von euch so geht wie mir, schreibe ich noch einen Beitrag hier im Forum.

Kurzer Disclaimer:
Ich habe davon selbst keinen Mehrwert und mache dies nach meiner Arbeit und habe sonst mit Administration oder Serversystemen nicht viel zu tun. Lediglich privates Interesse was mich dazu treibt.

Falls noch jemand dieses Problem hat, hoffe ich denjenigen damit helfen zu können und freue mich über Kommentare und Anregungen.
1 - Klicke auf das Bild, um es zu vergrößern
Mitglied: sabines
09.07.2019 um 06:41 Uhr
Moin,

bist Du Dir sicher, dass die AMD Sky 500 überhaupt vom ESXi unterstützt wird?
Im VMware Compatibility Guide kann ich hierzu ad hoc nichts finden:
https://www.vmware.com/resources/compatibility/search.php

Gruss
Bitte warten ..
Mitglied: Ex0r2k16
09.07.2019 um 08:44 Uhr
Hi,

was macht die AMD Karte in dem Server denn? Eine Art 3D VDI oder nix?

Ansonsten hast du bereits selbst die Lösung geschrieben. Consumer Karten gehören per se schon mal nicht einen Server. Daher hinkt dein Vergleich mit älteren Radeon HDs oder Geforce's leider etwas. Ergo: AMD raus und eine Grakka rein die supportet ist.

Alles andere kann klappen, muss aber nicht. Da viele hier Server eher beruflich fahren, wird hier glaube ich auch weniger mit Grakkas in Servern rumgefrickelt. Oder haben wir hier ein paar Citrix 3D Experten? Aber selbst wenn fahren die ziemlich sicher auch nicht mit so alten (kleinen) Karten Da dreht man sich also im Kreis.

Gruß
Ex0r
Bitte warten ..
Mitglied: TCS2408
09.07.2019 um 13:54 Uhr
Hallo,
die Sky500 selbst besitzen keine Treiber fürs ESXi. Die baugleichen S7000 dagegen schon. Angeblich nur bis ESXi 6.0, das ist jedoch nicht weiter schlimm. Bei Passthrough spielt das jedoch eine untergeordnetere Rolle, da ESXi mit der GPU wenig zu tun hat.

Beste Grüße
Bitte warten ..
Mitglied: TCS2408
09.07.2019 um 14:09 Uhr
Hallo,

Ja das ganze soll einmal eine VDI / Cloud Gaming Umgebung werden.

Natürlich haben Grundsätzlich Consumer Karten im Server in Professionellen Umgebungen nichts Verloren.
Dies ist aber Punkt A: ein Server für den privaten Einsatz, weswegen ich aufs Geld achte und andere, die Consumerkarten einsetzen entsprechend auch.
Und Punkt B: Auch Serverkarten oder Professionelle GPUs sind vom Board und co großteils nicht anders als Consumerkarten. Lediglich die Identifikation der Karten variiert.
Da nicht so viele Privatleute, die sich ein ESXi aufsetzen (Consumerhardware I7 bspw.) Server GPUs verwenden ist der Input von dieser Seite natürlich auch entsprechend gering. Hätten meine AMD RX480 in meinen Server gepasst, hätte ich nie mit dem AMD Sky500 angefangen, aber leider passt nur single Slot. Und auch diese habe ich nur gewählt, weil ich diese aus den USA für 35€ das Stück geschossen habe. Zum testen alle mal gut genug. 250-400€ für eine Testkarte ausgeben ist mir dann leider zu viel für eine aktuelle GPU im Serverbereich (Gebraucht).

Natürlich ist der Beitrag nicht unbedingt an die Admins gerichtet, die jeden Tag mit Servern umgeben sind und diese im komerziellen Einsatz haben. Dies ist eher Falls einmal jemand so ein Problem hat und etwa so spielen möchte wie ich. Bzw. da ich im Außendienst unterwegs bin und daher in vielen Firmen mich rumtreibe, sehe ich auch ab und zu kleinere Unternehmen, die Bastelserverlösungen im Einsatz habe, bei denen ich mir manch einmal denke 'Wie lange das noch so funktionieren soll'. Also nicht nur ich pfusche im privaten Bereich an meinem Server rum auch bei einigen Firmen ist so etwas gang und gebe.
Bitte warten ..
Mitglied: sabines
10.07.2019 um 11:48 Uhr
Also hast Du eine Beitrag geschrieben, für den Einsatz unsupporteter Hardware in einer ungewöhnlichen und ziemlich seltenen Konstellation, right?
Bitte warten ..
Mitglied: Ex0r2k16
10.07.2019 um 11:49 Uhr
...die dann auch noch abstürzt.
Bitte warten ..
Mitglied: TCS2408
10.07.2019 um 21:06 Uhr
Hallo,

nicht unterstützte Hardware, wenn man das ganze engstirnig betrachtet, ja. Die S7000 von AMD ist baugleich und supported. Dies Tritt aber auch bei anderer Hardware auf, bei der ich mir nicht vorstellen kann, dass alle nicht unterstützt sind. Da bin ich aber aktuell noch auf der Suche, um eine Liste zu erstellen.

Aber natürlich ist es eine seltene Konstellation. Es wäre ja schlimm, wenn in allen Unternehmen täglich die ESXi abstürzen würden.

Dieser Beitrag dient auch lediglich der Information, falls jemand mal danach suchen sollte. Beispielsweise wie ich, jemand mit einem Server und Bastelfreude. Das Thema wird keinen Admin interessieren, der sich von einem Systemhaus ausstatten lässt und nur 100% Zertifizierte und erprobte Hardware einsetzt. Derjenige wird sich bei Problemen ans Systemhaus wenden und das zu den ihren Problem machen. Wer jedoch Server-Umgebungen Stück für Stück aktualisiert und in neue Server ältere Raid Controller einbaut kann zu diesem Problem kommen. (Neben Privatpersonen - Kleinere Unternehmen bspw.)
Bitte warten ..
Mitglied: holli.zimmi
16.07.2019 um 08:17 Uhr
Hi,

ich danke Dir trotzdem. für den Beitrag. Ich habe auch nicht soviel Knete, muß trotzdem alles möglich lernen.

Gruß

Holger
Bitte warten ..
Mitglied: Ex0r2k16
16.07.2019 um 08:29 Uhr
Hey Holger,

sorry für etwas OT, aber voll esxi (free) kompatible Server und auch Storage Systeme kannst du gut und günstig in der Bucht schießen. Zum Üben perfekt.
Bitte warten ..
Ähnliche Inhalte
Humor (lol)
Paperport14 - Crash
Tipp von HenereHumor (lol)

Servus zusammen, ich habe mich heute 4h mit einem Paperport 14.5 Patch1 auf einem W10 1803 herumgeprügelt. AppCrash. Sehr ...

Vmware

VMware ESXi 6.0 Update 2 hat den echten HTML5-"Host Client" freigeschaltet

Tipp von broeckerVmware4 Kommentare

"heimlich mit Update 2 eingeführt" und einfach praktisch: zum Desaster-Recovery, zum Konfigurieren vor der Einbindung in ein VCenter und ...

DSL, VDSL

PPPoE-Passthrough in Fritzbox-7490-Laborversion (wieder?) aufgetaucht

Information von LochkartenstanzerDSL, VDSL8 Kommentare

Hallo, Ich spiele gerade mit Laborversionen herum (aktuell 113.06.36-31855 BETA) und dabei bin ich zufällig darüber gestolpert, daß anscheinend ...

Vmware

VMware Update für den ESXi 5.5 verfügbar

Information von sabinesVmware

Nach dem ganzen Hickhack um Update mit Microcode Anpassungen und Rückzug, gibt es nun für den ESXi 5.5 ein ...

Neue Wissensbeiträge
Backup

Veeam Agent für MS Windows - neue Version verfügbar (bedingt jedoch offenbar .NET Framework 4.6)

Information von VGem-e vor 23 StundenBackup

Moin Kollegen, einer unserer Server zeigte grad an, dass für o.g. Software ein Update verfügbar ist. Ob ein evtl. ...

Python

Sie meinen es ja nur gut - Microsoft hilft python-Entwicklern auf unnachahmliche Weise

Information von DerWoWusste vor 2 TagenPython2 Kommentare

Stellt Euch vor, Ihr nutzt python unter Windows 10 und skriptet damit regelmäßig Dinge. Nach dem Update auf Windows ...

Sicherheits-Tools

TrendMicro Worry-Free Business Security 10.0 SP1 steht in Englisch bereit mit Unterstützung für Windows 10 1903 (May Update)

Information von VGem-e vor 2 TagenSicherheits-Tools1 Kommentar

Moin Kollegen, Dann kommt wohl demnächst auch die deutschsprachige/europäische Version zur Auslieferung. Gruß VGem-e

Batch & Shell
PowerShell Konferenz - Videos online
Information von NetzwerkDude vor 3 TagenBatch & Shell

Abend, die Tage werden Videos der Talks von der diesjährigen EU Powershell Konferenz hochgeladen, sind einige Interessante dabei: MFG ...

Heiß diskutierte Inhalte
Google Android
Anbieter für Diensthandys
Frage von Pat.batGoogle Android24 Kommentare

Hallo zusammen, ich bin seit einiger Zeit zuständig für die Diensthandys bei uns in der Behörde. Eine Management Software ...

Windows Server
Windows Server 2016 einrichten
Frage von borjiaWindows Server20 Kommentare

Ich würde gerne einen Server einrichten, erstmal nur mit DNS und AD. Habe mich die letzten Wochen durch diverse ...

Exchange Server
Vorgehen um von Tobit auf Exchange zu wechseln
Frage von Martin1987Exchange Server17 Kommentare

Guten Abend Ich habe den Auftrag erhalten, unser Mail von David zu Outlook zu wechseln. Wie muss ich da ...

Microsoft Office
Office 365 eMail via Website verschicken
Frage von BiBeSoMicrosoft Office16 Kommentare

Hallo, kann man im Office 365 eMails anlegen welche zum versenden (smtp) für die Website funktionieren ? Muss man ...