stefankittel
Goto Top

ESXi Fehler eingrenzen anhand eines Pink-Screens

Hallo,

ich habe diesen Screenshot von einem Absturz eines ESXi erhalten.
whatsapp image 2022-04-15 at 10.23.06.

Es handelt sich um einen Fujitsu-Server der auf ESX-Liste steht und bisher ohne Auffälligkeiten lief.
Er stürzte an zwei aufeinanderfolgenden Tagen nachts ab.

Alle Tests waren negativ.
Seit 2 Wochen läuft er wieder störungsfrei.

Kann Jemand anhand des Screenshots eine Ursache eingrenzen?
RAM, NIC, NT/Strom, Storage?

Ich sehe ganz unten "no place on disk to dump data".
Der ESX bootet von einer 120GB SATA M2 SSD wo sonst nichts drauf ist.
Zu wenig Platz kann also nicht sein. Könnte also ein Fehler beim Zugriff auf die SSD sein.
oder lese ich da zu viel rein?

Stefan

Content-Key: 2665111170

Url: https://administrator.de/contentid/2665111170

Printed on: June 26, 2024 at 08:06 o'clock

Member: radiogugu
Solution radiogugu May 02, 2022 at 10:32:03 (UTC)
Goto Top
Hi.

Auf diversen VMWare Patch Release Seiten wurde daraufhingewiesen, dass dieses Problem wohl behoben wurde.

Für 7.0.1 habe ich das jetzt noch nicht explizit gelesen.

Gibt es einen verfügbaren Patch oder ist der Host auf dem neuesten Stand?

Gruß
Marc
Member: em-pie
Solution em-pie May 02, 2022 at 10:40:53 (UTC)
Goto Top
Moin,

habe mir das filesystem eines ESXi noch nicht genauer angeschaut, aber gibt es für die logs eine eigene Partition? Wenn ja, wie voll ist die?
Member: Nils02
Solution Nils02 May 02, 2022 at 11:04:41 (UTC)
Goto Top
"No place on Disk" wird vermutlich der Übeltäter sein
Member: Looser27
Solution Looser27 May 02, 2022 at 11:44:17 (UTC)
Goto Top
Da steht aber schon noch mehr drin....Kernel Panic....FS Probleme....

Wie warm is es im Serverraum?
Member: Trommel
Solution Trommel May 02, 2022 updated at 15:11:05 (UTC)
Goto Top
Moin,

den Bildschirm kenne ich ! War auch ein Fujitsu und ist alle paar Wochen mal aufgetreten - allerdings noch mit der 6.70, mehr ging nicht (Fujitsu VMware Image). Wir haben damals ein VMware Update gemacht wenn ich mich richtig errinere...

Evtl. mal den ESXi auf Stand bringen (sofern supported), deine Version 7.0.1 Build 16850804 ist 10/2020, aktuell ist 19482537.
https://customerconnect.vmware.com/patch

Trommel
Member: cykes
Solution cykes May 02, 2022 updated at 14:34:53 (UTC)
Goto Top
Hi,

überprüfe mal die Energieeinstellungen sowohl im BIOS als auch im ESXi.
Kannst Du nachvollziehen, zu welcher Uhrzeit der PSOD auftrat, korrelliert das zufällig mit dem Backup. Ich hatte mal einen Fall, da war ein Bug im VMWare-Treiber für den SAS-Controller und genau zum Backup hat der sich verschluckt und auch einen PSOD geworfen.
Ansonsten sollten auch sämtliche Treiber für Storage, LAN/NIC und die Firmware der iRMC auf passendem Stand sein.

Gruß

cykes
Member: ElmerAcmeee
Solution ElmerAcmeee May 03, 2022 at 06:29:46 (UTC)
Goto Top
Moin,
bei den FuSis ist das aus meiner Erfahrung heraus ein Treiberproblem. Einen echten Hardwareschaden der zu nem PSOD führte hatte ich bei ca 30 Servern noch nie.
Die o.g. ESXi Version ist von Oktober 2020. Da dürften mittlerweile auch TreiberUpdates gekommen sein.
Gruß
Member: StefanKittel
StefanKittel May 03, 2022 at 07:56:40 (UTC)
Goto Top
Ich probiere es demnächst mit einer aktuelleren Version von ESXi.
Danke für den Input

Btw. aktuell schnurrt die Kiste wieder...
Vieleicht auch Stromschwankungen durch die USV kombiniert mit ein paar EMP-Signalen und der aktuellen Planetenkonstelation...
Member: Trommel
Trommel May 03, 2022 updated at 10:01:49 (UTC)
Goto Top
Zitat von @StefanKittel:
Vieleicht auch Stromschwankungen durch die USV kombiniert mit ein paar EMP-Signalen und der aktuellen Planetenkonstelation...

Das wirds sein.. da drehen die Festplatten gleich falsch herum face-wink

Trommel