butterbot
Goto Top

ESXi Boot Error 6 Buffer too small

Moin Moin,

ich habe heute morgen erschreckend feststellen müssen, das mein geliebter ESXi Host nicht mehr erreichbar war.
Darauf hin habe ich mir das genauer angeguckt und konnte so schnell auch nichts machen.
Das Mainboard reagierte garnicht mehr, selbst beim drücken des Ein/Aus Knopfes länger als 1 Minute, regte sich nichts, also musste ich den Stecker ziehen.

Beim Booten kommt nun:

Loading /imgdb.tgz
Loading /state.tgz
Error 6 (Buffer too small) while decompressing data
   input(13859), output(1422546122)
gzip_extract failed for /state.tgz (size 13876): Buffer to small
Error 6 (Buffer too small) while loading module: /state.tgz
Compressed MD5: 25351bd1282b770d0c05f873d7053b97
Decompressed MD5: 00000000000000000000000000000
Fatal error: 6 (Buffer too small)

Zuerst dachte ich, okay, der Ram is durch, den wollte ich eh austauschen und erweitern (derzeit 16GB).
Um das zu prüfen, startete ich ein Linux und installierte memtester, er testet gerade 10GB läuft aber soweit gut....
Ich werde den Test mal durchlaufen lassen und falls der OK ist, installiere ich ein neues ESXi drüber (bzw. machen ein Update), da ich gelesen hatte, dass manche das Problem bei der installation eines ESXi's hatten und eine Datei kaputt is oder so...
Dort sollte dann ein neues Image helfen, mal gucken.

Kennt jemand das Problem?


Liebe Grüße

Content-ID: 3571979265

Url: https://administrator.de/contentid/3571979265

Ausgedruckt am: 21.11.2024 um 22:11 Uhr

cykes
cykes 07.08.2022 um 11:54:42 Uhr
Goto Top
Moin,

Deine Frage hat ziemlich wenig Informationsgehalt, weder die aktuell (nicht) laufende ESXi Version hast Du genannt, noch die Plattform auf der das ganze läuft (u.a. Server-Hardware - welche? Desktop Hardware - welche? Storage Controller, Platten/SSDs usw.), sowie das Bootmedium des ESXi.
Könnte bspw. auch nur eine defekte/leere CMOS Batterie sein, kann aber auch was aufwändigeres sein.

So kann man schlecht zielführende Tipps geben. Bevor Du jetzt auf Verdacht Hardware tauschst, ergänze erstmal die Infos, dann kann man weitersehen. Oder ist das Dein Garagenserver? face-wink

Gruß

cykes
Penny.Cilin
Penny.Cilin 07.08.2022 um 12:19:57 Uhr
Goto Top
hallo,

was wir wissen:
  • ESXi
  • hat 16 Gib RAM

... was wir nicht wissen:
  • alles was Du verschweigst!

Wie man eine Frage richtig stellt!

Gruss Penny.
Penny.Cilin
Penny.Cilin 07.08.2022 um 12:22:08 Uhr
Goto Top
Und um die Anmerkung @cykes zu ergänzen:
Es könnte auch zu kleine root Partition / Bootmedium sein.

Gruss Penny.
cykes
cykes 07.08.2022 um 12:31:30 Uhr
Goto Top
Zitat von @Penny.Cilin:
Es könnte auch zu kleine root Partition / Bootmedium sein.
Oder einfach defekte SD-Card/Stick/wasauchimmer_Bootmedium ...
ButterBot
ButterBot 07.08.2022 um 12:42:48 Uhr
Goto Top
Zitat von @cykes:

Deine Frage hat ziemlich wenig Informationsgehalt, weder die aktuell (nicht) laufende ESXi Version hast Du genannt, noch die Plattform auf der das ganze läuft (u.a. Server-Hardware - welche? Desktop Hardware - welche? Storage Controller, Platten/SSDs usw.), sowie das Bootmedium des ESXi.
Könnte bspw. auch nur eine defekte/leere CMOS Batterie sein, kann aber auch was aufwändigeres sein.

So kann man schlecht zielführende Tipps geben. Bevor Du jetzt auf Verdacht Hardware tauschst, ergänze erstmal die Infos, dann kann man weitersehen. Oder ist das Dein Balkonserver? face-wink


Moin Moin,

alles klar, danke für die Info.
Das ganze läuft derzeit auf einem ROG STRIX B450-F GAMING mit AMD Ryzen7 2700X und 16GB Ram mit ESXi 6.7.0, jaa auch nicht mehr das neuste.

Dort sind mehrere Seagate Platten ab 4TB HDD eingebaut, eine SSD von Crucial mit 1TB für die VM's und eine 500GB WD Platte für das ESXi Betriebssystem, welche noch so rumflog.
Grafikkarte, is eine von ASUS aber nur eine kleine Passiv, wird nicht groß benötigt.
Alles derzeit direkt ans Mainboard angeschlossen, da der alte RAID Controller sich verabschiedet hat.
CMOS Batterie ist nicht wirklich alt (2-3 Jahre) und sollte noch funktionieren.

Das System lief jetzt ca. 4 Monate ohne Probleme, bis jetzt.

Ja, das system ist gerade die alternative zum Balkonserver, bzw. Gartenserver.
Die habe ich aber auch gerade temporär hochgefahren und stelle die wichtigen Maschinen aus dem Backup wieder her, damit wenigstens kleinere Sachen wieder laufen. (DHCP, MQTT, UniFi, SmartHome halt...)

Der RAM Test unter Linux lief problemlos durch, ich habe jetzt versucht ein Update von ESXi 6.7.0 auf 6.7.0 durchzuführen. Ich dachte, dass das geht, schlug dann aber bei 79% mit dem Fehler:

------ An unexpected error occurred ------
See logs for details

OSError: [Errno 5] Input/output error

( Ja "[Errno 5]" ist richtig face-wink )

Nun habe ich den ESXi Server neu installiert, also ein Update bot er mir nicht mehr an, die VM's waren ja zum Glück auf der SSD, daher muss ich die Grundstruktur neu erstellen, aber die VM's nicht neu hochziehen....
Der Host fährt erstmal soweit hoch und scheint zu funktionieren.

Ich selber kann den Fehler nicht ganz nachvollziehen, komisch..
cykes
Lösung cykes 07.08.2022 um 13:16:59 Uhr
Goto Top
Das bringt zumindest etwas mehr Licht ins Dunkle face-wink

Wenn ich das richtig rausgefiltert habe, ist die 500er WD das Bootmedium. Die würde ich ggf. mal einer eingehenden Untersuchung unterziehen. Ggf. auch Umstieg auf einen >=16GB USB Stick in Erwägung ziehen.

Für die Ursache kann man nur Vermutungen anstellen: Vermutlich hing der ESXi, bevor Du den Stecker gezogen hast, in einem PSOD (aka. Absturz). Das hättest Du nur ermitteln können, wenn Du vor dem Steckerziehen mal einen Monitor angeschlossen hättest. Auf dem Bootmedium lag noch die entpackte Bootbank und beim Zwangsneustart war auf der Boot-Partition nicht mehr genügend freier Platz, um die Bootdateien zu entpacken. Folglich obiger Fehler.

Hätte man händisch mühselig rausbasteln können, komplette Neuinstallation geht aber schneller.
Fazit: Ggf. Config vom ESXi regelmäßig sichern und die WD 500er mal auf Fehler untersuchen oder ggf, durch einen 16GB++ USB-Stick ersetzen.

Gruß

cykes
cykes
cykes 07.08.2022 um 13:35:35 Uhr
Goto Top
... und generell gilt natürlich auf Whitebox-Systemen (nicht offiziell unterstützte Hardware): Es kann alles mögliche passieren, bspw. nach einem Update funktioniert eine Komponente nicht mehr (richtig).
silent-daniel
silent-daniel 07.08.2022 um 13:40:24 Uhr
Goto Top
Ich würde die 500er WD gegen einen USB Stick / SD Karte tauschen.
ButterBot
ButterBot 07.08.2022 um 13:59:11 Uhr
Goto Top
Zitat von @cykes:

Das bringt zumindest etwas mehr Licht ins Dunkle face-wink

Wenn ich das richtig rausgefiltert habe, ist die 500er WD das Bootmedium. Die würde ich ggf. mal einer eingehenden Untersuchung unterziehen. Ggf. auch Umstieg auf einen >=16GB USB Stick in Erwägung ziehen.

Okay, dann werde ich mal das OS vom ESXi rüberziehen


Für die Ursache kann man nur Vermutungen anstellen: Vermutlich hing der ESXi, bevor Du den Stecker gezogen hast, in einem PSOD (aka. Absturz). Das hättest Du nur ermitteln können, wenn Du vor dem Steckerziehen mal einen Monitor angeschlossen hättest. Auf dem Bootmedium lag noch die entpackte Bootbank und beim Zwangsneustart war auf der Boot-Partition nicht mehr genügend freier Platz, um die Bootdateien zu entpacken. Folglich obiger Fehler.

Okay, ja ich hatte zuerst versucht ihn über die Webseite zu erreichen, als dies nicht ging versuchte ich einen Ping.
Dann bemerkte ich dass die LED's von der integrierte Lan Karte so blinkten, als wäre der Computer aus. Also die Uplink LED aus und die Traffic LED blinkte.
Die zweite LAN Karte war komplett aus, diese sollte aber eigentlich arbeiten.
Darauf hin, habe ich mal den Monitor angemacht, alles dunkel, danach hatte den Kühler der Grafikkarte angefasst, der is normalerweise sehr warm. Der war aber kalt.

Dann wurde mir klar, ne da geht nichts mehr.
Also hatte ich das mit dem Einschaltknopf versucht und danach den Stecker gezogen.

Hätte man händisch mühselig rausbasteln können, komplette Neuinstallation geht aber schneller.
Fazit: Ggf. Config vom ESXi regelmäßig sichern und die WD 500er mal auf Fehler untersuchen oder ggf, durch einen 16GB++ USB-Stick ersetzen.

Jup, das klinkt gut, danke dir!
ButterBot
ButterBot 07.08.2022 um 14:01:21 Uhr
Goto Top
Zitat von @cykes:

... und generell gilt natürlich auf Whitebox-Systemen (nicht offiziell unterstützte Hardware): Es kann alles mögliche passieren, bspw. nach einem Update funktioniert eine Komponente nicht mehr (richtig).

Genau, beim nächsten Update, ich glaube ESXi 7.0.1 oder so, sagte er damals, dass die LAN Karte eventuell nicht funktioniert. Deswegen bin ich noch bei der 6.7.0 geblieben.

Die Rackserver von Hust* IBM *Hust und Lenovo sind aber schon höher. (Der alte mit dem CPU Trick und die anderen Offiziell)
ButterBot
ButterBot 07.08.2022 um 14:02:00 Uhr
Goto Top
Zitat von @silent-daniel:

Ich würde die 500er WD gegen einen USB Stick / SD Karte tauschen.

Jup mach ich, danke dir
cykes
cykes 07.08.2022 um 16:57:36 Uhr
Goto Top
Nur als zusätzlicher Hinweis: VMWare wird irgendwann auch das Booten von SD-Card/USB-Stick rausschmeißen, es ist bereits eine nicht mehr empfohlene Konfiguration seit ESXi 7.x.

Wenn Du bei 6.7 bleibst, braucht Dich das nicht interessieren. Für einen Heimserver auf Whitebox ist das eh IMHO irrelevant.