VMWare, nach Stromausfall funktionieren vmdk Dateien nicht mehr

Mitglied: Mr.Heisenberg

Mr.Heisenberg (Level 1) - Jetzt verbinden

24.12.2020 um 16:47 Uhr, 1401 Aufrufe, 13 Kommentare, 1 Danke

Hallo zusammen,

wir hatten Vorgestern einen Stromausfall und seit dem laufen meine VM's nicht mehr. Im vSphere Client wird folgendes angezeigt:

https://administrator.de/images/c/1/6/a0c26aff124c553d9bec9082666fdb02.j ...


Ich habe versucht, die Ordner über WinSCP zu kopieren, doch leider bekomme ich hier die Fehlermeldung "formatiertes Paket oder inkompatibles Protokoll" Fehlercode 5

Der Datastore inkl Ordnerstruktur wird mir angezeigt, habe auch schon versucht, eine neue VM anzulegen und dabei eine vorhandene vmdk ausgewählt. Wenn ich die VM dann einschalten möchte, bekomme ich die Fehlermeldung "Das Gerät Bootstrap ist nicht verfügbar.

Was kann ich noch testen, oder was könnte der Fehler sein?
1 - Klicke auf das Bild, um es zu vergrößern
Mitglied: Vision2015
24.12.2020 um 17:06 Uhr
moin...
hast du kein Backup ?

versuche mal die VMs neu zu registrieren... also löschen (nicht aus dem store) und neu anlegen...

Frank
Bitte warten ..
Mitglied: cykes
24.12.2020, aktualisiert um 18:25 Uhr
Nabend,

Backup wäre hilfreich und außerdem mehr Details:
  • Welche VMWare ESXi Version (vSphere Client spricht ja für max. 6.0)? Free oder mit Lizenz?
  • Was ist mit den beiden VMs "Sophos XG" und "Windows 10", liegen die auf einer anderen Datastore? Oder liefen die nicht beim Stromausfall?

Ich würde vorerst keine Umkopieraktion starten, vielleicht ist es nur ein Kleinigkeit, es könnte ein Lock auf den Dateien liegen, der aber nach dem Neustart als der Strom wieder da war, nicht mehr aufgelöst werden kann.

Vgl. https://kb.vmware.com/s/article/2139179

[EDIT] Das könnte auch noch hilfreich sein: https://kb.vmware.com/s/article/10051?lang=de

Ansonsten bitte mal detaillierte Logs schicken.

Gruß und schöne Weihnachten

cykes
Bitte warten ..
Mitglied: tech-flare
25.12.2020 um 10:27 Uhr
Servus,

Wird denn der Datastore als richtig gemounted im vSphere angezeigt?

Entweder, wie mein Vorredner sagt, die vm aus dem vSphere entfernen (nicht löschen)! Und neu einbinden, oder mal mit einem frischen vSphere von USB Booten und die vmdk Dateien manuell in neue VM einbinden.

Alternativ die kompletten logs über winscp runterziehen und hier zur Verfügung stellen

Es ist ja sicherlich kein Produktivsystem, da du scheinbar kein Backup hast und die synology vm ja sowieso nur inoffiziell ist und diese es nicht als VM gibt :) face-smile

Wenn’s s doch ein Produktsystem ist und du ein Wartungsvertrag hast, kannst du dich auch an vmware wenden.

Gruß
Bitte warten ..
Mitglied: Mr.Heisenberg
25.12.2020, aktualisiert um 12:30 Uhr
Meine ESXi-Version ist 6.0.0 und die letzten Backups sind schon etwas älter. Eine neue VM kann ich anlegen und wenn ich die vmdk Datei aus der vorhandenen VM auswähle, kann ich die VM nicht starten. Über WinSCP kann ich die vmdk Datei oder auch das letzte Log File nicht kopieren. Siehe Bild



Ältere Log Files lassen sich kopieren. Nur die letzten nicht.


So sieht es aus, wenn ich eine neue VM erstelle und die vorhandene vmdk auswähle
unbenannt123 - Klicke auf das Bild, um es zu vergrößern12345 - Klicke auf das Bild, um es zu vergrößern
Bitte warten ..
Mitglied: cykes
25.12.2020, aktualisiert um 13:27 Uhr
Moin,

hast Du Dir die KB-Artikel, die ich oben verlinkt habe, wenigstens mal durchgelesen? Du musst natürlich ein wenig angepasst lesen & verstehen, da Du vermutlich die Free im Einsatz hast. Also erstmal ssh aktivieren und dort weitermachen. esxcli ist Dein Freund.
Ggf. bitte mal einen Screenshot vom Verzeichnisinhalt der nicht startenden VMs machen.

Gruß

cykes

Zusatzfrage: Lagen eventuell noch Snapshots in den originalen VMs? In dem Fall könnte es etwas komplizierter/zeitaufwändiger werden.
Bitte warten ..
Mitglied: Mr.Heisenberg
25.12.2020 um 21:44 Uhr
Die habe ich mir durchgelesen und ich habe auch einige Tests durchgeführt. Snapshots sollten keine mehr vorhanden gewesen sein. Auch über ssh kann ich das letzte log File nicht öffnen (ältere log Files funktionieren)
Hier mal ein Verzeichnisinhalt einer nicht mehr funktionierenden VM

246 - Klicke auf das Bild, um es zu vergrößern
Bitte warten ..
Mitglied: cykes
25.12.2020, aktualisiert um 22:12 Uhr
Am Verzeichnisinhalt der 'Windows 10' VM sieht man aber, dass
a) die Konfigurationsdatei der VM ('Windows 10.vmx') am 22.12. um 21:03 Uhr noch editiert/verändert wurde
b) ein Lock auf diese Datei besteht (-> Windows 10.vmx.lck)

b) musst Du anhand der KB-Artikel auflösen oder zumindest überprüfen.

Die Frage ob eine Lizenz vorhanden ist oder die Free verwenmdet wird, hast Du immer noch nicht beantwortet.
Außerdem hast Du ungewöhlich große Swap-Dateien (*.vswp) in diesem Verzeichnis. Wieviel vRAM hat diese VM konfiguriert und wieveil physischen RAM hat der Server?

Hier gibt's noch weitere Logdateien, die Du überprüfen kannst: https://kb.vmware.com/s/article/10051
(Hatte ich ja oben schon verlinkt und hattest Du ja durchgelesen ...)
Bitte warten ..
Mitglied: Mr.Heisenberg
25.12.2020, aktualisiert um 23:31 Uhr
Sorry, eine Lizenz ist vorhanden und ich betreibe den Server nicht in einer Free-Version. Die Windows 10 VM habe ich 4GB RAM zugewiesen und insgesamt hat der Server 32GB. Es wird noch ein RAID-Controller (3Ware 9650SE-2LP AMCC 2-port PCIe SATA II RAID Controller) verwendet, kann es sein, dass dieser defekt ist oder das Dateisystem zerstört hat?

Laut KB soll ein anderer VMWare Host die VM sperren, aber das kann eigentlich nicht, da nur einer im Einsatz ist.

321 - Klicke auf das Bild, um es zu vergrößern
Bitte warten ..
Mitglied: cykes
25.12.2020 um 23:48 Uhr
Du kannst Dir auch mal diesen Beitrag in der VMWare Community durchlesen: https://communities.vmware.com/t5/VMware-vSphere-Discussions/Problem-wit ...

Ich würde erstmal versuchen, genauere Informationen über den Lock mithilfe der vmkfstools zu bekommen.
Ggf. hilft auch eine Neuinstallation vom ESXi auf einen frischen USB-Stick.
Ansonsten kann es recht kompliziert und zeitaufwändig werden, der Kollege continuum in der VMWare Community ist aber ggf. noch erreichbar/aktiv.

Die Recovery-Methoden, die er vorschlägt, funktionieren (hab ich selbst schon mal getestet, sind aber mit Bedacht auszuführen, insbesondere da Du kein halbwegs aktuelles Backup hast.
Bitte warten ..
Mitglied: tech-flare
26.12.2020, aktualisiert um 02:59 Uhr
Zitat von Mr.Heisenberg:
wird noch ein RAID-Controller (3Ware 9650SE-2LP AMCC 2-port PCIe SATA II RAID Controller) verwendet, kann es sein, dass dieser defekt ist oder das Dateisystem zerstört hat?
wenn der RAID Controller keine BBU hat....sehr wahrscheinlich!
Noch schlimmer, wenn vor dem Server keine USV hängt.

Hier wurden scheinbar einige Kardinalfehler begannen
Bitte warten ..
Mitglied: Vision2015
26.12.2020 um 06:14 Uhr
moin...

Zitat von tech-flare:

Zitat von Mr.Heisenberg:
wird noch ein RAID-Controller (3Ware 9650SE-2LP AMCC 2-port PCIe SATA II RAID Controller) verwendet, kann es sein, dass dieser defekt ist oder das Dateisystem zerstört hat?
wenn der RAID Controller keine BBU hat....sehr wahrscheinlich!
Noch schlimmer, wenn vor dem Server keine USV hängt.

Hier wurden scheinbar einige Kardinalfehler begannen
der grßte Fehler, ist wohl, kein Backup zu haben....

Frank
Bitte warten ..
Mitglied: cykes
26.12.2020, aktualisiert um 06:45 Uhr
Zitat von Mr.Heisenberg:

Sorry, eine Lizenz ist vorhanden und ich betreibe den Server nicht in einer Free-Version.
Mir ging es nicht um einen Lizenzcheck, sondern um die Verfügbarkeit von Tools, die nur in einer lizensierten Umgebung funktionieren.
Die Windows 10 VM habe ich 4GB RAM zugewiesen und insgesamt hat der Server 32GB. Es wird noch ein RAID-Controller (3Ware 9650SE-2LP AMCC 2-port PCIe SATA II RAID Controller) verwendet, kann es sein, dass dieser defekt ist oder das Dateisystem zerstört hat?
Ist das ein selbstgebauter Server oder einer der großen Hersteller und sind Server und Komponenten in der VMware HCL?
Grundsätzlich kann natürlich auch der Controller dafür (mit) verantwortlich sein. Alle Komponenten, die beim Stromausfall nicht sauber heruntergefahren wurden, können das auslösen. Wäre denn ein Upgrade auf bspw. 6.7 möglich?
Laut KB soll ein anderer VMWare Host die VM sperren, aber das kann eigentlich nicht, da nur einer im Einsatz ist.
Laut Deinem Screenshot hat der Host mit der MAC-Adresse 0025904659e9 (00:25:90:46:59:e9) den Lock ausgelöst, wobei Du ja jetzt im Verzeichnis der Synology VM bist. Das Problem ist, dass VMWare 'denkt', die VMs würden noch laufen (ermittelt wird das anhand der vorhandenen lck-Datei und der vswp Dateien.
Bitte warten ..
Mitglied: SamvanRatt
26.12.2020, aktualisiert um 12:42 Uhr
Hi
habe gerade keien Zeit um die vorhandenen Antworten mal kurz durchzulesen wegen Redundanz:
ich würde darafu schließen das du einen Filesystemerror hast. Eigentlich repariert sich VMFS5+ selbst daher sind tools da "rar". Beim mounten wird normal die Selbstheilung angestoßen. Dank der guten Cachefunktion im ESX kann da viel beschädigt sein.... (je mehr ungenutzter RAM umso größer das Caching=Fehlerpotential)
Nachdem du nicht kopieren kannst hat ESX einfach keinen Zugriff mehr, weil es wohl meldet es sei "dirty".
Es gibt aber 3rd Party Programme um die Dateien auch beschädigt auszulesen Diskinternals "VMFS Recovery" nutze ich für solche Fälle=>
a) auslesen
b) löschen
c) zurückkopieren

Bevor du den Schritt aber gehst würde ich die Volumen mal entmounten (ich schätze Installation auf USB Sticks bei denen man mal kurz einen ESX Server (je höher desto mehr Logik ist reingewandert; 7.0U1b ist recht potent) hochziehen kann um die Shell zu erreichen mit seinen Tools) und öfters mal mounten, lange warten (man sollte Tätigkeit auf dem Array sehen) und wieder entmounten. Sobald du kopieren (sftp, cp, GUI, ....) darfst hast du gewonnen. Wenn nicht gibt es mit dem oberen (kostenpflichtigen) Tool die Möglichkeit die Heilungsfähigkeit des VM OSes zu "testen".
In der Firma (Datenrettung) haben wir recht gute Erfolge damit.

Gruß
Sam
Bitte warten ..
Heiß diskutierte Inhalte
Windows Server
Lizenzrecht Microsoft HILFE!!!!
gelöst tAmtAm44Vor 18 StundenFrageWindows Server26 Kommentare

Guten Abend liebe Community, ich bin vor kurzen bei uns in der Firma für den Vertrieb unsere MS Lizenzen auserwählt worden. Leider habe ich ...

Netzwerke
Windows 10 - Netzwerk Speedlimit?
alwayshungryVor 1 TagFrageNetzwerke17 Kommentare

Hallo, ich bin noch neu hier und hoffe, dass ihr mir helfen könnt. Gibt es eine Limitierung für Windows 10 bei der Netzwerkgeschwindigkeit? Leider ...

DNS
Domain überkleben
IT-EinsteigerVor 1 TagFrageDNS3 Kommentare

Guten Morgen, Ich habe mir einen WebSpace angemietet. Dieser läuft bspw. über die Domain storage.dienstleister.de. Jetzt ist das kein schöner Name und ich hätte ...

Datenschutz
Ist Microsoft Office 365 grds. nicht DSGVO-konform?
imebroVor 21 StundenFrageDatenschutz31 Kommentare

Hallo, in einem anderen Thread hatte man mir als Alternative zum Analysetool "Tableau" das Programm "PowerBI" empfohlen, welches ich dann auch gekauft habe. Da ...

Festplatten, SSD, Raid
WD RED PRO Festplatte als "Recertified" und "white" gelabelt
gelöst Torsten2010Vor 1 TagFrageFestplatten, SSD, Raid5 Kommentare

Hallo, ich wollte heute die Firmen QNAP Nas mit neuen Festplatten bestücken. Beim Auspacken fiel mir sofort auf, das die Festplatten weiß gelabelt sind ...

Groupware
Anfängerfrage zu Teams, wie kann ich mit einer externen Person chatten?
StefanKittelVor 1 TagFrageGroupware7 Kommentare

Hallo, ich habe mal eine Anfängerfrage zur MS Teams. Ich habe einen M365 Business Basic Account mit meiner Domäne. Ich habe einen User mit ...

Windows 10
Inaccessible boot device bei Windows 10
jensgebkenVor 1 TagFrageWindows 1014 Kommentare

Hallo Gemeinschaft, habe Probleme bei einem Windows 10 Pro PC beim Start - blue screen mit inaccessible boot device habe folgendes probiert - automatische ...

SAN, NAS, DAS
FritzBox NAS - Hochladen von großen Dateien geht nicht
emeriksVor 1 TagFrageSAN, NAS, DAS14 Kommentare

Hi, (Habe die Kategorie "SAN, NAS, DAS" genommen, obwohl nicht 100% zutreffend.) Ich habe am Wochenende versucht bei einem Kumpel in der Ferne eine ...