Vmware ESXI 7 - VM lässt sich nicht mehr starten
V-Umgebung: Vmware Essential Plus Version 7, also ESXI 7 und VCenter 7
Betroffenen VM: Windows Server 2016 Datacenter (1,02 von 1,45 TB beschrieben),
3 Partitionen | hier mit %VMNAME%
Backuplösung: Veeam Backup & Replication 11
Hergang:
Besagte VM hat gestern abernd nicht mehr gebackupt. Es sind in Veeam 3 retry-Anläufe eingestellt. In der zweiten Nachthälfte läuft außerdem eine Replication.
Der Veeam-Fehler beim ersten Versuch des Backups:
Failed to create VM snapshot. Error: CreateSnapshot failed, vmRef vm-76426, timeout 1800000, snName VEEAM BACKUP TEMPORARY SNAPSHOT, snDescription Please do not delete this snapshot. It is being used by Veeam Backup., memory False, quiesce False
Unable to release guest. Error: RPC function call failed. Function name: [BlobCall]. Target machine: [%VMNAME%]. RPC error:Der RPC-Server ist nicht verfügbar. Code: 1722
Error: An error occurred while saving the snapshot: Unable to save snapshot file. (An error occurred while saving the snapshot: Unable to save snapshot file., An error occurred while taking a snapshot: Unable to save snapshot file.)
Die Fehlermeldungen bei den Retry-Anläufen sowie bei allen Replication-Versuchen:
Error: Failed to open VDDK disk [[%STORAGENAME%] %VMNAME%/%VMNAME%_2-000001.vmdk] ( is read-only mode - [true] ) Logon attempt with parameters [VC/ESX: [%IP_VCENTER%];Port: 443;Login: [%LOGIN_USERNAME%];VMX Spec: [moref=vm-76426];Snapshot mor: [snapshot-180870];Transports: [nbd];Read Only: [true]] failed because of the following errors: Failed to open disk for read. Failed to upload disk. Skipped arguments: [vddkConnSpec>]; Agent failed to process method {DataTransfer.SyncDis
anscheinend wurde hier abgeschnitten.
Die VM hat angeblich keine Snapshots. Sie war einfach aus und es stand aber die gelbe Warnmeldung in der Vmware, dass die VM snapshots enthält, die konsolidiert werden müssen.
Beim Versuch, die VM zu starten, gibt es am ESXI die Fehlermeldung:
Power On VM
Schlüssel: haTask-62-vim.VirtualMachine.powerOn-3288757539
Beschreibung: Schaltet diese virtuelle Maschine ein.
Virtuelle Maschine: %VMNAME%
Zustand: Fehlgeschlagen - Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Fehler: Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Die übergeordnete Festplatte dieser virtuellen Festplatte konnte nicht geöffnet werden
Die Festplatte „/vmfs/volumes/%datastorepath%/%VMNAME%/%VMNAME%_2-000016.vmdk“ oder eine der Snapshot-Festplatten, auf die sie angewiesen ist, konnte nicht geöffnet werden.
Einschalten des Moduls „Disk“ fehlgeschlagen.
Das Starten der virtuellen Maschine ist fehlgeschlagen.
Ich habe bereits versucht, mittels
und
sowie
und
Jedoch stand da immer als Ergebnis: "Disk is error free".
Da die VM doch eine gewisse Größe hat, wäre das Zurückspielen aus dem Backup von Vorgestern nicht so toll, denn erfahrungsgemäß dauert das viel zu lang.
Die Frage ist also, was ich noch machen kann, um die VM vielleicht in einen Zustand zu bekommen, dass sie sich wieder starten lässt.
Betroffenen VM: Windows Server 2016 Datacenter (1,02 von 1,45 TB beschrieben),
3 Partitionen | hier mit %VMNAME%
Backuplösung: Veeam Backup & Replication 11
Hergang:
Besagte VM hat gestern abernd nicht mehr gebackupt. Es sind in Veeam 3 retry-Anläufe eingestellt. In der zweiten Nachthälfte läuft außerdem eine Replication.
Der Veeam-Fehler beim ersten Versuch des Backups:
Failed to create VM snapshot. Error: CreateSnapshot failed, vmRef vm-76426, timeout 1800000, snName VEEAM BACKUP TEMPORARY SNAPSHOT, snDescription Please do not delete this snapshot. It is being used by Veeam Backup., memory False, quiesce False
Unable to release guest. Error: RPC function call failed. Function name: [BlobCall]. Target machine: [%VMNAME%]. RPC error:Der RPC-Server ist nicht verfügbar. Code: 1722
Error: An error occurred while saving the snapshot: Unable to save snapshot file. (An error occurred while saving the snapshot: Unable to save snapshot file., An error occurred while taking a snapshot: Unable to save snapshot file.)
Die Fehlermeldungen bei den Retry-Anläufen sowie bei allen Replication-Versuchen:
Error: Failed to open VDDK disk [[%STORAGENAME%] %VMNAME%/%VMNAME%_2-000001.vmdk] ( is read-only mode - [true] ) Logon attempt with parameters [VC/ESX: [%IP_VCENTER%];Port: 443;Login: [%LOGIN_USERNAME%];VMX Spec: [moref=vm-76426];Snapshot mor: [snapshot-180870];Transports: [nbd];Read Only: [true]] failed because of the following errors: Failed to open disk for read. Failed to upload disk. Skipped arguments: [vddkConnSpec>]; Agent failed to process method {DataTransfer.SyncDis
anscheinend wurde hier abgeschnitten.
Die VM hat angeblich keine Snapshots. Sie war einfach aus und es stand aber die gelbe Warnmeldung in der Vmware, dass die VM snapshots enthält, die konsolidiert werden müssen.
Beim Versuch, die VM zu starten, gibt es am ESXI die Fehlermeldung:
Power On VM
Schlüssel: haTask-62-vim.VirtualMachine.powerOn-3288757539
Beschreibung: Schaltet diese virtuelle Maschine ein.
Virtuelle Maschine: %VMNAME%
Zustand: Fehlgeschlagen - Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Fehler: Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Dateisystemspezifische Implementierung von loctl[file] fehlgeschlagen
Die übergeordnete Festplatte dieser virtuellen Festplatte konnte nicht geöffnet werden
Die Festplatte „/vmfs/volumes/%datastorepath%/%VMNAME%/%VMNAME%_2-000016.vmdk“ oder eine der Snapshot-Festplatten, auf die sie angewiesen ist, konnte nicht geöffnet werden.
Einschalten des Moduls „Disk“ fehlgeschlagen.
Das Starten der virtuellen Maschine ist fehlgeschlagen.
Ich habe bereits versucht, mittels
vmkfstools -x check /vmfs/volumes/<datastorepath>/<vm name>/<vm name main base disk>.vmdk
vmkfstools -x repair /vmfs/volumes/<datastorepath>/<vm name>/<vm name main base disk>.vmdk
vmkfstools -x check /vmfs/volumes/<datastorepath>/<vm name>/%VMNAME%_2-000016.vmdk
vmkfstools -x repair /vmfs/volumes/<datastorepath>/<vm name>/%VMNAME%_2-000016.vmdk
Jedoch stand da immer als Ergebnis: "Disk is error free".
Da die VM doch eine gewisse Größe hat, wäre das Zurückspielen aus dem Backup von Vorgestern nicht so toll, denn erfahrungsgemäß dauert das viel zu lang.
Die Frage ist also, was ich noch machen kann, um die VM vielleicht in einen Zustand zu bekommen, dass sie sich wieder starten lässt.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 3664163947
Url: https://administrator.de/contentid/3664163947
Ausgedruckt am: 23.11.2024 um 01:11 Uhr
26 Kommentare
Neuester Kommentar
Auch kein Hallo.
Hast du das denn durchgeführt? Sind in der ESX Snapshotverwaltung welche zu sehen?
Das Backup regelmäßig zu testen ist hier offensichtlich nicht passiert.
Gerade wenn es sich um eine wichtige Maschine handelt, sollte man so etwas periodisch durchführen.
Trotzdem machen. Sonst weißt du nämlich nicht, ob deine Backup Strategie auch wirklich funktioniert.
Wenn der Restore gelingt, hast du zumindest eine lauffähige VM.
Falls nicht, hast du andere Probleme.
Auch kein Gruß
Marc
Zitat von @Mondragor
Die VM hat angeblich keine Snapshots. Sie war einfach aus und es stand aber die gelbe Warnmeldung in der Vmware, dass die VM snapshots enthält, die konsolidiert werden müssen.
Die VM hat angeblich keine Snapshots. Sie war einfach aus und es stand aber die gelbe Warnmeldung in der Vmware, dass die VM snapshots enthält, die konsolidiert werden müssen.
Hast du das denn durchgeführt? Sind in der ESX Snapshotverwaltung welche zu sehen?
Das Backup regelmäßig zu testen ist hier offensichtlich nicht passiert.
Gerade wenn es sich um eine wichtige Maschine handelt, sollte man so etwas periodisch durchführen.
Da die VM doch eine gewisse Größe hat, wäre das Zurückspielen aus dem Backup von Vorgestern nicht so toll, denn erfahrungsgemäß dauert das viel zu lang.
Trotzdem machen. Sonst weißt du nämlich nicht, ob deine Backup Strategie auch wirklich funktioniert.
Wenn der Restore gelingt, hast du zumindest eine lauffähige VM.
Falls nicht, hast du andere Probleme.
Auch kein Gruß
Marc
Aus dem Bauch heraus, du hast noch etwas Storage Platz frei?
Ansonsten Veeam kam nicht mehr auf den Server:
RPC error:Der RPC-Server ist nicht verfügbar. Code: 1722
Und konnte keine Snapshot erstellen:
Error: An error occurred while saving the snapshot: Unable to save snapshot file.
Error: Failed to open VDDK disk [[%STORAGENAME%] %VMNAME%/%VMNAME%_2-000001.vmdk] ( is read-only mode - [true] )
gibt es die Platte?
Hier sind wir schon bei 16 Snapshots:
%_2-000016.vmdk
Kannst du denn einfach Snapshots konsoldieren? Auch wenn keine da sind ...
Parallel würde ich schon mal das Backup starten, , wenn du Platz dafür hast.
Ansonsten Veeam kam nicht mehr auf den Server:
RPC error:Der RPC-Server ist nicht verfügbar. Code: 1722
Und konnte keine Snapshot erstellen:
Error: An error occurred while saving the snapshot: Unable to save snapshot file.
Error: Failed to open VDDK disk [[%STORAGENAME%] %VMNAME%/%VMNAME%_2-000001.vmdk] ( is read-only mode - [true] )
gibt es die Platte?
Hier sind wir schon bei 16 Snapshots:
%_2-000016.vmdk
Kannst du denn einfach Snapshots konsoldieren? Auch wenn keine da sind ...
Parallel würde ich schon mal das Backup starten, , wenn du Platz dafür hast.
in einem anderen Fall habe ich gelesen, dass unter einem ähnlichen Problem dazu geraten wurde, den ESX Host neu zu starten, was in dem Fall auch zum Erfolg geführt hatte.
Ja dann wenn das möglich ist, mach das zuerst.
Ansonsten frage mal den VMware Support.
Evtl. stimmen da ein paar Dinge in der vmx Datei nicht, aber das soll dann lieber VMware machen
Moin,
Ansonsten würde ich auch mal den ESXI rebooten.
Wie sieht denn unter dem ESXi die Snapshot-Kette aus? VEEAM sollte die ja eigentlich nach einem erfolgreichem Backup selbst löschen.
Gruß
em-pie
Aus dem Bauch heraus, du hast noch etwas Storage Platz frei?
Das wäre auch meine erste Vermutung. Prüfe also mal den Datastore, auf dem die VM liegt.Ansonsten würde ich auch mal den ESXI rebooten.
Wie sieht denn unter dem ESXi die Snapshot-Kette aus? VEEAM sollte die ja eigentlich nach einem erfolgreichem Backup selbst löschen.
Gruß
em-pie
Na einen Restore Versuch unternehmen und schauen, ob Dienste in der VM hochfahren (mit und ohne Netzwerk > falls die original VM noch läuft) und ob alles klappt
Gruß
Marc
Zitat von @Mondragor:
@radiogugu
In der Snapshotverwaltung sind keine Snapshots zu sehen und ich achte auch darauf, dass die VMs nicht zu viele Snapshots haben. In der Snapshotverwaltung wir auch nicht ein einziger angezeigt.
Was genau meinst Du mit "das Backup regelmäßig zu testen" ?
@radiogugu
In der Snapshotverwaltung sind keine Snapshots zu sehen und ich achte auch darauf, dass die VMs nicht zu viele Snapshots haben. In der Snapshotverwaltung wir auch nicht ein einziger angezeigt.
Was genau meinst Du mit "das Backup regelmäßig zu testen" ?
Genau das was es heißt, nicht nur immer backupen und hoffen, dass alles gut ist, sondern 1x die Woche oder Monat das Backup auch hochfahren (ohne Netzwerk) und sehen ob alles passt.
Also das Wichtigste zuerst: Es muss genügend freier Speicher vorhanden sein für so gut wie alle Operationen betreffend Snapshots, Restore, etc. 8.5 TB wären natürlich genug vorausgesetzt das Storage zeigt die nicht nur an sondern die stehen wirklich nutzbar zur Verfügung. Ich hatte nach einer Storage Erweiterung auch schon falsche Angaben dazu. Das kannst du aber gut testen in dem du den Restore der VM einfach mal auf das selbe Storage machst, natürlich unter Verwendung eines andern Pfads/Namens.
Dadurch testest du die Datensicherung, testest ob sich der Restore booten lässt und hast eine Option falls deine produktiv VM stirbt. Zeit wirst du auf jeden Fall investieren müssen um bei der Sache nicht durch Fehler alles schlimmer zu machen.
Die fehlerhafte VM würde ich als erstes konsolidieren wenn VMware das anbietet, wenn ich das richtig verstehe hat das noch nicht statt gefunden. Das kann aber auch sehr lange dauern, ich habe schon Konsolidierung von ~8h gehabt die keine sichtbaren Fortschritte gemacht haben aber am Ende fehlerfrei abgeschlossen wurden.
Dadurch testest du die Datensicherung, testest ob sich der Restore booten lässt und hast eine Option falls deine produktiv VM stirbt. Zeit wirst du auf jeden Fall investieren müssen um bei der Sache nicht durch Fehler alles schlimmer zu machen.
Die fehlerhafte VM würde ich als erstes konsolidieren wenn VMware das anbietet, wenn ich das richtig verstehe hat das noch nicht statt gefunden. Das kann aber auch sehr lange dauern, ich habe schon Konsolidierung von ~8h gehabt die keine sichtbaren Fortschritte gemacht haben aber am Ende fehlerfrei abgeschlossen wurden.
Sorry ja ich weiß, aber wenn 100GB 4h Restorezeit sind, dann bist du echt schlecht aufgestellt. (7-8mb/s)
Außerdem kann man bei VBR11 auch "onthefly" starten, also vom Backup Medium starten und im Laufenden Betrieb wieder zurück auf den Server schieben, mit kurzer Unterbrechung wenn fertig.
-> Backup Kontrolle ist wichtig!!! Ich kenne einen Kunden, bei dem hat das Backup auch immer "funktioniert" bis er es gebaucht hat.
Vor allem musst du ja bei VBR11 nicht die VM löschen, sondern sagst einfach diesen Stand wiederherstellen und er spielt nur die "paar" GB zurück, die sich geändert haben...
Ich würden den ESX einfach mal Neu starten (am Abend), evtl. lösen sich gewisse Probleme dann von selbst (konsolidieren funktioniert wieder,....)
Außerdem kann man bei VBR11 auch "onthefly" starten, also vom Backup Medium starten und im Laufenden Betrieb wieder zurück auf den Server schieben, mit kurzer Unterbrechung wenn fertig.
-> Backup Kontrolle ist wichtig!!! Ich kenne einen Kunden, bei dem hat das Backup auch immer "funktioniert" bis er es gebaucht hat.
Vor allem musst du ja bei VBR11 nicht die VM löschen, sondern sagst einfach diesen Stand wiederherstellen und er spielt nur die "paar" GB zurück, die sich geändert haben...
Ich würden den ESX einfach mal Neu starten (am Abend), evtl. lösen sich gewisse Probleme dann von selbst (konsolidieren funktioniert wieder,....)
Moin,
nicht immer fährt man ein Backup2Disk2Tape. Aus welchen Gründen auch immer...
Manche sichern direkt auf Band und dann kann es mitunter schon mal etwas dauern. Insbesondere, wenn das Tape im Server per SAS hängt und der Backupserver nur mit 1GBit (oder n x 1GBit/s) am LAN hängt. Beim normalen Backup ist es ja wurscht, ob dann das tägliche Delta 1h oder 3h benötigt (sofern Nachts nicht gearbeitet wird)...
Gruß
em-pie
aber wenn 100GB 4h Restorezeit sind, dann bist du echt schlecht aufgestellt.
nicht immer fährt man ein Backup2Disk2Tape. Aus welchen Gründen auch immer...
Manche sichern direkt auf Band und dann kann es mitunter schon mal etwas dauern. Insbesondere, wenn das Tape im Server per SAS hängt und der Backupserver nur mit 1GBit (oder n x 1GBit/s) am LAN hängt. Beim normalen Backup ist es ja wurscht, ob dann das tägliche Delta 1h oder 3h benötigt (sofern Nachts nicht gearbeitet wird)...
Gruß
em-pie
auch wenn ich nicht daran glaube, aber du könntest mal schauen, ob du per PowerCLI irgendwelche Snapshots siehst:
Achja: in welchem Status hängt Veeam mit dem Backup? Beende dort mal den ganzen Job (auf Disable setzen). Nicht, dass VEEAM da auch noch seine Finger mit im Spiel hat...
Import-Module VMware.VimAutomation.Core
Connect-VIServer vCenter.company.tld
$SRV = Get-VM | Get-Snapshot | select VM, Name, Created
$SRV | sort VM, created | ft
Write-Host "Count: " ($SRV | Measure).Count
Achja: in welchem Status hängt Veeam mit dem Backup? Beende dort mal den ganzen Job (auf Disable setzen). Nicht, dass VEEAM da auch noch seine Finger mit im Spiel hat...
bzgl. PowerCLI:
https://docs.vmware.com/de/VMware-vSphere/7.0/com.vmware.esxi.install.do ...
Nicht, dass da die Jobs parallel laufen und sich gegenseitig abschießen...
https://docs.vmware.com/de/VMware-vSphere/7.0/com.vmware.esxi.install.do ...
Die Backups hängen nicht fest, ich habe aber beide (backup und replica) deaktiviert.
Es passt von den Zeiten her so zusammen, dass alle 16 Snapshots durch die Veeam-Prozesse angestoßen wurden.
Ich hab mit den Replicas, zugegeben, null komma garkeinen Plan, aber so generell: Die Jobs laufen sequentiell und nicht parallel, oder?Es passt von den Zeiten her so zusammen, dass alle 16 Snapshots durch die Veeam-Prozesse angestoßen wurden.
Nicht, dass da die Jobs parallel laufen und sich gegenseitig abschießen...