anaxagoras83
Goto Top

ESXi 4.1 - Nach Neustart haben alle VMs den Status Unknown (ungültig)

Nach dem Ausfall einer Festplatte im RAID5 auf einem IBM-Server und dem Einbinden der getauschten Festplatte in das RAID-System (RAID5-4HDDs), werden nach dem Start des ESXi Servers die VMs als "Unknown (ungültig)" angezeigt.

Hallo zusammen.

Ich kämpfe gerade mit einem Problem bei dem ich einfach nicht weiter weiß. Ich habe versucht die Informationen so strukturiert und umfrangreich wie möglich zu halten.

Vorgeschichte:

Eine meiner letzten Fragen bezog sich auf das Thema RAID-Konfiguration bei einem IBM-Server mit installiertem ESXi-Server. Es war mir nicht möglich, die Konfiguration der getauschten Festplatte aus dem laufenden System heraus vorzunehmen. Automatisch wurde die Rekonfigurationd es RAIDs auch nicht durchgeführt. Also fragte ich zunächste IBM per Hotline und Chat wie ich diese administrative Aufgabe erledigen könne. Diese sagten mit das bei einem ESX(i) System keine Möglichkeit bestünde, im laufenden Betrieb Änderungen an der RAIDkonfiguration vorzunehmen.

Nachdem ich die Frage in diesem Forum stelle, bekam ich jedoch eine Antwort mit einem Link zu einem Knowledgebaseartikel in dem ein Workaround beschrieben wurde, diese Aufgabe doch durchführen zu können:

IBM X-Server, VMWare und RAID-Management - Wie im laufenden Betrieb monitoren und administrieren?

Nachdem ich diese Punkte durchführen wollte und zu keinem positiven Ergebnis kam, startete ich den Server nun doch neu und griff auf die embedded RAID-Konsole zu um die Änderungen am RAID durchzuführen.

Die neue Festplatte wurde erkannt (jedoch als JBOD) änderung des States in "Conf-Free" und zuweisen der Festplatte zu dem bestehenden RAID, danach wurde der Status der Festplatte von "offline" auf "online" gesetzt und der Server neu gebootet.

Schon wurde der Health-Status des RAID als "optimal" erkannt. (vorher stand das RAID auf degrated) dies wurde jeweils im IMM-Health Check angezeigt als auch im VSphere Client.

Fehlerbeschreibung:

Nach dem Boot der Maschine werdem die virtuellen Maschinen in der Bestandsliste nur als "Unknown (ungültig)" angezeigt. Ein Neustart des Virtualisierungshost brachte leider keine Verbesserung.

Eine Recherche im Internet brachte nur einige Beiträge in denen Nutzer eine ähnliche Situation beschrieben. Einen Lösungsansatz hatten jedoch alle gemein:

- Entfernen der VMs mittels Rechtsklick und "Aus Bestandsliste entfernen"
- Durchsuchen des Datastores und hinzufügen der VMX-Datei zur Bestandsliste unter Angabe des Maschinennamens.

Leider bringt dieses keine positive Veränderung des Problems.

Da ich in der VMWARE-Welt recht neu bin, habe ich erst wenig Erfahrung mit Troubleshooting.
Also denke ich nun einfach mal laut:

- Kann durch die RAID-Problematik das Dateisystem beschäfigt worden sein und dadurch der Fehler auftreten?
- An welchem Punkt habe ich in diesem Setup einen Fehler gemacht, was hätte ich anders machen können um den Fehler zu umgehen?
- Was sind die nächsten Schritte um dieses Problem zu beheben?
- Ist es möglich auf Grundlage der noch vorhandenen VMDKs eine neue VMX Datei zu erstellen mit Aussicht auf eine funktionierende, startende Maschine?

Detailinformation:

- Server IBM x3400
- RAID5 (4xHDDs-SAS)
- Raidcontroller LSI-MegaRAID
- ESXi 4.1 Installation auf USB-Stick
- RAID als VM-Storage
- Installierte Maschinen: 4
- Gastbetriebssysteme: Windows 2008 R2 - Enterprise

Ich danke vielmals und verbleibe

mit freundlichem Gruß

Anaxagoras83

Content-ID: 174322

Url: https://administrator.de/contentid/174322

Ausgedruckt am: 22.11.2024 um 13:11 Uhr

tonabnehmer
tonabnehmer 08.10.2011 um 13:36:49 Uhr
Goto Top
Hi,

Zitat von @anaxagoras83:
- Ist es möglich auf Grundlage der noch vorhandenen VMDKs eine neue VMX Datei zu erstellen mit Aussicht auf eine
funktionierende, startende Maschine?

wenn Du aktuell an die VMDKs ran kommst, solltest Du diese sofort an einen sicheren Ort sichern, um Verluste zu vermeiden. Wenn Du an die VMDKs ran kommst, kommst Du doch auch an die Konfigurationsdateien der VMs (*.vmx) bzw. an die Verzeichnisse mit den VMs. Sichere zunächst alles weg.
Um Deine Frage zu beantworten: Ja, Du kannst wenn Dein ESXi wieder läuft, neue VMs erstellen und die vorhandenen VMDK Dateien als virtuelle Festplatte eingeben. Dabei ändern sich aber die UUID der VMs und auch die MAC Adressen der virtuellen NICs. Da muss dann ggf. ein Windows neu aktiviert oder bei einem RedHat die Netzwerkeinstellungen neu konfiguriert werden.

Wenn Du also an die Verzeichnisse der VMs ran kommst, sichere diese vollständig weg, repariere dann Dein RAID oder wenn das nicht geht, lege es eben neu an. Die vorher gesicherten VMs kannst Du zurückspielen und so wie Du oben beschrieben hast, der Bestandsliste neu hinzufügen. Die VMs sind dann so wie vorher.

Zu der RAID Geschichte selbst kann ich nur Vermutungen anstellen. Ich hatte etwas Ähnliches mal vor Jahren. Da hatte ich unseren iSCSI geupdatet und anschließend wollte ESX nicht mehr die VMs von dort starten. Status war wohl wie bei Dir Unknown und die Namen der VMs waren grau und in kursiver Schrift. Das Problem war wohl, dass der iSCSI Storage, auf dem die VMs lagen, eine neue ID hatte und ESX der Meinung war, es wäre ein Snapshot des iSCSI. Da musste ich dann in der erweiterten Konfiguration erst irgendwelche Parameter von True auf False und umgekehrt setzen, damit ESX den iSCSI akzeptiert hatte.

Viel Erfolg!

Grüße,
tonabnehmer
anaxagoras83
anaxagoras83 08.10.2011 um 13:44:20 Uhr
Goto Top
Hallo Tonabnehmer,

vielen Dank für die wirklich schnelle Antwort:

wenn Du aktuell an die VMDKs ran kommst, solltest Du diese sofort an einen sicheren Ort sichern, um Verluste zu vermeiden. Wenn Du
an die VMDKs ran kommst, kommst Du doch auch an die Konfigurationsdateien der VMs (*.vmx) bzw. an die Verzeichnisse mit den VMs.
Sichere zunächst alles weg.
Um Deine Frage zu beantworten: Ja, Du kannst wenn Dein ESXi wieder läuft, neue VMs erstellen und die vorhandenen VMDK Dateien
als virtuelle Festplatte eingeben. Dabei ändern sich aber die UUID der VMs und auch die MAC Adressen der virtuellen NICs. Da
muss dann ggf. ein Windows neu aktiviert oder bei einem RedHat die Netzwerkeinstellungen neu konfiguriert werden.

Wenn Du also an die Verzeichnisse der VMs ran kommst, sichere diese vollständig weg, repariere dann Dein RAID oder wenn das
nicht geht, lege es eben neu an. Die vorher gesicherten VMs kannst Du zurückspielen und so wie Du oben beschrieben hast, der
Bestandsliste neu hinzufügen. Die VMs sind dann so wie vorher.

Ich komme an alle Daten ran. Der Datastore wird mir ohne Probleme angezeigt und ich kann in der Verzeichnisstruktur stöbern.

Zu der RAID Geschichte selbst kann ich nur Vermutungen anstellen. Ich hatte etwas Ähnliches mal vor Jahren. Da hatte ich
unseren iSCSI geupdatet und anschließend wollte ESX nicht mehr die VMs von dort starten. Status war wohl wie bei Dir Unknown
und die Namen der VMs waren grau und in kursiver Schrift. Das Problem war wohl, dass der iSCSI Storage, auf dem die VMs lagen,
eine neue ID hatte und ESX der Meinung war, es wäre ein Snapshot des iSCSI. Da musste ich dann in der erweiterten
Konfiguration erst irgendwelche Parameter von True auf False und umgekehrt setzen, damit ESX den iSCSI akzeptiert hatte.

Okay - wenn ich von einem Problem ausgehe welches durch das RAID-System verursacht wurde. Gibt es so etwas wie Checkdisk für VMFS? Vielleicht ist dadurch das Problem ja schon behoben und die VMX Dateien sind wieder lesbar oder interpretierbar für den ESXi.

Beste Grüße

Anaxagoras83
tonabnehmer
tonabnehmer 08.10.2011 um 13:53:40 Uhr
Goto Top
Zitat von @anaxagoras83:
Ich komme an alle Daten ran. Der Datastore wird mir ohne Probleme angezeigt und ich kann in der Verzeichnisstruktur stöbern.

Sehr gut, dann kannst Du die VMs komplett sichern und dann die Reparaturversuche fortsetzen.

Okay - wenn ich von einem Problem ausgehe welches durch das RAID-System verursacht wurde. Gibt es so etwas wie Checkdisk für
VMFS? Vielleicht ist dadurch das Problem ja schon behoben und die VMX Dateien sind wieder lesbar oder interpretierbar für den
ESXi.

Von einem "Checkdisk" ist mir nichts bekannt. Da Du ja den Datastore durchforsten kannst, scheint Dein VMFS ja auch in Ordnung zu sein. Du solltest eher in den Logs schauen, was der ESXi zu dem RAID bzw. dem VMFS sagt. Dann kannst Du gezielt reparieren. Oder Du gehst den pragmatischen Weg und legst das RAID neu an, spielst die VMs zurück und inventarisierst diese neu.

Mehr wüsste ich jetzt auch nicht. Vielleicht melden sich ja noch VM/RAID Experten zu Wort.

Viele Grüße,
tonabnehmer
anaxagoras83
anaxagoras83 09.10.2011 um 11:51:16 Uhr
Goto Top
> Ich komme an alle Daten ran. Der Datastore wird mir ohne Probleme angezeigt und ich kann in der Verzeichnisstruktur
stöbern.

Sehr gut, dann kannst Du die VMs komplett sichern und dann die Reparaturversuche fortsetzen.

Ja. Aber genau darin liegt mein Problem, da ich nicht weiß wie ich diese Dateien reparieren kann.

> Okay - wenn ich von einem Problem ausgehe welches durch das RAID-System verursacht wurde. Gibt es so etwas wie Checkdisk
für
> VMFS? Vielleicht ist dadurch das Problem ja schon behoben und die VMX Dateien sind wieder lesbar oder interpretierbar
für den
> ESXi.

Von einem "Checkdisk" ist mir nichts bekannt. Da Du ja den Datastore durchforsten kannst, scheint Dein VMFS ja auch in
Ordnung zu sein. Du solltest eher in den Logs schauen, was der ESXi zu dem RAID bzw. dem VMFS sagt. Dann kannst Du gezielt
reparieren. Oder Du gehst den pragmatischen Weg und legst das RAID neu an, spielst die VMs zurück und inventarisierst diese
neu.

Das wäre auf jeden Fall ein Versuch wert. Ich schaue es mir einmal an. Vielen Dank.

Mehr wüsste ich jetzt auch nicht. Vielleicht melden sich ja noch VM/RAID Experten zu Wort.

Das wäre prima. Vielleicht hatte ja schon jemand dieses Problem und kennt eine Lösung oder ein Workaround?

Viele Grüße,
tonabnehmer

Dankesehr - Gruß

Anaxagoras83
tonabnehmer
tonabnehmer 09.10.2011 um 14:14:46 Uhr
Goto Top
Hi,

wieviele VMs hast Du denn im Datastore und wieviel GByte sind es? Geh doch einfach den Weg, die VMs komplett zu sichern und anschließend Dein RAID und das VMFS neu aufzusetzen. Dann kopierst Du die VMs wieder zurück, nimmst sie in die Bestandsliste auf und fertig. Der Zeitaufwand ist hier lediglich das Kopieren der VMs und ggf. das Initialisieren des RAID. Bei beiden musst Du nicht zugucken und kannst sinnvollere Dinge nebenbei tun. Im Gegensatz dazu kannst Du aber auch warten, bis weitere Ratschläge kommen und diese dann probieren. Da sieht aber ein bischen nach Stochern im Nebel aus.

Viele Grüße und viel Erfolg,
tonabnehmer
anaxagoras83
anaxagoras83 09.10.2011 um 15:43:07 Uhr
Goto Top
wieviele VMs hast Du denn im Datastore und wieviel GByte sind es? Geh doch einfach den Weg, die VMs komplett zu sichern und
anschließend Dein RAID und das VMFS neu aufzusetzen. Dann kopierst Du die VMs wieder zurück, nimmst sie in die
Bestandsliste auf und fertig. Der Zeitaufwand ist hier lediglich das Kopieren der VMs und ggf. das Initialisieren des RAID. Bei
beiden musst Du nicht zugucken und kannst sinnvollere Dinge nebenbei tun. Im Gegensatz dazu kannst Du aber auch warten, bis
weitere Ratschläge kommen und diese dann probieren. Da sieht aber ein bischen nach Stochern im Nebel aus.

Da hast du allerdings recht. Werde diesen Weg jetzt auch gehen, da mir keine anderen Optionen mehr einfallen. Schaue noch einmal
für eine halbe Stunde im Netz ob ich etwas passendes finde, dann werden die Maschinen kopiert und das RAID erneut augesetzt.

Beste Grüße

Anaxagoras83
anaxagoras83
anaxagoras83 11.10.2011 um 13:51:03 Uhr
Goto Top
> wieviele VMs hast Du denn im Datastore und wieviel GByte sind es? Geh doch einfach den Weg, die VMs komplett zu sichern und
> anschließend Dein RAID und das VMFS neu aufzusetzen. Dann kopierst Du die VMs wieder zurück, nimmst sie in die
> Bestandsliste auf und fertig. Der Zeitaufwand ist hier lediglich das Kopieren der VMs und ggf. das Initialisieren des RAID.
Bei
> beiden musst Du nicht zugucken und kannst sinnvollere Dinge nebenbei tun. Im Gegensatz dazu kannst Du aber auch warten, bis
> weitere Ratschläge kommen und diese dann probieren. Da sieht aber ein bischen nach Stochern im Nebel aus.

Da hast du allerdings recht. Werde diesen Weg jetzt auch gehen, da mir keine anderen Optionen mehr einfallen. Schaue noch einmal
für eine halbe Stunde im Netz ob ich etwas passendes finde, dann werden die Maschinen kopiert und das RAID erneut augesetzt.

So .. nachdem ich eine ganze Nacht an der Rücksicherung hing, jetzt noch einmal die Rückmeldung:

- Ich habe die Holzhammermethode gewählt.
- Reboot und RAID neu-erstellt.
- In VMWARE den Datastore neu erstellt
- Maschinen aus der letzten Sicherung wieder hergestellt
- Gestartet (mehrfach)
- Alles wieder ok.

Beste Grüße

Anaxagoras83