Host Herunterfahren nach Stromunterbruch (APC USV)
Hallo zusammen
Ich habe in einer Laborumgebung folgende Komponenten:
Supermicro Server, Jahrgang ca. 2018/2019
HP ProLiant DL380 G6 also schon sehr alt
Auf dem DL380 läuft ESX 6.5, auf dem Supermicro läuft ESX 7.0. Beide sind in einem vCenter Server verbunden (kein Cluster oder sonstiges). Soweit sogut.
Nun habe ich eine ältere Smart-UPS X 1500 inkl Netzwerkkarte AP9631. Die Firmware ist mit Mitte 2019 jedoch noch sehr aktuell. Für meine Zwecke voll ausreichend.
Da es auf dem Supermicro einen Management Server gibt, habe ich mich entschlossen auf diesem (Windows Server 2019 x64) auch gleich PowerChute Network Shutdown v4.3 zu installieren. der vCenter Server ist die Appliance welche auf dem Supermicro läuft.
Das hat soweit auch gut funktioniert. Meine Einstellungen:
Der Test hat folgendes ergeben:
Soweit ein relativ gutes Ergebnis. Jedoch habe ich bisher einige offene Fragen die ich nicht beantworten konnte und noch am Suchen bin. Ggf hat ja von euch jemand einige Tipps für mich was ich beachten kann.
Ich habe die Loggs mal durchgesehen, bin aber anstelle auf erleuchtung eher auf weitere Fragen gestossen. Zum Beispiel möchte ich euch unten noch die Logs vom PowerChute unten anfügen. Ich finde es speziell das er erst vermeldet, dass der SuperMicro beim herunterfahren fehlgeschlagen ist, aber 30 Sekunden später heruntergefahren hat. Dies ist aber ok da er es gemacht hat. Beim HP gibt es die selbe Meldung, jedoch ist der nicht heruntergefahren.
Ein Fehler der nun auf beiden Hosts angezeigt wird ist folgender:
Dieser wird somit von meinem Management Server mit PowerChute ausgelöst. Das Kennwort stimmt aber, da er dies beim Einrichten zumindest angezeigt hat und die VMs heruntergbefahren werden. Ich habe extra mal den Administrator verwendet, um Fehlerhafte Berechtigungen im Test bei einem extra User für PowerChute zu vermeiden. Dies ist auch einer der letzten Fehler der angezeigt wird bevor die Logs dann wieder beginnen nach dem wieder Strom vorhanden ist.
Bitte entschuldigt den langen Beitrag, ich habe versucht alle nötigen Informationen zusammen zu tragen und hier aufzuzeigen.
Vielen Dank schon an jeden Hilfeversuch.
Gruss
Koda
Ich habe in einer Laborumgebung folgende Komponenten:
Supermicro Server, Jahrgang ca. 2018/2019
HP ProLiant DL380 G6 also schon sehr alt
Auf dem DL380 läuft ESX 6.5, auf dem Supermicro läuft ESX 7.0. Beide sind in einem vCenter Server verbunden (kein Cluster oder sonstiges). Soweit sogut.
Nun habe ich eine ältere Smart-UPS X 1500 inkl Netzwerkkarte AP9631. Die Firmware ist mit Mitte 2019 jedoch noch sehr aktuell. Für meine Zwecke voll ausreichend.
Da es auf dem Supermicro einen Management Server gibt, habe ich mich entschlossen auf diesem (Windows Server 2019 x64) auch gleich PowerChute Network Shutdown v4.3 zu installieren. der vCenter Server ist die Appliance welche auf dem Supermicro läuft.
Das hat soweit auch gut funktioniert. Meine Einstellungen:
- Beginne Herunterfahren nach 120 Sekunden ohne Strom
- VM Shutdown, Force vApp Shutdown, Shutdown Durration 180 Sekunden
- vCenter Server VM Shutdown Duration: 180 Sekunden
- Unter Host Protection sind beide ESXi drin.
- Unter Shutdown Settings habe ich eingestellt das die UPS aus geht damit die Server nach Stromaufnahme wieder automatisch starten.
Der Test hat folgendes ergeben:
- Nach 2 Minuten wurde angefangen alles Herunterzufahren (Perfekt)
- Nach weiteren 150 Sekunden waren alle VMs heruntergefahren mit Ausnahme dem Management Server mit PowerChute sowie der vCenter Server VM. Soweit also auch gut.
- Der Supermicro ging nach gesamthaft knapp 7 Minuten aus.
- Die USV inkl. dem HP gingen nach etwas über 11 Minuten aus.
Soweit ein relativ gutes Ergebnis. Jedoch habe ich bisher einige offene Fragen die ich nicht beantworten konnte und noch am Suchen bin. Ggf hat ja von euch jemand einige Tipps für mich was ich beachten kann.
- Woher kommt die Zeit von ca. 11 Minuten bis die USV ausgegangen ist? Wartezeiten habe ich ja eigentlich nur 480 Sekunden definiert. Ist das irgendwo noch eine Einstellung die ich übersehen habe?
- Woran könnte es liegen das der HP erst mit der USV ausgegangen ist und nicht vorher bereits?
Ich habe die Loggs mal durchgesehen, bin aber anstelle auf erleuchtung eher auf weitere Fragen gestossen. Zum Beispiel möchte ich euch unten noch die Logs vom PowerChute unten anfügen. Ich finde es speziell das er erst vermeldet, dass der SuperMicro beim herunterfahren fehlgeschlagen ist, aber 30 Sekunden später heruntergefahren hat. Dies ist aber ok da er es gemacht hat. Beim HP gibt es die selbe Meldung, jedoch ist der nicht heruntergefahren.
2020-04-17 16:49:59 Shutting down Host SupermicroServer.
2020-04-17 16:49:32 Shutdown Host failed for Host SupermicroServer.
2020-04-17 16:49:26 Shutdown Host failed for Host HPServer.
2020-04-17 16:48:48 Exit Maintenance Mode on Host SupermicroServer.
2020-04-17 16:48:43 Exit Maintenance Mode on Host HPServer.
2020-04-17 16:45:48 UPS critical event: Outlet Group Turn off initiated.
2020-04-17 16:45:48 UPS Outlet Group: Servergruppe 1 turn off has been initiated.
2020-04-17 16:45:43 No vApp to shutdown on Host HPServer.
2020-04-17 16:45:43 Starting vApp shutdown process.
2020-04-17 16:45:42 Shutting down VMs on Host SupermicroServer.
2020-04-17 16:45:42 Starting Maintenance Mode Task on Host SupermicroServer.
2020-04-17 16:45:42 Shutting down VMs on Host HPServer.
2020-04-17 16:45:42 Starting Maintenance Mode Task on Host HPServer.
2020-04-17 16:45:42 PowerChute is turning off UPS 10.10.1.70
2020-04-17 16:45:42 Shutdown sequence started on Hosts HPServer, SupermicroServer in response to UPS critical event: On Battery.
2020-04-17 16:45:41 UPS critical event: On Battery.
2020-04-17 16:43:41 UPS has switched to battery power.
Ein Fehler der nun auf beiden Hosts angezeigt wird ist folgender:
17.04.2020, 17:30:52
Anmelden von administrator@vsphere.local@10.10.1.247 nicht möglich
Ereignistypbeschreibung:
Ein Benutzer hat versucht, sich mit einem unbekannten oder ungültigen Benutzernamen anzumelden
Mögliche Ursachen:
Der Benutzername ist auf dem System unbekannt Aktion: Falls Sie Active Directory verwenden, prüfen Sie den Status des Domänen-Controllers
Der Benutzer hat ein ungültiges Kennwort angegeben Aktion: Geben Sie das richtige Kennwort an
Bitte entschuldigt den langen Beitrag, ich habe versucht alle nötigen Informationen zusammen zu tragen und hier aufzuzeigen.
Vielen Dank schon an jeden Hilfeversuch.
Gruss
Koda
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 565570
Url: https://administrator.de/contentid/565570
Ausgedruckt am: 21.11.2024 um 22:11 Uhr
3 Kommentare
Neuester Kommentar
Hi,
grundsätzlich: Unter VMware nimmt man immer die von APC extra bereit gestellte PCNS-VM, kein installiertes Programm auf einem Windows Server.
Was mich stutzig macht:
Wieso ist das gut? Deine Erklärung und der Logauszug beißen sich.
Management VM und vCenter VM sind nicht heruntergefahren, also noch angeschaltet. PowerChute beendet dann den Maintenance Mode und kann logischer die Hosts nicht herunterfahren, weil noch 2 VMs laufen.
Was den HP-Server betrifft: Wenn der SuperMicro-Server inkl. vCenter nicht mehr läuft, funktionieren auch die vCenter-Zugangsdaten am HP-Server nicht mehr, bzw. können nicht validiert werden -> HP-Server muss zuerst heruntergefahren werden.
grundsätzlich: Unter VMware nimmt man immer die von APC extra bereit gestellte PCNS-VM, kein installiertes Programm auf einem Windows Server.
Was mich stutzig macht:
Nach weiteren 150 Sekunden waren alle VMs heruntergefahren mit Ausnahme dem Management Server mit PowerChute sowie der vCenter Server VM. Soweit also auch gut.
Wieso ist das gut? Deine Erklärung und der Logauszug beißen sich.
Management VM und vCenter VM sind nicht heruntergefahren, also noch angeschaltet. PowerChute beendet dann den Maintenance Mode und kann logischer die Hosts nicht herunterfahren, weil noch 2 VMs laufen.
Was den HP-Server betrifft: Wenn der SuperMicro-Server inkl. vCenter nicht mehr läuft, funktionieren auch die vCenter-Zugangsdaten am HP-Server nicht mehr, bzw. können nicht validiert werden -> HP-Server muss zuerst heruntergefahren werden.