hushpuppies
Goto Top

APC SmartUPS 3000 - ESX und VMs sauber runterfahren

Hallo zusammen,

ich habe ein Frage zum Thema USV Integration in VMWare.
Oder eigentlich würde ich nur gern wissen, ob ich alles richtig gemacht habe, denn ich hatte bisher noch keine USV von APC und die Dokumentation ist etwas merkwürdig finde ich.

Es geht um einen einzelnen ESX-Host an einem Außenstandort. Auf diesem laufen etwa 5 VMs (DCs, SQL, TS) - nix besonderes also.
Nachdem sich die vorhandene USV von Online-USV lautstark und stinkend verabschiedet hatte, habe ich eine APC SmartUPS 3000 samt Managementkarte beschafft und installiert.
Den ersten kurzen Stromausfall hat die USV auch schon gemeistert.

Jetzt würde ich natürlich gerne, dass der ESX die Maschinen und sich selbst bei einem längeren Stromausfall sicher runterfährt.
Folgendes habe ich bisher gemacht:
- USV und Mangementkarte eingerichtet (mit Hilfe der Assistenten)
- APC Network-Shutdown VM runtergeladen und installiert
- Im VSphere unter Konfiguration das automatische Starten und Herunterfahren aktiviert (Start jeweils mit 60 Sekunden Abstand, Runterfahren jeweils mit 120 Sekunden Abstand mit der Option "Gast herunterfahren")
- In der APC VM bei den Events die gewünschten Notifications angeschaltet und bei dem Event "Runtime remaining below threshold" habe ich die shutdown-Option aktiviert mit einem threshold von 12 Minuten

So hatte ich das aus der Doku heraus gelesen und wenn ich das richtig verstanden habe, sollte das bewirken, dass wenn die Batterie noch Saft für 12 Minuten hat, der Shutdown-Befehl an den ESX geht und dieser dann erst die Maschinen und dann dann sich selbst sauber runterfährt.

Stimmt das so oder habe ich was übersehen?

Content-ID: 277493

Url: https://administrator.de/contentid/277493

Ausgedruckt am: 13.11.2024 um 06:11 Uhr

beidermachtvongreyscull
beidermachtvongreyscull 16.07.2015 aktualisiert um 09:12:09 Uhr
Goto Top
Wenn die Managementkarte eine netzwerkfähige ist, dann lass doch die virtuellen Maschinen direkt mit der quatschen.
Das ist sicherer, denn dann fahren die virtuellen auf eigenes Bestreben herunter und müssen nicht angeschubst werden.

Achte drauf, dass Du den ESX im BIOS so einrichtest, dass er nach totalem Strom-weg-Fehler auch wieder anfährt.
Schau mal in der USV nach, ob die das simulieren kann, denn es gibt auch die Möglichkeit, dass alles herunterfährt, der Strom
aber nicht gänzlich ausfällt. Dann hast Du nämlich das Problem, dass Dein Server nicht weiß, dass er wieder hochfahren kann,
nachdem die USV wieder im Normalbetrieb ist.

Bei HP-USVs gibt es da die Möglichkeit, die Lastsegmente für eine bestimmte Zeit stromlos zu schalten, um genau das zu simulieren.

Beim ESX muss ein Agent installiert werden, der ihn runterfährt.
Ich würde das aber nur machen, wenn der Datastore ebenfalls auf dieser Maschine liegt. Ansonsten verkraftet der hartes Ausschalten eigentlich
ganz gut.
hushpuppies
hushpuppies 16.07.2015 um 09:40:51 Uhr
Goto Top
Also soweit ich das sehe, hat die Management-Karte keine Möglichkeit direkt mit dem ESX zu kommunizieren.
Ich kann dort bei den Events nichts eintragen außer einer E-Mail-Benachrichtigung und laut der Doku ist das auch richtig so.
Man braucht wohl entweder einen PC oder eben eine VM mit der Software, die den Status der USV über die Karte abfragt und dann entsprechende Aktionen auslöst.

Das mit dem BIOS ist ein guter Hinweis - das muss ich noch überprüfen, wobei ich meine, dass das schon aktiviert wäre - sogar mit einem entsprechenden Timer, dass das nicht sofort wieder angeht sondern erst nach ein paar Minuten, damit man sicher ist, dass der Strom wieder richtig da ist.
beidermachtvongreyscull
beidermachtvongreyscull 16.07.2015 um 09:51:38 Uhr
Goto Top
Ich hab mit APC schon länger nicht mehr gearbeitet, meine aber, dass ein installierter und konfigurierter Softwareagent sich bei der Managementkarte selbst anmeldet und unter "Notified Applications" oder so ähnlich einträgt.

Zumindest läuft es bei HP so.

Ich weiß leider immer noch nicht, ob die Karte eine Netzwerkkarte ist oder nur serielle oder USB-Verbindungen zur USV möglich sind.

Aus meiner Sicht brauchst Du einen Agent auf dem ESX, der die Büchse runterfährt. Es gibt da unterschiedliche Ansätze.
- direkter Weg (Notified Applications)
- alternativer Weg (SNMP-Traps)
keine-ahnung
keine-ahnung 16.07.2015 um 09:58:23 Uhr
Goto Top
Moin,
warum schaust Du nicht an der Quelle nach??

LG, Thomas
hushpuppies
hushpuppies 16.07.2015 aktualisiert um 10:56:47 Uhr
Goto Top
Tschuldigung, natürlich ist die Management-Karte mit Netzwerkanschluss - hatte ich vergessen oben zu erwähnen.

Und ja, die installierte VM (oder auch die normale Softwareinstallation auf einem PC) meldet ich an der Managementkarte quasi an und taucht dort dann als PowerChute Agent auf.

Auf der VM richtet man dann u.a. Zugangsdaten zum ESX ein (also lokales Konto auf dem ESX mit entsprechenden Rechten).
Sprich eigentlich müsste die VM dann in der Lage sein dem ESX die nötigen Befehle zu geben ohne dass man noch einen Agenten auf dem ESX braucht, oder?

@keine-ahnung:
Danke für den Link, aber wenn du bei mir oben beim dritten Punkt liest, habe ich das schon gemacht gehabt.


So wie ich das sehe, ist das dann einfach so, dass die APC-VM ein shutdown-Befehl direkt an den ESX schickt und der wiederum dann über die Einstellung bei automatisch Herunterfahren die einzelnen VMs stoppt, bevor er selber runterfährt.

Was mich jetzt noch interessieren würde, wäre ob ich das richtige Event für diesen Zweck benutzt habe.

Außerdem gibt es auf der Web-Oberfläche der Management Karte irritierenderweise unter Configuration einen Punkt "Shutdown".
Dort steht aber leider nicht dabei worauf sich das genau bezieht - ich vermute das bezieht sich auf einen Shutdown der USV selber - denn ich kann ja hier nirgends irgendwelche Zugangsdaten (außer zur USV) eintragen.

Screenshot: http://i.imgur.com/U4PGRPw.png

Folgendes ist hier eingetragen. Sprich wenn die USV noch 2 Minuten Saft hat wird sie nach 20 Sekunden Verzögerung heruntergefahren und bleibt dann solange aus, bis wieder für mindestens 10 Minuten Batteriebetrieb genug Leistung vorhanden ist.
Stimmt das so und macht das Sinn?
beidermachtvongreyscull
beidermachtvongreyscull 16.07.2015 um 11:22:12 Uhr
Goto Top
Dein Szenario kommt mir sehr knapp vor.

2 Minuten Restsaft und Du fährst alles sauber runter?!

Gut wenn's hinhaut. Setzt natürlich voraus, dass die Batterien nicht schlapp machen.

Ich würde das so machen:
Strom fällt aus. Nach spätestens 1 Minute fährt bei mir alles runter, denn aus meiner Sicht ist die USV dazu da, um die Anlage bei Stromausfall in einen gesicherten Zustand zu überführen. Stromausfallüberbrückung käme für mich infrage, wenn der Stromkreis an einer Netzersatzspannungsanlage (Notstromdiesel und dergleichen) hängt.

Der UPS Shutdown könnte sein, was ich vermute.
Wenn Dein Server heruntergefahren ist, der Strom aber nicht ausgefallen ist, kriegst Du ihn ohne Managementkarte nur mit Wake-on-Lan oder Strom-aus-Strom-an (Biossetting "Restore Status after Power Failure" oder so ähnlich) wieder an.
hushpuppies
hushpuppies 16.07.2015 um 14:17:09 Uhr
Goto Top
Zitat von @beidermachtvongreyscull:

Dein Szenario kommt mir sehr knapp vor.

2 Minuten Restsaft und Du fährst alles sauber runter?!

Gut wenn's hinhaut. Setzt natürlich voraus, dass die Batterien nicht schlapp machen.

Ne, die 2 Minuten sind die Zeit, die USV übrig hat bevor die USV selber sich abschaltet - zumindest interpretiere ich diesen Dialog so.

Mein eigentlicher Zeitpunkt zum Runterfahren der VMs und des ESX ist ja wie oben beschrieben bei 12 Minuten Restlaufzeit.

Aber genau diese Verwirrung bei den Begriffen - dass das überall "shutdown" heißt und nirgends genau steht was genau jetzt gemeint ist, hat mich zu dem Erstellen der Frage hier gebracht...