jsysde
Goto Top

Hyper-V, DPM, Consistency Checks nach Reboot der Nodes

Moin zusammen.

Ich beobachte hier schon länger ein Phänomen, für das ich keinerlei Erklärung finde - evtl. hat ja einer von euch ne Idee dazu.

Umgebung:
Hyper-V 2012 R2 Cluster (drei Stück; zwei Mal vier Nodes, ein Mal zwei Nodes) und DPM 2012 R2. In den Clustern viele, viele VMs, alles Windows Server Maschinen (2008 R2/2012/2012 R2), die per VSS-Snapshot vom DPM gesichert werden.

Problem:
Klappt soweit alles prima, mit einer (leider immer wiederkehrenden) Ausnahme:
Wenn ich die Nodes mit Updates versorgt und neu gestartet habe, schlagen reproduzierbar die nächsten Recovery Points auf dem DPM fehl, es folgt immer ein Consistency Check _aller_ VMs im jeweiligen Cluster.

Wir haben auch noch einige Standalone Hyper-V Nodes, bei denen tritt das nicht auf; die kann ich rebooten, wie ich will, die Backups per DPM laufen stressfrei durch, ohne Consistency Check.

VSS-Logs hab ich schon vor und zurück gewälzt, hier gibt es keinerlei Probleme, alles sieht gut aus. Auf dem DPM finde ich ebenfalls keinerlei Hinweise, ausser dieser Standardfehlermeldung:
Change Tracking has been marked inconsistent due to one of the following reasons
1. Unexpected shutdown of the protected server
2. Unforeseen issue in DPM Bitmap failover during cluster failover of one or more datasources sharing the tracked volume. (ID 30501 Details: Unknown error (0xe0062041) (0xE0062041))

Damit komme ich allerdings auch nicht weiter, die Ergebnisse einer google-Suche dazu sind sehr diffus und beziehen sich in aller Regel auf Hyper-V 2008 (R2) und DPM 2010.

Den Clustern selbst geht es ebenfalls gut, Validation klappt und auch die Cluster-Logs liefern keine brauchbaren Hinweise.

Hat jemand eine ähnliche Umgebung und kennt dieses Verhalten?

Sachdienliche Hinweise werden dankend entgegengenommen. face-wink
Grazie Mille!

Cheers,
jsysde

Content-Key: 289323

Url: https://administrator.de/contentid/289323

Printed on: April 19, 2024 at 03:04 o'clock

Member: -ricardo-
-ricardo- Nov 25, 2015 at 13:00:57 (UTC)
Goto Top
Ist bei dir das Clusterfähige Aktualisieren aktiv?
Member: jsysde
jsysde Nov 25, 2015 at 13:15:10 (UTC)
Goto Top
Moin.
Zitat von @-ricardo-:
Ist bei dir das Clusterfähige Aktualisieren aktiv?
Nope. Wir machen das noch "manuell". face-smile

Cheers,
jsysde
Member: jsysde
jsysde Nov 26, 2015 at 08:58:21 (UTC)
Goto Top
Moin.

Habe gestern noch ein wenig "gespielt":
Zwei-Node-Cluster, Node2 leergeräumt und neu gestartet, dann die VMs wieder auf Node2 geschoben. Im DPM einen Recovery Point gemacht => Fehler => Consistency Check. Auf Node1, der nicht neu gestartet wurde, klappen Recovery Points erwartungsgemäss.

Vorher wild VMs zwischen Nodes migriert, VMs neu gestartet, Owner der CSVs geändert - alles ohne Auswirkungen auf's Backup, es liegt also reproduzierbar am Neustart der Cluster-Nodes.

Anyone? face-wink

Cheers,
jsysde
Member: -ricardo-
-ricardo- Nov 26, 2015 at 11:01:08 (UTC)
Goto Top
Da muss ich passen :D sorry
Member: jsysde
jsysde Jan 05, 2016 at 20:23:09 (UTC)
Goto Top
N'Abend.
Zitat von @-ricardo-:
Ist bei dir das Clusterfähige Aktualisieren aktiv?
Habe mich -da ich den Urlaub ja ein wenig produktiv nutzen muss *g*- mal ein wenig in CAU eingelesen und werde mal schauen, ob mir das weiterhilft.

Cheers,
jsysde
Member: jsysde
jsysde Apr 09, 2016 at 07:58:15 (UTC)
Goto Top
Moin moin.

So, noch ein bisschen Input von mir, vielleicht hat ja noch jemand ne Idee.
Wir betreiben mehrere Hyper-V Cluster an verschiedenen Standorten, mit unterschiedlicher Hardware.

Der oben beschriebene Fehler tritt nur am Hauptstandort auf, dort ist eine NetApp in Betrieb und der ClusterStorage liegt auf eben dieser. Die Cluster-Nodes sind allesamt DELL Blade Server (M610e, M620e), die allesamt in einer M1000e stecken.

An anderen Standorten laufen die Hyper-V Cluster auf DELL VRTX Systemen -teils Server 2012, teils 2012R2- und dort tritt der Fehler nicht auf.
Auch an den Kleinst-Standorten, an denen nur ein einzelner (DELL) Server als Hyper-V Host läuft und kein Cluster vorhanden ist, tritt kein Fehler auf, wenn ich den Host neugestartet habe.

Ich mutmaße jetzt also, dass es in irgendeiner Form mit der M1000e/den Blade Servern und/oder der NetApp zu tun haben muss - denn das sind die einzigen Unterschiede, die ich im Vergleich zu den anderen Hyper-V Clustern feststellen kann.

Vorschläge? Ideen? Irgendjemand?

Danke und Cheers,
jsysde