sweetone
Goto Top

DPM Server killt Hyper-V VMs durch Platten-entzug

Hallo Ihr Leidensgenossen =),

ich habe ein Problem, welches mich nun schon 2 Monate quält und leider noch nirgends fündig geworden bin.

Erstmal die Hardware-Basis:
2 x identische Clusterserver Hyper-V
1 x seperaten Domänen/Backup/Verwaltungsserver
1x NAS (DX80) angebunden an die Clusterserver mit jeweils zwei SAS Leitungen.
1x NAS nur für den DPM Server

Nun zur Software:
- alle Server/VM's sind Server 2008 R2
- als VM laufen unter anderem (je eine Gruppe eine Partition auf dem NAS):
| SQL
| Anwendungsserver (Java)
| Terminalserver
| Japser

| File-Server

| DPM 2010 (heruntergefahren)
| Sophos Server
| Mailserver
| Domänenserver
- Neben den 3 Partitionen für die VM'S ist noch das Quorum eingerichtet
- es sind 3 Clusternetzwerke eingerichtet wobei zwei intern und eines in aktiver Steuerverwendung sind (alle aber im Status aktiv)

..ich hoffe ich habe erstmal keine wesentliche Info unterschlagen.

Und nun zu meinen leiden:
Einer der beiden Clusterserver wurde bedingt durch einen Virus neu installiert (komplett um sicher zu gehen).
==> Seit dem der eine Clusterserver weg war scheint der DPM Server beim Sicherungsvorgang den VM's die Festplatten zu berauben.
Entsprechende hinweise dazu fand ich in den Log's.
Das sieht dann so aus das die VM's unvermittelt in den Zustand aus wechseln oder z.B. der SQL Server in einen BlueScreen läuft.
Einmal hatte ich es beobachtet das der VM Status zu wird gesichert gefolgt von wird wiederhergestellt wechselt.
Weiterhin wurde neben der neu-Einrichtungen des Clusterservers zwischenzeitlich auch ein defektes Modul vom NAS System getauscht.

Wenn ich aktuell den Status der Clustervolumen betrachte steht bei einem dabei Online (Sicherung wird ausgeführt, Umgeleiteter Zugriff)
Bei den VM's unter diesem Clustervolume habe ich deutliche Performance Einbußen. Ich gehe davon aus das dies etwas mit dem DPM zu tun hat?
Ich sehe hier zwar den Schalter Umgeleiteten Zugriff für freigebenes Clustervolume deaktivieren, traue mich jedoch nicht (ist die oberste Gruppe ab SQL).

Ich hoffe ich habe für euch einigermaßen verständlich mein Problem niedergeschrieben.
Bitte fragt wenn irgend etwas unklar ist und natürlich herzlichen Dank schon mal das Ihr es zumindest gelesen habt. =)

Ansonsten seit gegrüßt aus Franken
SweetOne

Content-ID: 320276

Url: https://administrator.de/contentid/320276

Ausgedruckt am: 22.11.2024 um 10:11 Uhr

jenni
jenni 08.11.2016 um 10:54:33 Uhr
Goto Top
Servus,

2 x identische Clusterserver Hyper-V
Die Cluster Server sind auch 2008 R2?

| DPM (heruntergefahren)
Welche Version?

Einer der beiden Clusterserver wurde bedingt durch einen Virus neu aufgesetzt (komplett um sicher zu gehen).
Unschön, wie habt ihr die Clusterkonfiguration wiederhergestellt?

==> Seit dem der eine Clusterserver weg war scheint der DPM Server beim Sicherungsvorgang den VM's die Festplatten zu berauben.
Auf welchem Clusterserver befindet sich der DPM Server wenn dieses Phänomen auftritt

Das sieht dann so aus das die VM's unvermittelt in den Zustand aus wechseln oder z.B. der SQL Server in einen BlueScreen läuft.
Was sagt der Bluescreen

Wenn ich aktuell den Status der Clustervolumen betrachte steht bei einem dabei Online (Sicherung wird ausgeführt, Umgeleiteter Zugriff)
Umgeleiteter Zugriff wird im Speicherlaufwerk von allen Clusterkonten, die auf dieses Volume zugreifen, über das Netzwerk aktiviert. Dies kann zu einer Beeinträchtigung der Leistung führen.
How-To: Verwaltung eines Cluster Shared Volume (CSV)
Der umgeleitete Zugriff auf das freigegebene Clustervolume wurde aktiviert

Bei den VM's unter diesem Clustervolume habe ich deutliche Performance Einbußen. Ich gehe davon aus das dies etwas mit dem DPM zu tun hat?
Befindet sicher der DPM auf diesem Volumen?

Welcher Cluster hält welche Maschinen?
SweetOne
SweetOne 08.11.2016 aktualisiert um 11:35:25 Uhr
Goto Top
1. Die Cluster Server sind auch 2008 R2?
=> Ja, alle Server sind 2008 R2
2. Welche Version?
=> 2010, für genaueres müsste ich ihn hochfahren => ist eine genauere Versionsangabe erforderlich?
3. Unschön, wie habt ihr die Clusterkonfiguration wiederhergestellt?
=> komplett neu aufgesetzt, sprichg einmal formatiert und überall entfernt und dann als neu wieder eingebunden
4. Auf welchem Clusterserver befindet sich der DPM Server wenn dieses Phänomen auftritt
=> kann ich aktuell nicht genau sagen, da ich die VMs erst vorhin verschoben habe
==> aktuell sind jetzt die VM's jeweils auf dem Cluster der im Besitz des jeweiligen ClusterStorage liegt
5. Was sagt der Bluescreen
=> Habe ich ehrlich gesagt bislang verbogt zu fotografieren, kann ich dies im Nachgang noch auslesen?
==> wenn ich wieder denn Fall habe werde ich die Info nachreichen, nur zur normalen Arbeitszeit kann ich das schlecht testen =)
6. Umgeleiteter Zugriff
=> mein Problem ist: woher weis ich das ich den umgeleiteten Zugriff gefahrlos abschalten kann
7. Befindet sich der der DPM auf diesem Volumen?
=> nein, das betroffene Volumen ist die oberste Gruppe mit dem SQL-Server
8. Welcher Cluster hält welche Maschinen?
=> aktuell ist die komplette 3. Gruppe von oben (mit dem DPM) auf dem einen (CL1) und der Rest auf dem anderen (CL2)
jenni
jenni 08.11.2016 um 11:56:24 Uhr
Goto Top
5. Was sagt der Bluescreen
=> Habe ich ehrlich gesagt bislang verbogt zu fotografieren, kann ich dies im Nachgang noch auslesen?
==> wenn ich wieder denn Fall habe werde ich die Info nachreichen, nur zur normalen Arbeitszeit kann ich das schlecht testen =)
Dump-File?
SweetOne
SweetOne 10.11.2016 um 08:06:41 Uhr
Goto Top
Guten Morgen Jenni,

so jetzt war ich erstmal zwei Tage mit einem anderen Problem beschäftigt, weshalb ich hier nicht weitergekommen bin.

Leider ist das Dump / der Fehler aktuell nicht nachvollziehbar. Jedoch bin ich mir ziemlich sicher das es davon kommt, dass die SQL-Server Dateien von der entsprechenden Partition (getrennt vom OS) zeitweise nicht mehr korrekt erreichbar sind.

Aber etwas anderes konnte ich feststellen....
Ich habe versucht den den umgeleiteten Zugriff zu deaktivieren.

Dies wurde vom System jedoch abgelehnt:
Fehlercode: 0x8007173d
Momentan wird eine Sicherung durchgeführt. Warten Sie, bis die Sicherung abgeschlossen ist, bevor Sie den Vorgang wiederholen.

Kann es sein das hier eine Störung bzgl. des Zugriffs auf das Storage vorliegt, welcher dies verursacht und ggf. beim versuchten ändern des Status durch den DPM Server die Maschinen killt? Wo kann ich erkennen ob wirklich eine Anwendung den Befehl zur Backup-Bereitschaft aufrecht erhält.

Mir viel weiterhin auf das auf dem "alten" Clusterserver folgende 3 Programme drauf sind:
Emulex Common SAN Management 32.1.1.35
Emulex HBAnyware 4.1a35
Emulex Storport Miniport Driver Kit 2.20.006-1g

Meine Nachforschungen zeigen mir, dass dies die Software bzw die dazugehörige Hardware die Basis zur Verbindung zum Storage sein müsste.
Die Komponente wird mir beim "alten" Cluster im Geräte Manager unter Emulex PLUS angezeigt, beim neuen jedoch nicht.
Die Server sind jedoch Hardwaremäßig identisch ausgestattet => "Dell Emulex LPe1150 4Gb PCIe Fibre Channel Adapter".
Beim Blick auf das Storage selbst sind alle 2x2 Ports ordnungsgemäß verbunden => 4 Gbit/s Link Up

Gruß
SweetOne
jenni
Lösung jenni 10.11.2016 um 13:25:34 Uhr
Goto Top
Sind die Treiber gleich?

Schau mal hier

zum DPM Hyper-V Protection Issues

Und das könnte dir helfen

Gruß
der jenni
SweetOne
SweetOne 16.11.2016 um 10:07:14 Uhr
Goto Top
Hallo Jenni,

wir haben den Emulex Treiber entsprechend nachinstalliert, was allerdings keine Besserung brachte.

Die Freigabe lies sich durch einen Neustart des Cluster-Server korrigieren.

Das DPM Problem lag ursächlich offenbar an dem DPM Server selbst.
Diesen haben wir neu aufsetzen lassen, seit dem läuft es.

Mit freundlichen Grüßen
SweetOne
jenni
jenni 16.11.2016 um 14:35:30 Uhr
Goto Top
Servus,

Danke fürs Feedback

Gruß
der jenni