wern2000
Goto Top

VMWare ESX 5.5 Crash nach Raid vergrößerung ständig mit lila screen

Hallo zusammen,

seit dem ich das Raid von 5x2 TB auf 7x 2 TB vergrößert habe crasht VMWare ständig wenn ich auf Windows 2012 R2 höhere Festplattenlast habe.

Angefangen hat die ganze odyse so.

5x 2 TB (8 TB Raid 5) waren irgendwie zu wenig. Also wollte ich kurzer Hand das Raid von 5x 2 TB auf 7x 2 TB vergrößern. Hab es schon mal von 3x 2TB auf 5x 2 TB vergrößert.
Server von Adaptec CD gebootet und Raid erweitert ca 2-3 % laufen lassen und Server neu gestartet wollte ja weiterarbeiten.
Nach dem Reboot war das Hauptraid und die Temp-Raids weg -> anruf bei Adaptec -> Pech gehabt.
Also neues Raid mit 7x 2 TB erstellt und einen Windows 2008 r2 mit Backupexec installiert -> kein Problem
Virtuelle Server wiederherstellen -> Virtueller Server kann nicht erstellt werden (Laut Symantec soll ich es mit umleitung versuchen)
Virtuelle Server mit umleitung wiederherstellen -> ging auch nicht Irgendwas mit Authentifizierung
Virtuelle Server mit Dateiumleitung auf den neuen Server wiederhergestellt und mit VMWare Client in den Storage geladen.
Nebenzu Virtuellen Server01 (TS-Server) neu mit Windows 2012 r2 neu installiert (wäre sowieso bald fällig gewesen)
Alle Virtuellen Server laufen wieder
Storage1 12 TB (Adaptec 6805 Raid5)
Storage2 einzelne 1,5 TB SATA Platte für Backup2Disk
Server01 (TS-Server und WSUS Windows 2012 r2)
Server02 (Backup, Antivirus und Fileserver Windows 2008 r2 hat 4x 2TB HD Dynamischer Datenträger übergriefend 8 TB)
Server03 (Exchange Windows 2008 r2)
Server04 (SQL Windows 2008 r2)
Linux Debian mit Squid Proxy

Wollte auf den neuen TS-Server Office 2013 installieren (Files liegen auf Server02) auf einmal im VMWare Client "waiting for connection"
auf VMWare Host umgeschaltet -> Lilascreen mit Server02
zufall???
VMWare Host wieder gestartet: Vom Server01 eine Datei (Firefox-Setup) von Server02 geholt -> Lilascreen mit Server02
VMWare Host wieder gestartet: ca 20GB von Server02 auf meinen PC geladen kein Problem
auf Server03 eingelogt und ebenfalls ca 20 GB von Server02 geladen kein Problem
auf Server01 eingelogt nach ca 10 mb Remotedesktop tot -> lilascreen mit Server02
Firmware des Adaptec 6805 aktualliesiert -> Keine Verbesserung
aktuelle VMWare Treiber für Adaptec auf Host installiert -> Keine Verbesserung
update des Host von 5.1 auf 5.5 -> Keine Verbesserung
neuen USB-Stick genommen und neu mit 5.5 installiert -> Keine Besserung
Hab dann Server01 einfach nur stehn lassen -> Firefox von Internetgeladen, WSUS Updatenlassen (hat ca 6 GB geladen), VMWare Host läuft ohne Probleme
über nacht -> Lila Screen mit TCPIP4
heute einfach so -> Lila Screen mit Server01

Hardware:
Supermicro X7db8 mit 2x Xeon 5440
24 GB Ram (Memtest hab ich laufen lassen)
Adaptec 6805
29320 mit LTO Streamer
Gebootet wird der VMWare Host von USB-Stick

eigentlich jetzt 2 Probleme wo ich Hilfe benötige

1: Nach VMWare Host neustart fehlt immer Storage1 (12 TB) egal ob absturz oder Reboot mit/ohne Wartungsmodus
2: Was mach ich gegen die Lila Screens (Raid löschen und wieder zurück auf 5x 2TB Raid5?)

hier noch ein paar bilder der lila screens (sollten sie nicht aufrufbar sein mach ich gerade einen reboot des VMWare Hostes)
http://wern.dnsalias.com/bilder/vmware/wp_000199.jpg
http://wern.dnsalias.com/bilder/vmware/wp_000200.jpg
http://wern.dnsalias.com/bilder/vmware/wp_000201.jpg
http://wern.dnsalias.com/bilder/vmware/wp_000203.jpg

Content-ID: 246753

Url: https://administrator.de/contentid/246753

Ausgedruckt am: 21.11.2024 um 15:11 Uhr

schmitzi
schmitzi 18.08.2014 um 19:33:03 Uhr
Goto Top
Hi,

haben die 2 neuen Platten evtl einen Hau oder passt die Firmware nicht ins Adaptec-Raid oder ist zu alt ?

Gruss RS
Wern2000
Wern2000 18.08.2014, aktualisiert am 19.08.2014 um 10:39:29 Uhr
Goto Top
das Raid5 über 7 platten wurde komplett aufgebaut. Kein Quickinit oder so. Sondern Build/Verify
ein seperates verify hab ich noch nicht gemacht.
allerdings sind alle VMs auf dem großen Raid.
Hab eben zum testen ca 1 TB daten von dem großen Raid auf die b2d platte und gleichzeit ca 200 GB über das Netzwerk auf meinen PC kopiert. Lief ohne Probleme

Werd die nächsten Tage die VM mit dem w2012 aus lassen und schauen ob es sich beruhigt
bleibt aber immer noch die sache das nach jedem reboot des Host Storage1 weg ist.

Edit:

Hab heute nacht die VMs ein bisschen gestresst mit ausgeschaltetem Server01
gleichzeitig:
nochmal 1 TB auf die b2d platte kopieren lassen
500 GB über das Netzwerk auf meinen PC Kopieren lassen
SQL (3 Instanzen mit ca 9 GB) und Exchange (ca 6 GB) Datensicherung 5x laufen lassen
komplettes Backup der VMs auf Streamer
-> lief ohne Probleme durch

hab die konfig von Server01 neu erstellt und auf Hardwareversion 9 eingestellt
ebenfalls von LSI SAS auf paravirtual umgestellt
beim kopieren über Netzwerk der Office cd von server02 -> lila screen nach ca 300 MB, diesmal Server04 (SQL)

http://wern.dnsalias.com/bilder/vmware/wp_000208.jpg

Hab eben die komplette VM von dem W2012 auf die einzelne Sata Platte verschoben (Storage2)

zum test von dem wusu update ordner mit ca 6 gb eine Kopie erstellt -> kein absturz
kopiere ich den wusu Ordner über Netzwerk auf meinen PC -> kein absturz

Kopieren von größeren Daten zwischen den w2008 server kein problem
Kopieren von w2008 auf w2012 -> VMWare Host Crasht wieder
SlainteMhath
SlainteMhath 19.08.2014 um 13:27:06 Uhr
Goto Top
Moin,

mit der 5.5 und 2012R2 gabs m.W. nach Probleme... Hast du U1 + Patches auf den ESXi's installiert? Wenn nicht, mach das mal face-smile

lg,
Slainte
schmitzi
schmitzi 19.08.2014 aktualisiert um 13:30:44 Uhr
Goto Top
Hi,

nur mal zur Orientierung:

Meinen WSUS unter W2012-R2 auf VM 5.5 (HP-ISO-Build OHNE weitere Patches) habe ich
mit LSI Logic SAS und VMXNET3-LAN-Adapter eingerichtet...
Version der virtuellen Machine: 8
Ach ja: Nur 1 CPU (davon stand auch was in Deinem lila-screen)

-> keine Probleme

Wenn mir noch was einfällt schreibe ich wieder

Gruss RS
schmitzi
schmitzi 19.08.2014 aktualisiert um 13:33:53 Uhr
Goto Top
...ach und schau mal hier:

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&am ...

Memory-Problem ?

Gruss
RS
Wern2000
Wern2000 19.08.2014 aktualisiert um 17:34:58 Uhr
Goto Top
hab schon memtest mit abgeschalteten ECC gemacht

patch 1 hab ich noch nicht drauf.

http://www.reddit.com/r/vmware/comments/1nhwjj/psod_high_io_networkstor ...

hat mich auf was gestoßen
hab heute kurz vor mittag die Netzwerkkarte von E1000 (default vorgabe für w2012) auf vmxnet3 umgestellt.
Hatte es leider vergessen, dass beim erstellen der VM schon zu tun. Die anderen VMs laufen alle auf vmxnet3. (Batsch auf den Hinterkopf)

Seitdem scheint es zu laufen.

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&am ...
hatte ich schon gefunden
Sagt eigentlich nur aus allgemeiner Hardware oder Software fehler

kopiere eben ca 100 GB von server02 auf server01. Bis jetzt bei 70 GB, kopiert mit einer geschwindigkeit von bis zu 130 MB/sek
Installation von Office 2013 mit Files auf Server02 lief jetzt auch ohne Absturz

bleibt aber immer noch das Problemchen das Storage1 nach einem reboot nicht mehr in der Konfiguration vorhanden ist.
Muss nach jedem neustart des Host den Speicher hinzufügen.
schmitzi
schmitzi 19.08.2014 um 23:41:47 Uhr
Goto Top
Hi,

hört sich doch schon mal besser an.

Welche Versionen haben Deine Storages ? Schau mal JEWEILS mit RechtsKlick/Eigenschaften

Gruss
RS
schmitzi
schmitzi 19.08.2014 um 23:47:48 Uhr
Goto Top
..soll heissen,
lies mal das hier:
http://www.vcloudnine.de/vmware-esxi-5-5-host-doesnt-mount-vmfs-5-datas ...

[ ]


und lande dann sehr wahrscheinlich bei dem hier:

esxcli system settings advanced set –i 0 –o /VMFS3/HardwareAcceleratedLocking

Quelle (HP):
http://h20565.www2.hp.com/portal/site/hpsc/template.PAGE/public/kb/docD ...

Viel Erfolg
Gruss
RS
Wern2000
Wern2000 20.08.2014 aktualisiert um 09:10:26 Uhr
Goto Top
Das Dateisystem ist schon 5.58 und wurde mit 5.1 erstellt

nach dem Reboot unter:
Konfiguration/Speicheradapter/aacraid/vmhba4:c0 Ist das Raid vorhanden und gemountet
Konfiguration/Speicher/Geräte alles was da sein sollte ist aufgelistet und Betriebszustand gemountet
Konfiguration/Speicher/Datenspeicher Storage nicht vorhanden
Weder "aktualisieren" noch "alle erneut prüfen" fügt das Storage hinzu. Geht erst mit Speicher hinzufügen.
Ich kann nach dem reboot sofort den Speicher hinzufügen ohne aktualisieren oder erneut prüfen.

hab mal ein grep vmhba4 auf alle logs gemacht

die letzten zeilen lauten
2014-08-20T05:49:29.681Z: [scsiCorrelator] 23710467us: [vob.scsi.scsipath.add] Add path: vmhba4:C0:T0:L0
2014-08-20T05:49:30.085Z: [scsiCorrelator] 24114289us: [vob.scsi.scsipath.add] Add path: vmhba4:C3:T0:L0
2014-08-20T05:49:45.046Z: [scsiCorrelator] 39075646us: [vob.scsi.scsipath.pathstate.on] scsiPath vmhba4:C3:T0:L0 changed state from dead
2014-08-20T05:49:46.510Z: [scsiCorrelator] 40540079us: [vob.scsi.scsipath.pathstate.on] scsiPath vmhba4:C0:T0:L0 changed state from dead

c0 ist das 12 tb raid
c3 ist enclosoure (SAS-Backplane ist mit einem zusätzlichem Stecker am SAS-Kabel mit dem Adaptec verbunden)