bombass
Goto Top

ESXi 4.1 Probleme mit die Datastorse bzw. der Raidcontroller

Liebe Froum Mitglieder,

ich betreibe einen ESXi 4.1 auf einen IBM TD200 mit folgeden Hardware:

Server: IBM TD200
Raidcontroller: IBM ServerRaid-MR10i SAS/SATA controller (mit Batterie)
CPU: Intel Xeon DP E5506 4x 2.13GHz
Raid 5: (3 IBM Platten a 1000 GB, 7200)
RAM: 20 Gb (1333Mhz)
Netzwerkkarte: NetXtreme II 1000 Express G Ethernet Adapter- PCIe

Software: Esxi 4.1
2 Datastore a 1,3 TB jeweils

Ich nutze "Veem Monitore for Vmware" um die Latenz Zeiten zu messen und der Host zu beobachten. Das Veem Monitore lauft selber auf einen Vmware

Was ich bemerkt habe dass die VM's ab und zu komplett frieren. D.H die CPU warten auf die I/O um die Daten zu lesen oder zu schreiben (meistens ein paar 1000 Millisekunden = 2 - 3 Sekunden).


c1ee564023770413b54b29cb7b7014b9


4549270714aad25beca06fb9501fb61a


8fcb272d25a0613375de4b56b0cbaf71


3ab30cb2fd30c40efb444f004758d917

8cac9de6131ce8841a5ec26c61ecec8e

Bei der Raidcontroler Status scheint alle ok zu sein!

Mir kommt es vor, als würde der ESXi order der Server irgend ein Job ausführen (alle 10-15 Min). Un das führt dazu, dass der Raidcontroller langsammer wird, bzw. die Read/ Write Latency

Ich bitte um Hilfe.

Besten Grüße
Rafael

Hier sind ein paar Screenshot von einen anderen Server mit die gleicht Konfiguration:

9ea54c818d5ef74551b0a66017469515


8cac9de6131ce8841a5ec26c61ecec8e

Content-Key: 158213

Url: https://administrator.de/contentid/158213

Printed on: April 16, 2024 at 11:04 o'clock

Member: Dani
Dani Jan 08, 2011 at 16:57:36 (UTC)
Goto Top
Hi Rafael,
meine Gegenfrage an dich lautet: Wie viele virtuelle Maschinen laufen auf dem phy. Server und wa läuft auf den einzelnen Maschinen?


Grüße,
Dani
Member: Oldmcreher
Oldmcreher Jan 08, 2011 at 17:26:54 (UTC)
Goto Top
Hi Rafael,

Hast Du in einer der VM`s evtl. Jobs laufen (Datenbanken?)

Kannst Du da noch eine HDD einbauen und ein RAID 10 einsetzen (Mehr R/W Performance)?

Kannst Du uns evlt. die VMWare Support FIles exportieren und zur Verfügung stellen?

Wie hast Du das Caching auf dem Controller eingestellt?

Ist die Firmware Aktuell auf den Controllern und Disks?
Member: bombass
bombass Jan 08, 2011 at 17:28:02 (UTC)
Goto Top
Hi Dani,

es laufen nur 3 Virtuelle Machinen:
- WinXP Pro 32 Bit. wird als Backupmachine und für die Telephon-Analge. Das ganze wird meistens von mir manuel angestoßen.
- Win 7. Mit eine MSSQL DB
- MindTouch 2010 (Ubuntu )

Das Problem den ich oben beschrieben habe, trifft auch wenn alle VM's ausgeschaltet sind. D.h die Read / Write Lateny sind zu hoch auch wenn alle VM's ausgeschlatet sind.

Grüße
Rafael
Member: bombass
bombass Jan 08, 2011 at 17:34:24 (UTC)
Goto Top
Hallo Oldmcreher,


Hast Du in einer der VM`s evtl. Jobs laufen (Datenbanken?)
--> Das Problem den ich oben beschrieben habe, trifft auch wenn alle VM's ausgeschaltet sind. D.h die Read / Write Lateny sind zu hoch auch wenn alle VM's
ausgeschlatet sind.
Kannst Du da noch eine HDD einbauen und ein RAID 10 einsetzen (Mehr R/W Performance)?
--> Ja, das kann ich machen, ich werde es am Montag testen.


Kannst Du uns evlt. die VMWare Support FIles exportieren und zur Verfügung stellen?
--> Wie mache ich das ? Kann ich das File über das VClient exportieren?

Wie hast Du das Caching auf dem Controller eingestellt?
--> Ich werde es am Montag prüfen,

Ist die Firmware Aktuell auf den Controllern und Disks?
--> Ich habe keine Update gemacht. Der ESXi unterstützt die IBM TD200 Server. Das Server haben wir vor ein paar Wochen gekauft. Die Firmware sollten aktuell sein.

Grüße
Rafael
Member: Oldmcreher
Oldmcreher Jan 08, 2011 at 17:38:47 (UTC)
Goto Top
Oh schnelle Antwort face-smile

Ja,.die VMWare Supportfiles kannst Du über den VM-Client bekommen.

Neue Hardware bedeutet nicht gleich, dass die aktuelle Firmware installiert ist, dass solltest Du unbedingt überprüfen, grade im Storagebereich kann es da zu großen Performance-Problemen kommen.
Member: bombass
bombass Jan 08, 2011 at 18:18:10 (UTC)
Goto Top
Hi,

ja, ich setzte vor meinen PC seit 6 Stunden. Ich muss diese Problem lösen, ab nächste Woche brauchen wir die VM's für die Produktibe Einsatz. Ich werde die Logs file exporteiren und hochladen. Welche Abschnitt brauchst du davon?

Was ich auch bemerkt habe, dass dass diese Fehler ofter kommt:

a55d8d277432325a753f045dedef0be1

Ich habe was gefunden bei VMWare:

http://kb.vmware.com/selfservice/microsites/search.do?language=en_US&am ...

Könnte dies das Problem sein?

Anbei die Datastores Einstellkungen:

ea01ee3d4e79bfd8861389567933cf7f

Schöen Grüße
Rafael
Member: Oldmcreher
Oldmcreher Jan 08, 2011 at 19:59:10 (UTC)
Goto Top
Hi Rafael,

ich glaube ich brauche das ganze Supportfile.

Der Artikel bezieht sich auf ein HBA also SAN, wo es Probleme mit Que gibt...

Also nicht für Deinen Fall.

Hast Du Dein Raid 5 in zwei Luns aufgeteilt oder wie kommen die 2 x 1,36 TB zusammen?

Wo hast Du die Cache Dateien der Server abgelegt?

Die erste Fehlermeldung sagt Dir dass das Vcenter nicht mit der VM Kommunizieren kann.

Kannst Du mir etwas über Dein Netzwerk sagen?

Hast Du mehrere Netzwerkkarten?
Sind die Ports alle 100% richtig koniguriert?

Das würde die Heartbeat Probleme erklären.
Member: bombass
bombass Jan 08, 2011 at 21:38:40 (UTC)
Goto Top
Hallo Herr Reher,

face-wink, dein Name habe ich in deinen Profile gefunden

ich habe einen Raid 5 volume von 3 Platten erstellet. Danach habe das Volume in zwei VV (viruelle Volumen) aufgeteilt (je 1,35 TB).
von die zwei Volumen habe ich dann die zwei Datastores erstellet.

Die VM's liegen direkt auf die zwei Datasores, d.h die liegen nicht in eine SAN oder externe Platte.

Wo hast Du die Cache Dateien der Server abgelegt? --> Was meinst damit? Welche cache dateien?

anbei noch mehr Information über meine Konfiguration:

9cb38a3692c52b5adc631a82209057f8


d0cf495494827b59bfa3e80a3c59f9a0

Die Logs files sind zu Große, welche davon soll ich hochladen oder dir per Mail schicken

a119f0b963b672e6ab00cbd1956c341c


Soll ich vieleicht das Raid 5 auflösen und einen Raid 10 erstellen? Was mich wundert ist, dass der Esxi für mehrere Studen sehr gut lauft und dann fangt wieder an zu "wacklen", komisch?


Schöne Grüße
Rafael
Member: Oldmcreher
Oldmcreher Jan 09, 2011 at 09:32:00 (UTC)
Goto Top
Moin Rafael,

kannst Du mir die Files auf einen FTP server ablegen oder Rapidshare oder sowas?

Ich würde DIr aus Performancegründen auf jeden Fall zu einem Raid 10 raten.

Die Cachefiles der VMs solltest Du immer "bei der VM" speichern.

Ja komisch ist das verhalten schon, desderwegen brauch ich ja die VMSupport Files,
Member: bombass
bombass Jan 12, 2011 at 08:52:20 (UTC)
Goto Top
Hallo Zusammen,

das Problem würde inzwischen gelöst. Und zwar durch das aktivieren der Cache an das RaidController von Write Policy= "Writethrough" zu Writethrough="Writeback". Was ich auch bemerkt habe ist, dass der Raidcontroller keine Batterie hat. Dafür hat der Server 2 Netzteile un eine (USV) (APC Smart UPS 1000VA).

Nun das Peinliche: ich bin ja ein Software entwickler und kein Administartor, daher ist mein Wissen in dieses Bereich begrenzt. Ich bedanke mich für eure Feedback

Frage1: wie ich oben beschrieben habe, handelt es sich um eine Raid 5 mit 3 Platten (3 x 1,5 TB). Nun habe ich im Office eine 1 TB Platte übrig. Macht es sinn das Raid 5 zu erweiteren mit eine 4 Platte. Wird das noch mehr Performence bringen?

Frage2: lohnt es sich einen Raid Batterie zu kaufen (150€) oder reicht es dass der Server 2 Netzteile und eine USV hat?

Übrigens: Das WriteLatency is gesungen von 1000 Millisekunden zu gerade mal 0.05 Millsekunde (durschnitlich). Hammer Unterschied!!! Oder?

Schöne Grüße
Rafael
Member: Oldmcreher
Oldmcreher Jan 12, 2011 at 14:43:31 (UTC)
Goto Top
Hi Rafael,

zur Frage 2 solltest Du diesen Beirag lesen und selbst entscheiden:

http://de.wikipedia.org/wiki/Battery_Backup_Unit

(Wir nutzen in unserem Betrieb die BBU`s)

zu Frage 1:

http://de.wikipedia.org/wiki/RAID#RAID_5:_Leistung_.2B_Parit.C3.A4t.2C_ ...

Ich würde ein Raid 10 einstzen, dann hättest Du effektiv noch 2 TB Plattenplatz zur Verfügung.
Beim Raid 5 bleiben Dir 3 TB nutzbarer Plattenplatz, hast bei einem rebuild aber Performance-verluste.