jawcruncher
Goto Top

Windows-Fileserver SEHR langsam

Sehr performanter Server, sehr schnelles Netzwerk, aber Dateizugriff über das Netzwerk ist trotzdem sehr sehr langsam.

Hallo,

ich habe hier ein Problem mit einem Server. Es handelt sich im einen HP Proliant ML370 G3, ein wenig in die Jahre gekommen aber noch lange kein altes Eisen.
Im Server ist ein RAID 5 (SmartArray 641) mit 3 Platten a 140 GB mit 15000 rpm. NIC ist die onboard, also eine NC7781 GBit-Ethernet.

Eigentlich ist die Maschine recht flott unterwegs, es lief lange Zeit ein VMware mit etlichen virtuellen Maschinen drauf, die sind nun aber auszogen und es arbeitet nur eine kleine Datenbankanwendung auf der Kiste.

Seit einer Woche ist sie nun aber auch Dateiserver und der Durchsatz ist extrem schlecht. Wenn ich mit Robocopy große Dateien auf einen anderen Server kopiere, bekomme ich etwa 1% Netzwerklast hin, die Nutzrate ist also etwa 1 MByte/s. Ob Robocopy auf dem Quell- oder Zielserver läuft macht dabei keinen großen Unterschied. Auch unsere Datensicherung (Backup Exec 10.1) holt über den lokalen Agent nur etwa 70 MByte in der Minute vom Server. Gewohnt bin ich hier von baugleichen Maschinen etwa 1200 MByte/min beim Schreiben direkt auf das LTO.

Teste ich die Netzwerkperformance mit netio bekomme ich problemlos 80 MByte/s, kopiere ich auf dem Server mit Robocopy Dateien von einer Partition auf die andere (beides das gleiche RAID), sind etwa 20 MByte/s drin.

Ein Test mit dem ATTO Disk Benchmark gab außerdem einen sehr merkwürdigen Kurvenverlauf:
bei 512 Byte Blockgröße sind (schreibend/lesend) 2,3/3,2 MByte/s drin, dann steigen die Werte an,
bei 8 kByte sind es 20,8/44,2. Ab hier bricht der Lesedurchsatz jedoch ein, der Schreibdurchsatz steigt weiter!
Bei 16 kByte sind es 30,9/7,5,
bei 32 kByte dann 42,0/3,5 und auf der Höhe halten sich die Werte bis zu Blockgrößen von 8 MByte.

Das Eventlog ist sauber, der Switch langweilt sich, die CPUs auch, reichlich freies RAM im Server (4 hat es, min 2 MByte sind ungenutzt). Weder Switch noch Netzwerkkarte sehen irgendwelche Fehler und wenn ich mit Wireshark mir die Verbindung ansehe, ist da auch nichts auffälliges zu sehen.

Kurz: Ich bin ratlos und brauche ein paar verdammt gute Ideen!

Mit freundlichem Gruß,

Jens

Content-ID: 113402

Url: https://administrator.de/contentid/113402

Ausgedruckt am: 21.11.2024 um 14:11 Uhr

harald21
harald21 07.04.2009 um 15:08:33 Uhr
Goto Top
Hallo,

mit netio werden also etwa 80 MB/s erreicht, mit Backup oder robocopy aber nur 2 MB/s?
RAM und CPU-Leistung sind ausreichend vorhanden? (Ich denke 2 MB freier RAM ist ein Schreibfehler? face-wink )

Ich würde mal vorschlagen, du überprüfst deinen RAID-Controller:
- Ist keine defekte DISK im Array?
- Sind das aktuellste Controller-BIOS und der aktuellste Treiber installiert?
- Ist der Controller-interne Schreibcache aktiviert und BBU (Backup batterie Unit) installiert?
- Ist die Disk defragmentiert?

mfg
Harald
JawCruncher
JawCruncher 07.04.2009 um 15:24:45 Uhr
Goto Top
Hi,

klar, hat 4 GB von 2 GB RAM frei.
Platten sind iO, werden bei mir per HP SIM überwacht. Firmware des Servers inkl. aller HP-Komponenten ist auf aktuellem Stand, Batterie installiert und iO, Schreibcache des SA aktiviert (50/50 Lesen/Schreiben).

Platte ist defragmentiert (das geht jede Woche automatisch). OS ist übrigens ein Win 2k3R2.

Jens
v-m-r-de
v-m-r-de 07.04.2009 um 18:08:13 Uhr
Goto Top
Hi,

hast Du auch beim Schreiben auf den Dateiserver so tolle Übertragungsraten übers Netzwerk?
Wie sieht es beim Kopieren vom lokalen CD-/DVDLaufwerk auf das RAID aus? Lahmt es hier auch?
Wie schnell kannst Du von dem RAID auf einen USB-Stick am Server kopieren?

Gruß,
Volker
JawCruncher
JawCruncher 07.04.2009 um 20:12:23 Uhr
Goto Top
Hallo Volker,

nein, lokal ist alles klasse.

Allerdings war auch schon das Kopieren der Daten über das Netz auf den Server auffallend langsam, ich war dem letzte Woche aber nicht nachgegangen.

Ach ja, der Virenscanner ist testweise natürlich (als erster Verdächtiger) mal deaktiviert worden, das hatte aber keine Auswirkung.

Jens
v-m-r-de
v-m-r-de 07.04.2009 um 23:46:37 Uhr
Goto Top
Hi,

also dann fasse ich mal zusammen:

- Kopieren lokal zu lokal super mit ca. 20MB/s laut Deinem ersten Posting (ist aber auch keine Weltmacht, oder?)
- Lesen und Schreiben übers LAN mit max 1MB/s

Wie sieht es denn aus, wenn Du das CD-ROM (und einen USB-Stick) mal frei gibts und von dort was übers LAN liest. Wo sind hier die Übertragungsraten?

Hat das OS extra Platten oder läuft es mit auf dem RAID 5?

Wie sieht die Sache aus, wenn Du anstelle direkt auf Dateiebend auf den Server zuzugreifen über den Umweg eines kleinen FTP/HTTP Server auf die Platten zugreifst? Sozusagen über ein anderen Protokoll den Server ansprichst. Sind dann die Raten besser?

Gruß,
Volker
JawCruncher
JawCruncher 08.04.2009 um 11:58:11 Uhr
Goto Top
Hallo Volker,

lokal sind 20MB/s, wenn vom gleichen Array gelesen wird, auf das geschrieben wird. Nur Lesen/Schreiben wuppt dann ja auch 45MB/s, das finde ich für die Platten im
RAID schon ok.

CD habe ich getestet, CD auf HD macht etwa 4 MB/s (ich vermute mal, das CD macht nur 48x., das wären ja auch nur 7 MB/s.
Gebe ich die CD frei und kopiere eine Datei vom 110 MB, klebt der Durchsatz bei 0,6% der NIC, also etwa 0,7 MB/s.

FTP: Ich habe einen FTP-Server eingerichtet und ein lokales Verzeichnis im Array freigegeben (HD) und außerdem einen Share eines anderen Servers als Unterverzeichnis (Share) freigegeben. Dann habe ich mit zwei Dateien getestet, eine von 110 MB, die andere von 1,1 GB Größe:

110 MByte
HD > Client 1,1 MB/s
Client > Share 10 MB/s
Client > HD 43 MB/s (na, geht doch!)

1,1 GByte
Client > HD 24 MB/s
Client > Share 9 MB/s
Share > Client 9 MB/s (10% Last auf der NIC, brach dann ein auf 3 %)
HD > Client 1 MB/s (1% Last auf der NIC)

Im Perfmon habe ich mir außerdem diverse Parameter beim Test angesehen, auch die Warteschlagenlängen von NIC und Array, alles sauber. Server hat keine CPU-Last, die CPU des Arrays meint auch nie mehr als 9% zu arbeiten.

Ich habe mir außerdem noch mal die Datendurchsatzraten der Bandsicherungen der letzten Monate angesehen. Am 21.3. waren es noch 800 MByte/min, am 28.3. nur noch 100 MByte/min. Am 28. habe ich den Server durchgestartet und die HP-Treiber mal wieder auf den aktuellen Stand gebracht, ich glaube, das ist der Ansatzpunkt. Leider kann ich den Server zzt. nicht vom Netz nehmen. Ich werde nachher mal versuchen, ihm noch eine 2. NIC einzubauen und ihr einen anderen Treiber zu verpassen. Das soilte ohne Downtime gehen.

Jens
JawCruncher
JawCruncher 09.04.2009 um 19:38:30 Uhr
Goto Top
Hallo Allerseits!

Ich habe das Problem nun lösen können, auch wenn ich noch nicht so ganz weiß, was das Problem war. Hier zur Doku für eventuelle Leidensgenossen der Weg:
Ich hatte ja festgestellt, dass das Problem seit der letzten Installation von HP-Treibern auftrat. Ich habe heute den Server kurz vom Netz nehmen können und habe ihm eine 2. NIC eingebaut. Das war vor allem, um komfortabel unter Nutzung der Fail-over-Möglichkeiten, an den Netzwerkkabel, Switches und Treibern etwas herumspielen zu können. Der SIM zeigte mir aber auch an, dass es noch eine neue Version des Netzwerkkartentreibers für die interne Broadcom gibt (Vers. 12.xx). Die habe ich also auch noch installiert, den Server noch einmal durch den Keller gefahren und alles war hübsch. Lesedurchsatz ist nun wieder höher als der Schreibdurchsatz und erreich bis zu 60MB/s, der Schreibdurchsatz ist interessanterweise allerdings um etwa 20% gesunken, aber das stört nun nicht mehr.

Danke an alle, die sich hier mit beteiligt haben!

Jens