samrein
Goto Top

Fujitsu Server 2540M1, PRAID EP420i

Moinsen,

hab hier einen Fujitsu Server 2540M1, mit einem PRAID EP420i, 12 Platten a 4 TB, Raid 6.

Eigentlich ist der Server immer stressfrei gelaufen, allerdings hat er nach einem Plattenausfall und dem Rebuild Probleme mit der Performance.

Die Schreibraten sind in den Keller gegangen, zwischen 20-30 MB/Sek. Keinerlei Fehlermeldungen im System, weder im Log vom Controller noch in den Event-Logs.

Als Aktivität sehe ich auf dem ServerView Raid Manager noch das ein Patrol-Read läuft mit einer utopischen Zeitangabe.

Das ist vermutlich suchen nach der Nadel im Heuhaufen, Backplane, Controller...etc....

Hat jemand ne Idee wo man hier am gescheitesten ansetzt? Da der Server als Backup Server im Einsatz ist, hab ich im Moment nur wenig Zeitfenster zum rumprobieren....

Grüße
Stefan

Content-ID: 3009069312

Url: https://administrator.de/contentid/3009069312

Ausgedruckt am: 25.11.2024 um 07:11 Uhr

em-pie
em-pie 07.06.2022 aktualisiert um 14:52:08 Uhr
Goto Top
Moin,

kann es sein, dass die Kiste noch im Rebuild-Prozess ist?
Ein RAID 6 über 12x4TB-Disks dauert nunmal etwas.

Wie sind denn die Platten I/Os derzeit?
wird viel gelesen/ geschrieben?

Edit:
https://www.dell.com/support/kbdoc/de-de/000127841/dell-perc-controller- ...
Wenn noch ein Rebuild läuft, würde das auch die utopische Patrol Read-Zeit erklären.
Nils02
Nils02 07.06.2022 um 14:59:08 Uhr
Goto Top
Hallo Stefan,

der Raid-Rebuild wird vermutlich mehrere Tage dauern.
Wenn der Festplattenausfall jedoch mehr als eine Woche zurückliegt, würde ich das eher ausschließen.

Wie von em-pie schon angemerkt, würde das auch die Patrol-Read-Zeit erklären.
LG
Nils
samrein
samrein 07.06.2022 um 15:04:52 Uhr
Goto Top
Hi Empie,

der Rebuild hatte wirklich lange gedauert, um genau zu sein 1 Woche. Das kam mir schon ziemlich lange vor.

Im Moment schreibt er ein Backup mit 20MB/sek, was ungewöhnlich langsam ist. Die Warnmeldungen vom RaidController sind alle weg, das ist ja das blöde, da würds mir leichter fallen danach zu suchen. Der Rebuild ist definitv durch.

Lesezugriffe sind im Moment bei 0 auf dem Volume .
raid
em-pie
em-pie 07.06.2022 aktualisiert um 15:22:19 Uhr
Goto Top
der Rebuild hatte wirklich lange gedauert, um genau zu sein 1 Woche. Das kam mir schon ziemlich lange vor.
Das ist in der Tat recht lange. Unser letzter Rebuild eines RAID 6 mit 12x 12 TB hat 2,5 Tage gedauert, wobei wir hier auch mit einem Distributed Array arbeiten. Die Platten haben aber ebenfalls nur 7.200 upm
Ob es an der neuen Platte liegt (die WD?) könnte man jetzt sicherlich ausdiskutieren.
Was mir aber beim Sichten der TechSpecs beider Plattenmodelle auffällt: Die WD hat nur 32MB Cache, die Seagates jeweils 128MB

Gut möglich, dass die WD hier als Spaßbremse fungiert, wobei ich das noch nicht glaube...

Gibt es noch irgendwelche Hintergrund-Tasks, die auf dem Controller laufen?
kannst du den Patrol-Job abbrechen?
samrein
samrein 07.06.2022 um 15:48:07 Uhr
Goto Top
Der Task lässt sich leider nicht abbrechen. Vermutlich müsste ich mal den kompletten Server ausschalten dafür.

Bei den Platten war es ein bisschen tricky, bei den alten Fujtitus Servern konnte man noch alles mögliche an Platten reinstecken, bei dem hier musste eine Fujitsu Firmware drauf sein. Da kostet dann eine 4 TB 600 Euro, wir haben den Server in Drittanbieterwartung und selbst der hatte mir zuerst eine falsche Platte geliefert gehabt.

Den einzigen Task den ich sonst noch sehen kann ist unter Aufgaben Snapshot schreiben. Ich weiß nicht was der Controller macht wenn ich den automatischen Task vom Patrol-Read ändere auf manuell, ob das Auswirkung auf den laufenden Job hat.
samrein
Lösung samrein 28.06.2022 um 08:17:50 Uhr
Goto Top
Wir hatten nochmal eine Platte erhalten mit der gleichen Firmware, das Rebuild war nach 2 Tagen durch.
Die Geschwindigkeiten sind auch wieder normal. Also lag es vermutlich doch an der Platte. Grüße Stefan