schneerunzel
Goto Top

IO Wait sehr hoch

Hallo zusammen,

ich habe seit einigen Wochen ein Problem:
Mein HP Server will nicht mehr so wie ich.

Folgendes Konstrukt ist betroffen:
Ein HP Server mit 3 Hardware Raid (Raid5). Auf diesem HP Server ist ein Debian mit Proxmox (Hier habe ich das Proxmox Image installiert und nicht ein reines Debian). Auf einem kleinen Raid liegt das System.
Die beiden anderen sind für die VMs vorgesehen. Dabei ist ein Raid mit einem ZFS Dateisystem ausgestattet und das andere mit ext4.
Laut Anzeige sehen die Platte alle OK aus:
root@de03srv05:~# hpacucli ctrl all show config

Smart Array P400 in Slot 1 (sn: P61630H9SVV25M)

array A (SAS, Unused Space: 0 MB)


logicaldrive 1 (478.3 GB, RAID 5, OK)

physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, OK)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)


Smart Array P400 in Slot 4 (sn: P61630K9SW03G3)

array A (SAS, Unused Space: 0 MB)


logicaldrive 1 (341.7 GB, RAID 5, OK)

physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 72 GB, OK)
physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 72 GB, OK)
physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 72 GB, OK)
physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 72 GB, OK)
physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 72 GB, OK)
physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 72 GB, OK)

array B (SAS, Unused Space: 0 MB)


logicaldrive 2 (68.3 GB, RAID 1, OK)

physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 72 GB, OK)
physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 72 GB, OK)


In dieser Umgebung laufen mehrer VMs. Eine davon läuft als MySQL Server und liegt in dem Raid mit dem ZFS Datei System. Dabei handelt es sich um ein Ubuntu 14.04 64 Bit.

Bis vor ein paar Wochen hatte ich mit diesem Aufbau noch nie Probleme. Allerdings, merke ich aktuell, das das ganze System extrem langsam geworden ist. Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
Genau diese DB habe ich sonst immer in wenigen Sekunden einspielen können.

Ich muss dazu sagen: Das ZFS Datei System habe ich noch nicht lange. Leider kann ich nicht genau sagen, ob es seit der Umstellung auf ZFS ist oder erst später.

Was kann das sein?
Gibt es ein bekanntes Problem mit einem ZFS Datei System, KVM und MySQL (bei Google habe ich dazu spontan nichts gefunden)
Kann es evtl an den Platten liegen? Aber kann sich das so bei einem Raid 5 bemerkbar machen?
Habt Ihr noch eine andere Idee bzw. eine Tipp wie ich das Problem wieder los werde?

Danke und viele Grüße

Content-Key: 362930

Url: https://administrator.de/contentid/362930

Printed on: May 29, 2024 at 21:05 o'clock

Member: falscher-sperrstatus
falscher-sperrstatus Jan 30, 2018 at 22:18:49 (UTC)
Goto Top
Hallo,

würde dir von Raid5 abraten, mach eine weitere Platte rein und mach entweder 2x Raid1 oder ein Raid10.

VG
Member: Vision2015
Vision2015 Jan 31, 2018 at 05:44:54 (UTC)
Goto Top
Moin..

HP SAS, 72 GB HHD´s, Smart Array P400... Der Server selber wird aus der gleichen Epoche sein....
kurz gesagt- das System ist gut und gerne 15 Jahre alt....
kauf etwas neues.... face-smile
Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
ist der Cache im P400 ausgeschaltet? was sagt die BBU? ist die nicht mehr am Arbeiten, schaltet sich der Write Cache ab!
das würde den Leistungseinbruch erklären....

ich würde aber auch ein Raid1 nutzen wollen, ein Raid10 ist zu für den P400 zu CPU lastig...
ich rate dir aber dringend zu einem Backup....

Frank
Member: schneerunzel
schneerunzel Jan 31, 2018 at 16:17:09 (UTC)
Goto Top
Hallo Frank,

vielen Dank für den Tipp mit der Battery.
Wenn man weiß wonach man suchen muss, ist das Rätsel doch relativ einfach:
Cache Status: Temporarily Disabled
Cache Status Details: Cache disabled; low batteries.


Ihr habt wohl recht. Da sollte Zeitnahe mal ein neues System her.
Damit es erst mal weiter geht habe ich mir jetzt eine entsprechende Batterie besorgt und werde die mal einbauen (lassen).

Hoffentlich ist es das auch.....
Member: Vision2015
Vision2015 Jan 31, 2018 at 16:41:34 (UTC)
Goto Top
Moin...
Wenn man weiß wonach man suchen muss, ist das Rätsel doch relativ einfach:
Tja.. erfahrung eben... face-smile
du kannst den Cache ja mal manuell ein schalten, und schauen face-smile
und du kannst auf gelöst stellen...

Frank
Member: schneerunzel
schneerunzel Jan 31, 2018 at 16:58:09 (UTC)
Goto Top
Wäre einen Versuch wärt.

Wäre
hpacucli ctrl slot=4 modify dwc=enable
richtig?

Wie stelle ich das dann hinterher wieder auf "automatisch" ? Reich ein einfaches disable und wenn dann die Batterie getauscht ist geht es dann "automatisch" weiter. Sprich, sollte die Batterie noch mal kaputt gehen, bis das Ding getauscht ist geht er wieder auf Disable?