IO Wait sehr hoch
Hallo zusammen,
ich habe seit einigen Wochen ein Problem:
Mein HP Server will nicht mehr so wie ich.
Folgendes Konstrukt ist betroffen:
Ein HP Server mit 3 Hardware Raid (Raid5). Auf diesem HP Server ist ein Debian mit Proxmox (Hier habe ich das Proxmox Image installiert und nicht ein reines Debian). Auf einem kleinen Raid liegt das System.
Die beiden anderen sind für die VMs vorgesehen. Dabei ist ein Raid mit einem ZFS Dateisystem ausgestattet und das andere mit ext4.
Laut Anzeige sehen die Platte alle OK aus:
root@de03srv05:~# hpacucli ctrl all show config
Smart Array P400 in Slot 1 (sn: P61630H9SVV25M)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (478.3 GB, RAID 5, OK)
physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, OK)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)
Smart Array P400 in Slot 4 (sn: P61630K9SW03G3)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (341.7 GB, RAID 5, OK)
physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 72 GB, OK)
physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 72 GB, OK)
physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 72 GB, OK)
physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 72 GB, OK)
physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 72 GB, OK)
physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 72 GB, OK)
array B (SAS, Unused Space: 0 MB)
logicaldrive 2 (68.3 GB, RAID 1, OK)
physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 72 GB, OK)
physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 72 GB, OK)
In dieser Umgebung laufen mehrer VMs. Eine davon läuft als MySQL Server und liegt in dem Raid mit dem ZFS Datei System. Dabei handelt es sich um ein Ubuntu 14.04 64 Bit.
Bis vor ein paar Wochen hatte ich mit diesem Aufbau noch nie Probleme. Allerdings, merke ich aktuell, das das ganze System extrem langsam geworden ist. Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
Genau diese DB habe ich sonst immer in wenigen Sekunden einspielen können.
Ich muss dazu sagen: Das ZFS Datei System habe ich noch nicht lange. Leider kann ich nicht genau sagen, ob es seit der Umstellung auf ZFS ist oder erst später.
Was kann das sein?
Gibt es ein bekanntes Problem mit einem ZFS Datei System, KVM und MySQL (bei Google habe ich dazu spontan nichts gefunden)
Kann es evtl an den Platten liegen? Aber kann sich das so bei einem Raid 5 bemerkbar machen?
Habt Ihr noch eine andere Idee bzw. eine Tipp wie ich das Problem wieder los werde?
Danke und viele Grüße
ich habe seit einigen Wochen ein Problem:
Mein HP Server will nicht mehr so wie ich.
Folgendes Konstrukt ist betroffen:
Ein HP Server mit 3 Hardware Raid (Raid5). Auf diesem HP Server ist ein Debian mit Proxmox (Hier habe ich das Proxmox Image installiert und nicht ein reines Debian). Auf einem kleinen Raid liegt das System.
Die beiden anderen sind für die VMs vorgesehen. Dabei ist ein Raid mit einem ZFS Dateisystem ausgestattet und das andere mit ext4.
Laut Anzeige sehen die Platte alle OK aus:
root@de03srv05:~# hpacucli ctrl all show config
Smart Array P400 in Slot 1 (sn: P61630H9SVV25M)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (478.3 GB, RAID 5, OK)
physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, OK)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)
Smart Array P400 in Slot 4 (sn: P61630K9SW03G3)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (341.7 GB, RAID 5, OK)
physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 72 GB, OK)
physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 72 GB, OK)
physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 72 GB, OK)
physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 72 GB, OK)
physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 72 GB, OK)
physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 72 GB, OK)
array B (SAS, Unused Space: 0 MB)
logicaldrive 2 (68.3 GB, RAID 1, OK)
physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 72 GB, OK)
physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 72 GB, OK)
In dieser Umgebung laufen mehrer VMs. Eine davon läuft als MySQL Server und liegt in dem Raid mit dem ZFS Datei System. Dabei handelt es sich um ein Ubuntu 14.04 64 Bit.
Bis vor ein paar Wochen hatte ich mit diesem Aufbau noch nie Probleme. Allerdings, merke ich aktuell, das das ganze System extrem langsam geworden ist. Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
Genau diese DB habe ich sonst immer in wenigen Sekunden einspielen können.
Ich muss dazu sagen: Das ZFS Datei System habe ich noch nicht lange. Leider kann ich nicht genau sagen, ob es seit der Umstellung auf ZFS ist oder erst später.
Was kann das sein?
Gibt es ein bekanntes Problem mit einem ZFS Datei System, KVM und MySQL (bei Google habe ich dazu spontan nichts gefunden)
Kann es evtl an den Platten liegen? Aber kann sich das so bei einem Raid 5 bemerkbar machen?
Habt Ihr noch eine andere Idee bzw. eine Tipp wie ich das Problem wieder los werde?
Danke und viele Grüße
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 362930
Url: https://administrator.de/forum/io-wait-sehr-hoch-362930.html
Ausgedruckt am: 03.04.2025 um 00:04 Uhr
5 Kommentare
Neuester Kommentar
Moin..
HP SAS, 72 GB HHD´s, Smart Array P400... Der Server selber wird aus der gleichen Epoche sein....
kurz gesagt- das System ist gut und gerne 15 Jahre alt....
kauf etwas neues....
das würde den Leistungseinbruch erklären....
ich würde aber auch ein Raid1 nutzen wollen, ein Raid10 ist zu für den P400 zu CPU lastig...
ich rate dir aber dringend zu einem Backup....
Frank
HP SAS, 72 GB HHD´s, Smart Array P400... Der Server selber wird aus der gleichen Epoche sein....
kurz gesagt- das System ist gut und gerne 15 Jahre alt....
kauf etwas neues....
Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
ist der Cache im P400 ausgeschaltet? was sagt die BBU? ist die nicht mehr am Arbeiten, schaltet sich der Write Cache ab!das würde den Leistungseinbruch erklären....
ich würde aber auch ein Raid1 nutzen wollen, ein Raid10 ist zu für den P400 zu CPU lastig...
ich rate dir aber dringend zu einem Backup....
Frank