IO Wait sehr hoch

Mitglied: schneerunzel

schneerunzel (Level 1) - Jetzt verbinden

30.01.2018 um 22:21 Uhr, 1596 Aufrufe, 5 Kommentare

Hallo zusammen,

ich habe seit einigen Wochen ein Problem:
Mein HP Server will nicht mehr so wie ich.

Folgendes Konstrukt ist betroffen:
Ein HP Server mit 3 Hardware Raid (Raid5). Auf diesem HP Server ist ein Debian mit Proxmox (Hier habe ich das Proxmox Image installiert und nicht ein reines Debian). Auf einem kleinen Raid liegt das System.
Die beiden anderen sind für die VMs vorgesehen. Dabei ist ein Raid mit einem ZFS Dateisystem ausgestattet und das andere mit ext4.
Laut Anzeige sehen die Platte alle OK aus:
root@de03srv05:~# hpacucli ctrl all show config

Smart Array P400 in Slot 1 (sn: P61630H9SVV25M)

array A (SAS, Unused Space: 0 MB)


logicaldrive 1 (478.3 GB, RAID 5, OK)

physicaldrive 1I:1:5 (port 1I:box 1:bay 5, SAS, 72 GB, OK)
physicaldrive 1I:1:6 (port 1I:box 1:bay 6, SAS, 72 GB, OK)
physicaldrive 1I:1:7 (port 1I:box 1:bay 7, SAS, 72 GB, OK)
physicaldrive 1I:1:8 (port 1I:box 1:bay 8, SAS, 72 GB, OK)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 72 GB, OK)
physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 72 GB, OK)


Smart Array P400 in Slot 4 (sn: P61630K9SW03G3)

array A (SAS, Unused Space: 0 MB)


logicaldrive 1 (341.7 GB, RAID 5, OK)

physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 72 GB, OK)
physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 72 GB, OK)
physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 72 GB, OK)
physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 72 GB, OK)
physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 72 GB, OK)
physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 72 GB, OK)

array B (SAS, Unused Space: 0 MB)


logicaldrive 2 (68.3 GB, RAID 1, OK)

physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 72 GB, OK)
physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 72 GB, OK)


In dieser Umgebung laufen mehrer VMs. Eine davon läuft als MySQL Server und liegt in dem Raid mit dem ZFS Datei System. Dabei handelt es sich um ein Ubuntu 14.04 64 Bit.

Bis vor ein paar Wochen hatte ich mit diesem Aufbau noch nie Probleme. Allerdings, merke ich aktuell, das das ganze System extrem langsam geworden ist. Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
Genau diese DB habe ich sonst immer in wenigen Sekunden einspielen können.

Ich muss dazu sagen: Das ZFS Datei System habe ich noch nicht lange. Leider kann ich nicht genau sagen, ob es seit der Umstellung auf ZFS ist oder erst später.

Was kann das sein?
Gibt es ein bekanntes Problem mit einem ZFS Datei System, KVM und MySQL (bei Google habe ich dazu spontan nichts gefunden)
Kann es evtl an den Platten liegen? Aber kann sich das so bei einem Raid 5 bemerkbar machen?
Habt Ihr noch eine andere Idee bzw. eine Tipp wie ich das Problem wieder los werde?

Danke und viele Grüße
Mitglied: certifiedit.net
30.01.2018 um 23:18 Uhr
Hallo,

würde dir von Raid5 abraten, mach eine weitere Platte rein und mach entweder 2x Raid1 oder ein Raid10.

VG
Bitte warten ..
Mitglied: Vision2015
31.01.2018 um 06:44 Uhr
Moin..

HP SAS, 72 GB HHD´s, Smart Array P400... Der Server selber wird aus der gleichen Epoche sein....
kurz gesagt- das System ist gut und gerne 15 Jahre alt....
kauf etwas neues....
Allen voran merke ich es, wenn ich ein backup einer MySQL DB einspiele und der Server für eine knapp 30 MB große DB mit knapp 200.000 Datensätzen Stunden braucht.
ist der Cache im P400 ausgeschaltet? was sagt die BBU? ist die nicht mehr am Arbeiten, schaltet sich der Write Cache ab!
das würde den Leistungseinbruch erklären....

ich würde aber auch ein Raid1 nutzen wollen, ein Raid10 ist zu für den P400 zu CPU lastig...
ich rate dir aber dringend zu einem Backup....

Frank
Bitte warten ..
Mitglied: schneerunzel
31.01.2018 um 17:17 Uhr
Hallo Frank,

vielen Dank für den Tipp mit der Battery.
Wenn man weiß wonach man suchen muss, ist das Rätsel doch relativ einfach:
Cache Status: Temporarily Disabled
Cache Status Details: Cache disabled; low batteries.


Ihr habt wohl recht. Da sollte Zeitnahe mal ein neues System her.
Damit es erst mal weiter geht habe ich mir jetzt eine entsprechende Batterie besorgt und werde die mal einbauen (lassen).

Hoffentlich ist es das auch.....
Bitte warten ..
Mitglied: Vision2015
31.01.2018 um 17:41 Uhr
Moin...
Wenn man weiß wonach man suchen muss, ist das Rätsel doch relativ einfach:
Tja.. erfahrung eben...
du kannst den Cache ja mal manuell ein schalten, und schauen
und du kannst auf gelöst stellen...

Frank
Bitte warten ..
Mitglied: schneerunzel
31.01.2018 um 17:58 Uhr
Wäre einen Versuch wärt.

Wäre
richtig?

Wie stelle ich das dann hinterher wieder auf "automatisch" ? Reich ein einfaches disable und wenn dann die Batterie getauscht ist geht es dann "automatisch" weiter. Sprich, sollte die Batterie noch mal kaputt gehen, bis das Ding getauscht ist geht er wieder auf Disable?
Bitte warten ..
Heiß diskutierte Inhalte
Ubuntu
HAProxy-Wi: Installation des Pakets geht nicht - ich hätte keine enabled Repos
itnirvanaFrageUbuntu37 Kommentare

Hallo, von der Seite möchte ich gerne HAProxy-Wi installieren ich führe das hier aus Dann kommt -> There ar ...

LAN, WAN, Wireless
Wlan Messgerät
gelöst fizlibuzliFrageLAN, WAN, Wireless23 Kommentare

Hallo, gibt es erschwingliche Messgeräte um vorhanden W-Lan ausleuchtungen in ihrer Signalstärke und Bandbreite zu messen. Es sollen einfache ...

Microsoft
Failover Cluster Network
samreinFrageMicrosoft22 Kommentare

Hallo zusammen, toller Freitag heute vielleicht kann mir jemand unter die Arme greifen. Ich habe einen Failover Cluster gebaut. ...

Windows Server
PowerShell Script für MailVersand mit Anhang
gelöst klausk94FrageWindows Server20 Kommentare

Hallo Zusammen, ich bin aktuell etwas am verzweifeln an einem PS Script für den Emailversand Das Script funktioniert, jedoch ...

Router & Routing
Kaufempfehlung WLAN Router mit VLAN Unterstützung
ccreccFrageRouter & Routing20 Kommentare

Hallo zusammen, ich wollte mal nach einer Kaufempfehlung für einen WLAN Access Point mit halbwegs vernünftiger VLAN Unterstützung fragen. ...

Windows Installation
Einmaliger Betriebssystem Rollout
StUffzFrageWindows Installation15 Kommentare

Hallo liebes Forum, Baramundi, SCCM, ZENworks & Co sind Softwareverteilungssysteme für eher "größere" Unternehmen ich bin auf der Suche ...

Ähnliche Inhalte
Debian
IO-Last zu hoch
gelöst juhu01FrageDebian6 Kommentare

Hallo miteinander Ich habe ein etwas kniffliges Problem Mein Raspberry 3B hat zeitweise eine IO-Last von 70-90% .erkennbar im ...

Batch & Shell
Get-Content -Wait ohne Funktion ?
gelöst HenereFrageBatch & Shell5 Kommentare

Servus, um kein tail zu installieren hatte ich bisher immer genutzt. Doch auf nem 2012er zeigt es mir nur ...

RedHat, CentOS, Fedora
Kein Root-Login nach Io Errors
gelöst janosch12FrageRedHat, CentOS, Fedora8 Kommentare

Guten Abend, ich habe aktuell folgendes Problem: CentOS7 als Vm angebunden als NFS an das Storage Das Storage scheint ...

Vmware

VMWare - maximale IO-Performance einer VM

Der-PhilFrageVmware9 Kommentare

Hallo! Ich arbeite mich gerade mit VMWare ein, komme aber an einem Punkt nicht weiter: Egal, was ich mache, ...

Vmware

Direct Path IO - An oder Aus?

gelöst Ex0r2k16FrageVmware2 Kommentare

Hallo zusammen, habt ihr bei euren ESXi VMs o.g. Einstellung bei euren VMs an oder aus? Mir ist aufgefallen, ...

Voice over IP

VoiP hinter OpnSense - Raustelefonieren iO - Reintelefonieren NiO

sk8er-boiFrageVoice over IP6 Kommentare

Hallo Zusammen, ich bin gerade dabei ein kleines Firmennetzwerk aufzubauen und bin dabei jetzt auf ein Problem gestoßen. Ich ...

Berechtigungs- und IdentitätsmanagementBerechtigungs- und IdentitätsmanagementWebdienste und -serverWebdienste und -serverDatenbankenDatenbankenMonitoring & SupportMonitoring & SupportHybrid CloudHybrid CloudSmall Business ITSmall Business IT