alchemy
Goto Top

Festplattencache, ja oder nein?

Hallo in die Runde,

ich benötige heut euer Schwarmwissen, da wir zu keinem befriedigenden Ergebnis kommen.

Ausgangssituation:

Wir haben an mehrere Kunden Dell PowerEdge R760 verkauft. Alle mit recht identischer Konfiguration (PERC-H965i, SSD/M2 im Raid5 und ESXi 8). Nun liefen manche Server schnell wie die Hölle und manche nur so OK.

Beim der Ursachenforschung haben wir festgestellt, dass bei den "langsamen" Servern der Plattencache aus ist, bei den schnellen Servern ist der Plattencache an. Interessant dabei ist, dass der Plattencache per default bisher immer aus war bei den Controllern und seit einiger Zeit scheinbar nicht mehr. Anschalten des Cache bringt bei den "langsamen" Servern mindestens einen gefühlten Performanceschub, also ist die Einstellung auch nicht trivial.

Nun haben wir ja hier 2 Arten von Cache. Einmal der vom Raidcontroller, welcher auch mit einer Batterie abgesichert ist bei Stromausfall. Und zum anderen den in den Platten selbst.

Jetzt die Frage:

Wenn ich den Cache auf den Platten anschalte, das System schreibt grad Dinge auf die Platten und in dem Moment fliegt der Strom weg, ist dann mein Raid hin?

Anfrage bei Dell hat ergeben: Wissen wir auch nicht so wirklich, aber ihr habt ja ein USV Konzept und daher wird es schon passen. War quasi nicht sehr Aufschlussreich.

Hat hier jemand fundierte Erfahrungen oder durfte diese evtl. schon mal freiwillig/ unfreiwillig testen?

Danke fürs lesen und Gedanken machen.

VG

Content-ID: 672161

Url: https://administrator.de/forum/festplattencache-ja-oder-nein-672161.html

Ausgedruckt am: 31.03.2025 um 21:03 Uhr

pebcak7123
Lösung pebcak7123 26.03.2025 um 10:51:07 Uhr
Goto Top
Moin,
kommt auf die verbauten SSDs an, entweder haben die PowerLossProtection und können ihren cache noch schreiben oder eben nicht und der raid ist danach vermutlich hinüber.
godlie
godlie 26.03.2025 um 10:57:16 Uhr
Goto Top
Hallo,

ich sehe hier in einem normalen Serverumfeld kein Problem, da immer eine USV vorhanden ist.

Sollte es keine USV geben <-- eine USV verbauen !

grüße
ThePinky777
ThePinky777 26.03.2025 aktualisiert um 11:13:41 Uhr
Goto Top
seid ihr euch sicher das es deswegen den raid verhaut, glaube ich nicht.
bedeutet vielleicht werden aktuelle offene dateien beschädigt. aber die raid informationen sind ja
im raid controller gespeichert in der regel. UND auch auf den festplatten speichern sich gewisse dinge.
daher kann man auch den raid controller bei defekt tauschen und er liest die raid config trotzdem aus den platten rein.... hatte ich schon mal...

Daher im worst case würde ich sagen gibts halt datenverlust, wenn man SSDs verbaut die für Raidbetrieb ausgelegt sind, dann sollten die wohl nen cache drin haben der den rest noch schreiben kann bevor der saft ausgeht...

Also mir hats wegen nem stromausfall noch nie nen raid verhauen... es sind nur damals HDDs verreckt und nicht mehr angesprungen... und wenn halt zu viele verrecken geht der raid hopps...

Meine Meinung (bin aber auch kein Raid Gott oder so).
Alchemy
Alchemy 26.03.2025 um 11:15:21 Uhr
Goto Top
@pebcak

Danke! das war der entscheidende Tipp. Und nachdem ich grad auf die Systeme geschaut habe auch der Unterschied, wann Dell den Cache an macht und wann nicht.

@godlie

Soweit richtig, aber ich habe in den letzten 20 Jahren schon zu viele USVs (elektronisch) sterben sehen, selbst wenn die Akkus noch in den 2 Jahren waren. Ich würde mich da nie zu 100% auf sowas verlassen wollen. Außerdem war das nicht der Kern der Frage. Trotzdem Danke für deinen Beitrag.

VG
maretz
maretz 26.03.2025 um 11:19:30 Uhr
Goto Top
nun - ich würde mal sagen das ist gar nicht dein Problem... denn generell würde ja die BBU auf dem raid-controller dessen cache bereits puffern -> und der sollte idR. reichen so das du den platten-cache nicht zwingend brauchst (im zweifel würde ich schauen ob ich nen SSD-Cache einbauen kann, wenns wirklich so relevant wird). Nur: Wenn windows halt grad ne Datei am schreiben war ist die chance eben schon gut das die auch auf der platte dann zerlegt ist -> und dein system dann eh nich mehr startet... Dafür hast du ja eben ne USV - um dem Server die Zeit zu verschaffen sich noch geordnet runterfahren zu können...

Übrigens unterscheidet man auch zwischen "Schreib-Cache" und "Lese-Cache". Grad bei HP Servern (wobei ich da noch die DL380G7 + G8 meine) war es eine qual wenn die BBU alle war, das schreiben ging dann bei grossen Datenmengen über stunden... Das LESEN war kein grosses Problem, der hat halt nur den schreib-cache abgeschaltet um Datenverlust zu verhindern....
Lochkartenstanzer
Lochkartenstanzer 26.03.2025 um 11:24:42 Uhr
Goto Top
Zitat von @Alchemy:

Jetzt die Frage:

Wenn ich den Cache auf den Platten anschalte, das System schreibt grad Dinge auf die Platten und in dem Moment fliegt der Strom weg, ist dann mein Raid hin?

Das ist ein Glücksspiel, sprich Russisch Roulette. Meistens passiert nichts, vor allem wenn man auf ordentliche Hardware achtet, aber die Gefahr ist trotzdem da.

Das Konzept mit dem Cache auf dem Controller und der Pufferbatterie stammt noch aus der Zeit, als hauptsächlich Platten an den Controllern hingen. Für SSDs müßte man, wenn man es besser machen wollte, die direkt über den Controller mit Strom versorgen lassen und da einen Pufferakku draufpacken, der auch die SSDs am laufen hält, bis die Daten geschrieben sind. Dafür könnte man vermutlich auf den Cache auf dem Controller verzichten.

Eine USV wie oben vorgeschlagen, hilft zwar gegen Stromausfälle im Netz, aber wenn das Netzteile (oder die Netzteile bei redunanten versorgungen) hops geht, hilft die auch nicht weiter.

Letztendlich ist es wie immer: Wie gut sind die Backups. Was kostet es, wenn der Fall des Falles eintreten solte udn wie schnell ist man wieder produktiv? Dies gilt es abzuwegen und dann für oder dagegen zu entscheiden.

lks
Michi91
Michi91 26.03.2025 aktualisiert um 13:40:34 Uhr
Goto Top
Bei uns gabs immer Raid-Controller die mit einer zusätzlichen Batterie (BBU) ausgestattet waren. Hat ordentlich Performanceboost gebracht und man war sicher bei Stromausfall.

https://de.wikipedia.org/wiki/Battery_Backup_Unit
ThePinky777
ThePinky777 26.03.2025 aktualisiert um 17:38:18 Uhr
Goto Top
ohja da erinner ich mich noch wenn man die BBU tauschen musste... und noch nievorher von sowas gehört hatte face-smile
erklärt wohl warum meine systeme stromausfälle weggesteckt haben...
potsbits
potsbits 27.03.2025 um 00:05:14 Uhr
Goto Top
Normalerweise haben Enterprise ssds immer eine PLP die ausreicht um die Daten im Cache auf den Nand zu bekommen

Bei unseren Kioxia, Samsung und Intel/Solidgm ist der Cache immer an, egal was der Controller sagt. Lässt sich glaube mit smartctl anzeigen.

Welche SSDs sind verbaut?
Alchemy
Alchemy 28.03.2025 um 11:25:40 Uhr
Goto Top
Wir haben KIOXIA PM7-V verbaut.

Wenn ich raten müsste, haben die eine Dell Firmware und die stimmt sich zwangsweise mit dem Perc Controller ab.