jojo0411
Goto Top

Server SSD Zuverlässigkeit

Hallo Leute,

Wie sind eure Erfahrungen mit SSD's im Serverbereich? Im Consumer Bereich habe ich schon das eine oder andere negative gehört was die Zuverlässigkeit betrifft.

Mich würde vor allem interessieren ob man die MTBF von Physikalischen Festplatten und der Anzahl der Schreibvorgänge bei SSD's vergleichen kann.

Ist es so das wenn dort 45 Terabyte steht genau bei 45 Terabyte Schluss ist oder ist das ähnlich wie bei MTBF ein theoretischer Wert.

Ich stelle mir vor das ich ein Raid aus SSD Platten mache und die geben nach 5 Jahren alle gemeinsam den Geist auf weil genau dieser Wert erreicht wurde.

nice greetz jojo

Content-Key: 207901

Url: https://administrator.de/contentid/207901

Printed on: December 3, 2022 at 09:12 o'clock

Member: psannz
psannz Jun 12, 2013 at 13:18:55 (UTC)
Goto Top
Sers,

also MTBF und Write Endurance (vergl. TBW) sind keine vergleichbaren Werte. MTBF stellt die mittlere Zeit zwischen zwei nicht korrigierbaren Fehlern dar. Ein Mittelwert also. Es kann früher kommen, kann aber auch später kommen. Aber im Durchschnitt passt es. Kannst es also einen "theoretischen Wert" nennen.
Bei der Write Endurance sieht die Sache anders aus. Der Wert ist fix, errechnet anhand der Schreibvorgänge die die Zellen des Mediums (zusammen) aushalten bevor sie sich nicht mehr beschreiben lassen. Ist also definitiv kein "theoretischer" Wert, sondern ein physikalisch limitierter.
Die Schreibperformance von einer SSD wird dir allerdings schon vor erreichen dieses Wertes einbrechen.

Erzählst du uns was für ein Modell deine exemplarische "Server SSD" ist, die da nicht einmal 50 TB durchhalten soll?

Grüße,
Philip
Member: jojo0411
jojo0411 Jun 12, 2013 at 14:03:31 (UTC)
Goto Top
Hallo Philip,

Habe gerade diesen Bericht gelesen und da ist von 45 TB bei der kleinsten Festplatte die Rede...:

http://www.golem.de/news/dc-s3500-intels-server-ssd-auch-in-eigenen-rec ...

Wenn ich dieses Modell in ein Raid 1 bzw. Raid 5 stecken würde bin ich nur gegen einen Defekt der Festplatte selbst gesichert Der dann sehr unwahrscheinlich bei beiden Gleichzeitig auftritt. Die Write Endurance wird aber schon vorher einbrechen und somit einen Austausch nach sich ziehen.

Die Write Endurance muss ich also bei SSD Platten im Auge behalten... kann man das irgendwo auslesen? SMART?

nice greetz jojo
Member: psannz
psannz Jun 12, 2013 at 17:04:54 (UTC)
Goto Top
Also wenn man bedenkt dass die Intel S3700 mit 100GB auf über 180TB kommt... Mal ganz abgesehen davon was andere Hersteller garantieren (e.g. SM843T). Zugegebenermaßen, die S3700 kostet auch wesentlich mehr, aber zumindest von den Eckdaten her würde ich die S3500 nicht verwenden. Einfach zu wenig fürs Geld, selbst wenn es gewohnte Intelqualität ist.
Imo ist die S3500 allenfalls als Lesecache interessant.

Was soll der Server überhaupt machen? Und kommt dein Controller mit SSDs klar?

Die WE ist normalerweise in den SMART Werten vertreten, ja.
Member: DerWoWusste
DerWoWusste Jun 12, 2013 updated at 21:17:09 (UTC)
Goto Top
Moin Psannz!

Bei der Write Endurance sieht die Sache anders aus. Der Wert ist fix, errechnet anhand der Schreibvorgänge die die Zellen des Mediums (zusammen) aushalten bevor sie sich nicht mehr beschreiben lassen
Ist das so? Es ist doch weitaus komplizierter und ich finde diese Vereinfachung unpassend.
Endurance Rating - The SSD manufacturer shall establish an endurance rating for an SSD that represents the maximum number of terabytes that may be written by a host to the SSD, using the workload specified for the application class, such that the following conditions are satisfied: 1) the SSD maintains its capacity; 2) the SSD maintains the required UBER for its application class; 3) the SSD meets the required functional failure requirement (FFR) for its application class; and 4) the SSD retains data with power off for the required time for its application class. This rating is referred to as TBW. Requirements for UBER, FFR, and retention are defined for each application class.
Aus http://www.jedec.org/sites/default/files/Alvin_Cox%20%5bCompatibility%2 ...
Member: filippg
filippg Jun 12, 2013 updated at 21:58:07 (UTC)
Goto Top
Hallo,

Bei der Write Endurance sieht die Sache anders aus. Der Wert ist fix, errechnet anhand der Schreibvorgänge die die Zellen des
Mediums (zusammen) aushalten bevor sie sich nicht mehr beschreiben lassen. Ist also definitiv kein "theoretischer" Wert,
sondern ein physikalisch limitierter.
Das halte ich für grob falsch. Es ist ja nicht so, dass eine SSD eine Anzahl von X Zellen hätte, von denen jede einmal beschrieben werden kann (WORM), dann wäre nach exakt der angegebenen Anzahl an Schreibvorgängen Schluss. Vielmehr kann grundsätzlich jede Zelle mehrmals beschrieben werden. Allerdings nimmt sie bei jedem Schreibvorgang schaden. Wie groß dieser Schaden ist, hängt von äußeren Umständen (Temperatur) und Fertigungsschwankungen ab. Damit ist dieser Wert genauso ein theoretischer (oder vielmehr: statistischer) Mittelwert wie die MTBF von Festplatten.
Das bei SSDs defekte Zellen erkannt und dann auf Reserverblöcke ausgewichen ändert nichts daran, dass es sich um einen Mittelwert handelt.

Gruß

Filipp

Edit: zu lange nicht neu geladen, da hat DerWoWusste inzwischen schon was geschrieben.
Member: psannz
psannz Jun 13, 2013 at 11:37:50 (UTC)
Goto Top
Zitat von @DerWoWusste:
Moin Psannz!

> Bei der Write Endurance sieht die Sache anders aus. Der Wert ist fix, errechnet anhand der Schreibvorgänge die die
Zellen des Mediums (zusammen) aushalten bevor sie sich nicht mehr beschreiben lassen
Ist das so? Es ist doch weitaus komplizierter und ich finde diese Vereinfachung unpassend.
> Endurance Rating - The SSD manufacturer shall establish an endurance rating for an SSD that represents the maximum number of
terabytes that may be written by a host to the SSD, using the workload specified for the application class, such that the
following conditions are satisfied: 1) the SSD maintains its capacity; 2) the SSD maintains the required UBER for its application
class; 3) the SSD meets the required functional failure requirement (FFR) for its application class; and 4) the SSD retains data
with power off for the required time for its application class. This rating is referred to as TBW. Requirements for UBER, FFR, and
retention are defined for each application class.
Aus http://www.jedec.org/sites/default/files/Alvin_Cox%20%5bCompatibility%2 ...

Sers DWW & filippg,

ist schon richtig, die WE ist kein Garantiewert, und eine SSD hat natürlich auch eine MTBF. Mir ging es primär darum die Unvergleichbarkeit zwischen beiden Begriffen aufzuzeigen.

Genauso wie man z.B. eigentlich nicht pauschal einen Wert für die WE annehmen kann, mal von äußeren Einflüssen abgesehen. Kommt ja auch drauf an in welchen Häppchen geschrieben. Keine SSD wird gleich viele 64 KB und 512 Byte Schreibvorgänge verkraften. Stichwort wäre hier "write amplification". Da gibt der Hersteller natürlich einen geschönten Wert an, also einen auf jene write amplification optimierten.

Grüße,
Philip
Member: jojo0411
jojo0411 Jun 14, 2013 at 14:45:29 (UTC)
Goto Top
Hallo Leute,

Danke für eure Ausführungen.

Nur um sicher zu gehen das ihr mich und ich euch richtig verstanden habe folgende Schlussfolgerung:

Bei herkömlichen Festplatten bilde ich ein Raid (Zum Beispiel Raid1) und bin durch einen Ausfall einer Fesplatte geschützt der durch den statistischen Wert von MTBF angegeben wird. Ein gleichzeitiger Ausfall ist also sehr unwahrscheinlich.

Bei SSD Platten gibt es natürlich auch einen MTBF und zusätzlich eine Write Enduarnce die aber genauso statistisch ist und somit ein gleichzeitiger Ausfall (Man beachte das im Raid 1 ja immer beide Platten gleich beschrieben werden) genauso unwahrscheinlich ist.

Richtig?

nice greetz jojo
Member: psannz
psannz Jun 14, 2013 at 18:37:11 (UTC)
Goto Top
Zitat von @jojo0411:
Bei herkömlichen Festplatten bilde ich ein Raid (Zum Beispiel Raid1) und bin durch einen Ausfall einer Fesplatte
geschützt der durch den statistischen Wert von MTBF angegeben wird. Ein gleichzeitiger Ausfall ist also sehr
unwahrscheinlich.

Bedenke dass die verwendeten Platten identischen Modells sein werden, wenn nicht sogar aus der gleichen Charge kommen, und quasi der selben Last ausgesetzt werden.

Zieh dir doch mal die Berechnungsformel für die Ausfallwahrscheinlichkeiten in RAIDs zu Gemüte. Das wird dich weiter bringen.