cardisch
Goto Top

Wie Garantie bei HPe-SSDs erhalten, wenn HPe Diagnostics sagen, es wäre alles i.O., SMART Status von SSDs besagt aber etwas anderes?

Hi@all,

eigentlich besagt der Titel schon alles wissenswerte, dennoch:
Ich habe hier bereits den zweiten HPe-PC, jeweils 2KR93ea, bei der der SMART-Status, abgefragt durch Acronis Drive Monitor, an einem bestimmten Wert "Failed" sagt, die Diagnosesoftware (UEFI/Windows) aber der Meinung ist, dass dort alles i.O sei, sowohl bei den Langzeit-, als auch den Kurztests.
Dennoch habe ich dort jeweils "Soft Read Error Rate"
Hat jemand von euch Erfahrung, bei diesem Problem ?!
Danke und Gruß,

Carsten

Content-Key: 385630

Url: https://administrator.de/contentid/385630

Printed on: June 13, 2024 at 16:06 o'clock

Member: anteNope
anteNope Sep 06, 2018 updated at 08:45:16 (UTC)
Goto Top
Moin,
oooooh ja das ist ein richtig schönes Thema, da steige ich direkt mal mit ein!

Zum Punkt Mainboards:
Hier kann man sich eigentlich nur noch auf Nicht-OEM-Boards verlassen. HP und DELL (um zwei zu nennen) ignorieren quasi bewusst SMART-Werte und manchmal habe ich sogar den Verdacht, dass sie diese manipulieren. Wie komme ich zu einer solchen Anschuldigung? Nunja, mir sind Ungereimtheiten aufgefallen, z.B.:
  • Vermeintlich defekte Festplatte in HP-Rechner, SMART laut Bios OK, SMART laut Crystaldiskinfo auf dem System, OK. Prüft man das Laufwerk z.B. an einem ASUS Board, meldet Crystaldiskinfo direkt Fehler ... Besonders Wiederzuweisungsereignisse, schwebende Sektoren usw. werden gerne "ignoriert"
  • Bau ein definitiv defektes Laufwerk (z.B. mit schwebenden oder defekten Sektoren) in einen HP / DELL und da wird rein gar nichts meckern

Warum machen die das? Ganz einfach, in vielen Modellen kühlen die die Festplatten gerne einfach gar nicht, verbau(t)en aber gerne 7200 rmp HDDs. Diese werden somit dauerhaft zu warm und sterben. Um die Reklamationen gering zu halten, bedient man sich somit solcher Methoden.

Gleiches gilt auch für Server von denen. z.B. DELL meldet defekte Festplatten am RAID-Controller erst, wenn diese kompletter Kernschrott sind. Siehe: DELL PERC H710 mini - Meldung nicht zertifizierter Festplatten abschalten

Zum Punkt Windows
Wäre mir neu, dass Windows die SMART-Werte von sich aus überprüft. Bei StoragePlaces vielleicht??? ... aber im normalen Betrieb definitiv nicht. Dafür musste man schon immer auf externe Werkzeuge zurückgreifen (warum eigentlich? Oh ja stimmt, weil die OEMs ja nicht wollen, dass defekte Festplatten reklamiert werden ...)

Interpretation von Werten
Diese ist teilweise etwas schwierig, weil es keine einheitliche Definition der Werte gibt. Zwischen den einzelnen Herstellern gibt es unterschiedliche SMART-Werte. Zum Teil heißen die nur anders oder haben unterschiedliche Grenzwerte. Nimmt man eine OEM-Festplatte (z.B. Apple) und die verwenden ihre eigens angepasste Firmware, geht das Spiel noch ein ganzes Stück weiter.

Besonders bei SSDs gibt es absolut keine einheitlichen Werte! Hier ein paar Beispiele:

clipboard03

clipboard01


Witzig ist auch, dass z.B. eine Festplatte mit >1000 schwebenden Sektoren (keine Ahnung warum die nicht neu zugewiesen oder als defekt markiert werden, weil die sind definitiv defekt) in Crystaldiskinfo als "schlecht" bewertet wird, im WD-Tool der SMART Status aber als "OK" interpretiert wird, obwohl der extended Test failed ;)

Kurz gesagt, lerne SMART-Werte zu interpretieren. Crystaldiskinfo macht da einen guten Job, kann aber nur die gängige Werte interpretieren und Teils sind die Hersteller da sehr erfinderisch =)
Member: cardisch
cardisch Sep 06, 2018 at 09:46:28 (UTC)
Goto Top
Hi,

hatte ich vergessen zu erwähnen, dass ich besagte SSDs zuerst in ihren, dann per USB-Cradle an meinem PC (gut gut, auch ein HPe) und dann an einem ganz anderen PC getestet habe ? Ich glaube ja ;-(
Fehler wandert mit den SSDs mit, ergo haben die einen Schlag für mich.
Und natürlich fragt kein Windows die SMART Werte ab, dafür benutze ich ja besagten Acronis Drive Monitor.
So sieht eine der SSDs aus (die MZxyz), die 500er ist eine originale Samsung, leider auch mit SMART-Warnstatus und ähnlichem Problem, nur ist hier der Samsungs Magician der Bösewicht:
ssd1
ssd2
Member: anteNope
anteNope Sep 06, 2018 updated at 11:23:42 (UTC)
Goto Top
Hm Soft-Read-Error-Rate scheint ein solcher spezieller Wert zu sein. Bei Acronis findet man folgendes: https://kb.acronis.com/content/9137
"S.M.A.R.T. parameter indicates the number of uncorrectable software read errors."

Klar wandert der Fehler mit der SSD, weil er ja dort gespeichert wird. Es kann aber genauso gut sein, dass der SATA-Controller vom ursprünglichen System da Mist gebaut hat. Ggf. hat auch einfach nur das Dateisystem einen Hau weg. Ist immerhin ein Software-Error, kein Hardware-Error ... Und ein Wert von 5 ist jetzt nicht wirklich besorgniserregend?!

Ich würde folgendes machen. Anderes System, direkt per SATA anschließen:
  • SSD mit definierten Daten vollschreiben (dafür habe ich mir ein Programm geschrieben, was so lange 0 und 1 in 1 GB große Dateien schreibt, bis der Speicherplatz aufgebraucht ist). Und dann CRC-Check der Daten. Fehler fallen dann direkt auf
  • zweitens die komplette SSD Sektorweise auslesen lassen

Steigt der Wert, hat die SSD wohl einen Defekt. Bleibt der Wert, ist die SSD vermutlich okay und die Ursache liegt woanders =)
Member: Lochkartenstanzer
Lochkartenstanzer Sep 06, 2018 at 11:38:09 (UTC)
Goto Top
Zitat von @anteNope:

Klar wandert der Fehler mit der SSD, weil er ja dort gespeichert wird. Es kann aber genauso gut sein, dass der SATA-Controller vom ursprünglichen System da Mist gebaut hat. Ggf. hat auch einfach nur das Dateisystem einen Hau weg. Ist immerhin ein Software-Error, kein Hardware-Error ... Und ein Wert von 5 ist jetzt nicht wirklich besorgniserregend?!

Softwrror hat nichts mit der Software auf Deiner Kiste oder Deinem Filesystem zu tun. Das sind Fehler auf der HDD/SSD.

lks
Member: anteNope
anteNope Sep 06, 2018 at 12:27:10 (UTC)
Goto Top
Soll besagter Wert das Äquivalent zur CRC-Fehler oder ECC-Fehlerrate der EVO 850 sein, oder was?
Oder beziehen die sich mit Software-Read-Errors auf Fehler die von der Firmware des SSD-Controllers gemeldet werden?!
Member: cardisch
cardisch Sep 06, 2018 at 13:33:28 (UTC)
Goto Top
Mir geht es aber nicht darum, dass der Fehler erkannt wird, ich möchte die SSDs getauscht wissen... Die haben irgendeinen Hau weg, sind aber noch alle innerhalb der Garantie.
Nur stellt sich HPe ja gerne quer, solange deren Software keinen Fehler an der Hardware zugibt...
Member: anteNope
anteNope Sep 06, 2018 at 14:13:43 (UTC)
Goto Top
Tacker den Screenshot dran. Ist doch nicht dein Problem, dass deren Software offensichtlich fehlerhaft arbeitet oder die Werte kreativ interpretiert.

Wenn die sich querstellen, droh einfach damit deine Erkenntnisse (und meine oben) an die Presse weiterzugeben. Das wär der Diesel-Abgas-Skandal der IT-Branche. Never ever lassen die die Gülle soweit hochkochen.
Member: nikasio14
nikasio14 Sep 06, 2018 at 15:42:13 (UTC)
Goto Top
Ich kann mich sehr gut an den damaligen Post-Storm im PCFreunde-Froum erinnern, wo es um ein ähnliches Thema ging - daraufhin ging im CNet und Heise die Info rum, dass SSD und SMART sich eigentlich nicht so wirklich eignen.

Passender Artikel dazu Hier: https://betanews.com/2016/01/06/can-you-use-smart-tools-with-ssds/

Das erklärt sicher auch, warum die unterschiedlichen Testprogramme unterschiedlich bewerten - AFAIK macht da das herstellereigene Diagnosetool am meisten Sinn.

M2C
Nikasio14
Member: anteNope
anteNope Sep 06, 2018 at 15:54:25 (UTC)
Goto Top
"Crystal Disk Info" works with HDD and SSD drives. And I find it highly reliable. I trust it all my data because I'm running it as resident application that constantly monitors drives health.

Genau das. Ist aber auch schon sehr lange her, dass ich etwas reklarmieren musste. Wenn überhaupt waren die DOA. Crystaldisk-Screenshot hat bislang immer gelangt. Normalerweise überleben die Platten für gewöhnlich die Garantiezeit.