VMware Esxi 7.0
Hallo Zusammen,
ich betreibe einen VMware ESXI 7.0 und einen ESXI 6.5.
Im Log kommen regelmäßig Einträge wie:
Auf dem esxi 7.0
smartd: [warn] t10.NVMe____Samsung_SSD_980_PRO_1TB_________________023C5101B9382500: REALLOCATED SECTOR CT below threshold (0 < 90)
Auf dem esxi 6.5.
smartd: [warn] t10.NVMe____CT1000P1SSD8____________________________1925E20D2C01________00000001: below REALLOCATED SECTOR CT threshold (0)
Wenn ich über SSH den Befehl für die jeweilige Platte "esxcli storage core device smart get -d (xxxx)" absetze, dann werden mir aber keine Fehler angezeigt
Hier die Daten der Samsung. Die der Crucial sehen ähnlich aus
Wenn ich mir über
esxcli nvme device log smart get -A vmhba(x)
die SMART Infos hole, dann sind dort keine "Media Errors" enthalten und mit den "Data Units Written" komme ich mit der Samsung aktuell bei 4 TBW an, bei der Crucial bei 22 TBW. Beide weit unterhalb der vorgegebenen Lebensdauer des Herstellers. (Die Crucial hat 200 TBW, die Samsung 600 TBW)
"Percentage Used" ist bei 1% und 3%
Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
Gruß
Marek
ich betreibe einen VMware ESXI 7.0 und einen ESXI 6.5.
Im Log kommen regelmäßig Einträge wie:
Auf dem esxi 7.0
smartd: [warn] t10.NVMe____Samsung_SSD_980_PRO_1TB_________________023C5101B9382500: REALLOCATED SECTOR CT below threshold (0 < 90)
Auf dem esxi 6.5.
smartd: [warn] t10.NVMe____CT1000P1SSD8____________________________1925E20D2C01________00000001: below REALLOCATED SECTOR CT threshold (0)
Wenn ich über SSH den Befehl für die jeweilige Platte "esxcli storage core device smart get -d (xxxx)" absetze, dann werden mir aber keine Fehler angezeigt
Hier die Daten der Samsung. Die der Crucial sehen ähnlich aus
Parameter Value Threshold Worst Raw
------------------------ ----- --------- ----- ---
Health Status OK N/A N/A N/A
Power-on Hours 4561 N/A N/A N/A
Power Cycle Count 22 N/A N/A N/A
Reallocated Sector Count 0 90 N/A N/A
Drive Temperature 35 82 N/A N/A
Wenn ich mir über
esxcli nvme device log smart get -A vmhba(x)
die SMART Infos hole, dann sind dort keine "Media Errors" enthalten und mit den "Data Units Written" komme ich mit der Samsung aktuell bei 4 TBW an, bei der Crucial bei 22 TBW. Beide weit unterhalb der vorgegebenen Lebensdauer des Herstellers. (Die Crucial hat 200 TBW, die Samsung 600 TBW)
"Percentage Used" ist bei 1% und 3%
Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
Gruß
Marek
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 666337
Url: https://administrator.de/contentid/666337
Ausgedruckt am: 22.11.2024 um 13:11 Uhr
4 Kommentare
Neuester Kommentar
Zitat von @der-marek:
Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
Moin,
da steht doch
Reallocated Sector Count 0 90 N/A N/A
Da 0 unter der Schwelle 90 gibt, gibt es eine Warnung.
Wenn Du korrekte Daten willst, mußt du halt Geräte einsetzen, die supported sind.
Ich würde dringend davor warnen, SSDs/HDDs einzusetzen, die smart nciht vollständig unterstützten, bzw. mit denen das OS nichts anfangen kann. Das konterkariert den Zweck von smart und erhöht das Risiko für Datenverlust.
lks
Zitat von @der-marek:
Wenn ich mir über
esxcli nvme device log smart get -A vmhba(x)
die SMART Infos hole, dann sind dort keine "Media Errors" enthalten und mit den "Data Units Written" komme ich mit der Samsung aktuell bei 4 TBW an, bei der Crucial bei 22 TBW. Beide weit unterhalb der vorgegebenen Lebensdauer des Herstellers. (Die Crucial hat 200 TBW, die Samsung 600 TBW)
"Percentage Used" ist bei 1% und 3%
Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
Schließe die SSD mal an ein normales Linux oder Windows-System an und lese die Smart-Parameter mal dort aus wenn dir dort ebenfalls als Value 0 bei Reallocated Sector Count angezeigt wird dann würde ich das ernst nehmen. Zellen können aber schon vorzeitig abrauchen. Und wenn davon genug den Geist aufgeben und die Reserve-Zellen eben ausgegangen sind dann wird das auf einen massenhaften Defekt der Zellen hinweisen => SSD stirbt womöglich schneller als gedacht. Konkret wurden also schon alle Reserve-Zellen alloziiert was im Falle weiterer defekter Zellen in Zukunft wohl Bitfehler sehr wahrscheinlich werden.Wenn ich mir über
esxcli nvme device log smart get -A vmhba(x)
die SMART Infos hole, dann sind dort keine "Media Errors" enthalten und mit den "Data Units Written" komme ich mit der Samsung aktuell bei 4 TBW an, bei der Crucial bei 22 TBW. Beide weit unterhalb der vorgegebenen Lebensdauer des Herstellers. (Die Crucial hat 200 TBW, die Samsung 600 TBW)
"Percentage Used" ist bei 1% und 3%
Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
SSDs sind halt auch nicht vor Defekt gefeit... Wenn du also noch Garantie/Gewährleistung auf die Teile hast ab damit zum Händler.
Gruß w.
wie einer der Kollegen sagte... mal die Platte mit einem physischen Host checken.
Da die 980 Pro erst seit ein paar Moanten auf dem Markt ist halte ich die Meldungen eher für Störfeuer.
Bei der anderen SSD... muß man gucken.
Ich hab eine 1 Jahre alte 970 EVO als NVME unter ESX 6.7 und hab diese Meldungen nicht, auch meine OCZ Trion SSD 1 TB (2014 für 150 Euro erworben, absolutes Billigstteil) hinterläßt im Log keine SMART Spuren...
Da die 980 Pro erst seit ein paar Moanten auf dem Markt ist halte ich die Meldungen eher für Störfeuer.
Bei der anderen SSD... muß man gucken.
Ich hab eine 1 Jahre alte 970 EVO als NVME unter ESX 6.7 und hab diese Meldungen nicht, auch meine OCZ Trion SSD 1 TB (2014 für 150 Euro erworben, absolutes Billigstteil) hinterläßt im Log keine SMART Spuren...