mainsel
Goto Top

RAM Fehler - Correctable ECC - other Memory error

Hallo, ich habe ein Gigabyte MJ11-EC1 mit einem Embedded AMD Epyc 3151. Leider bekomme im BMC immer wieder folgende Fehlermeldung angezeigt:


Unknown sensor of type memory logged a smi handler : Correctable ECC / other correctable memory error was asserted

Diese Fehlermeldung kommt dauerhaft, bestimmt mehrmals die die Minute. Ich habe nun über Nacht einen Memtest durchlaufen lassen und der ist 3 mal erfolgreich durchgelaufen. Im BIOS wird der RAM mit 2400 MHz statt 2666 MHz angezeigt. Ich bin mir nicht sicher ob das bei zwei DIMMs so normal ist. Verbaut sind 2 SK Hynix 32GB Module (HMA84GR7CJR4N - VK T3 AC).

Kann mit jemanden helfen mit dieser Meldung?

Content-ID: 671160

Url: https://administrator.de/forum/ram-fehler-correctable-ecc-other-memory-error-671160.html

Ausgedruckt am: 06.02.2025 um 09:02 Uhr

mirdochegal
mirdochegal 06.02.2025 um 08:48:47 Uhr
Goto Top
Moin,

sitzen die Dimms vernünftig? Einmal ausbauen und neu einbauen und auf korrekten Sitz achten.

Mit einem DIMM? bleibt der Fehler (im Ring tauschen)?
Entweder defekt oder falscher Sitz - meine Vermutungen.

Gruß
MainSEL
MainSEL 06.02.2025 um 09:02:10 Uhr
Goto Top
Hallo, hatte ich vergessen zu erwähnen. Ich habe die DIMMs bereits gestern Abend immer mal getauscht gehabt und zeitweise auch gedacht es war besser. Leider kam die gleiche Meldung. Ich habe die DIMMs einzeln und verschiedenen Bänken getestet Ich habe immer die beiden blauen Slots verwendet. Muss ich etwas spezielles im BIOS einstellen?
DivideByZero
DivideByZero 06.02.2025 um 09:16:00 Uhr
Goto Top
Moin,

DIMMs einzeln: treten denn da auch die Fehler im laufenden Betrieb bei beiden auf?
Goldcap
Goldcap 06.02.2025 aktualisiert um 09:22:21 Uhr
Goto Top
Wie viele Meldungen innerhalb von 24h?

Wenn sie in verschiedenen Bänken getestet wurden und sich daran nichts ändert, und mehr wie 10 Meldungen / 24h auftreten, => Module austauschen.
ECC ist ja dafür da Fehler zu korrigieren, wenn aber innerhalb eines bestimmten Zeitraums eine gewisse Anzahl an korrigierten Fehlern auftreten werden diese im Log vermerkt.
mirdochegal
mirdochegal 06.02.2025 um 09:19:37 Uhr
Goto Top
Zitat von @Goldcap:

Wie viele Meldungen innerhalb von 24h?

Wenn sie in verschiedenen Bänken getestet wurden und sich daran nichts ändert, und mehr wie 10 Meldungen / 24h auftreten, Module austauschen.

Soße zu seiner (und meiner) Aussage:
www.intel.com/content/www/us/en/support/articles/000024007/server-products.html
www.intel.com/content/www/us/en/support/articles/000088540/server-products.html
MainSEL
MainSEL 06.02.2025 um 09:27:42 Uhr
Goto Top
Es sind auf jeden Fall viele sehr viele. Ich bin keine Stunde im BMC angemeldet und habe über 1000 Meldungen.
Goldcap
Goldcap 06.02.2025 aktualisiert um 09:29:36 Uhr
Goto Top
Dann wirds dringend Zeit zu tauschen.
MainSEL
MainSEL 06.02.2025 um 09:30:01 Uhr
Goto Top
Ich würde ungern die DIMMs tauschen. Die habe ich erst gekauft leider ohne Garantie. Ich werde heute Abend nochmal Module hinbringen her stecken. Habe ich eine Chance eine genauere Fehlermeldung zu bekommen? Also z. B. in welchen DIMM der Fehler aufgetreten ist?
Goldcap
Goldcap 06.02.2025 aktualisiert um 09:49:14 Uhr
Goto Top
Zitat von @MainSEL:

Ich würde ungern die DIMMs tauschen. Die habe ich erst gekauft leider ohne Garantie.
Auch bei gebrauchten Modulen hast du bei Mängeln als Verbraucher noch ein Recht auf Rückgabe sofern sie denn vom Verkäufer als Fehlerfrei angepriesen wurden.

Ich werde heute Abend nochmal Module hinbringen her stecken.
👍 Und die Slots vorher mit Pressluft ausblasen.
Habe ich eine Chance eine genauere Fehlermeldung zu bekommen? Also z. B. in welchen DIMM der Fehler aufgetreten ist?
Je nach Board gibt es Tools dafür , bei Intel bspw.
https://www.intel.com/content/www/us/en/support/articles/000023940/serve ...
godlie
godlie 06.02.2025 um 10:08:03 Uhr
Goto Top
Hallo,

mit einem Blick in die QVL von Gigabyte wirst du sehen, dass dein Hynix nicht dabei sind.

https://download.gigabyte.com/FileList/QVL/server_mb_qvl_MJ11-ECx_v1.0.p ...

grüße
Xerebus
Xerebus 06.02.2025 um 10:20:02 Uhr
Goto Top
Zitat von @godlie:
mit einem Blick in die QVL von Gigabyte wirst du sehen, dass dein Hynix nicht dabei sind.

Habe ich vor langer Zeit auch mal festgestellt das so eine Kompatibilitätsliste nicht zum spaß da ist face-big-smile
MainSEL
MainSEL 06.02.2025 um 10:34:40 Uhr
Goto Top
Also sollte ich den Arbeitsspeicher tauschen? Dann würde ich schauen das ich zwei Module HMA84GR7AFR4N-VKT3 bekomme. Oder gibt es eine bessere Alternative?