mainsel
Goto Top

RAM Fehler - Correctable ECC - other Memory error

Hallo, ich habe ein Gigabyte MJ11-EC1 mit einem Embedded AMD Epyc 3151. Leider bekomme im BMC immer wieder folgende Fehlermeldung angezeigt:


Unknown sensor of type memory logged a smi handler : Correctable ECC / other correctable memory error was asserted

Diese Fehlermeldung kommt dauerhaft, bestimmt mehrmals die die Minute. Ich habe nun über Nacht einen Memtest durchlaufen lassen und der ist 3 mal erfolgreich durchgelaufen. Im BIOS wird der RAM mit 2400 MHz statt 2666 MHz angezeigt. Ich bin mir nicht sicher ob das bei zwei DIMMs so normal ist. Verbaut sind 2 SK Hynix 32GB Module (HMA84GR7CJR4N - VK T3 AC).

Kann mit jemanden helfen mit dieser Meldung?

Content-ID: 671160

Url: https://administrator.de/forum/ram-fehler-correctable-ecc-other-memory-error-671160.html

Ausgedruckt am: 13.03.2025 um 12:03 Uhr

mirdochegal
mirdochegal 06.02.2025 um 08:48:47 Uhr
Goto Top
Moin,

sitzen die Dimms vernünftig? Einmal ausbauen und neu einbauen und auf korrekten Sitz achten.

Mit einem DIMM? bleibt der Fehler (im Ring tauschen)?
Entweder defekt oder falscher Sitz - meine Vermutungen.

Gruß
MainSEL
MainSEL 06.02.2025 um 09:02:10 Uhr
Goto Top
Hallo, hatte ich vergessen zu erwähnen. Ich habe die DIMMs bereits gestern Abend immer mal getauscht gehabt und zeitweise auch gedacht es war besser. Leider kam die gleiche Meldung. Ich habe die DIMMs einzeln und verschiedenen Bänken getestet Ich habe immer die beiden blauen Slots verwendet. Muss ich etwas spezielles im BIOS einstellen?
DivideByZero
DivideByZero 06.02.2025 um 09:16:00 Uhr
Goto Top
Moin,

DIMMs einzeln: treten denn da auch die Fehler im laufenden Betrieb bei beiden auf?
151434
151434 06.02.2025 aktualisiert um 09:22:21 Uhr
Goto Top
Wie viele Meldungen innerhalb von 24h?

Wenn sie in verschiedenen Bänken getestet wurden und sich daran nichts ändert, und mehr wie 10 Meldungen / 24h auftreten, => Module austauschen.
ECC ist ja dafür da Fehler zu korrigieren, wenn aber innerhalb eines bestimmten Zeitraums eine gewisse Anzahl an korrigierten Fehlern auftreten werden diese im Log vermerkt.
mirdochegal
mirdochegal 06.02.2025 um 09:19:37 Uhr
Goto Top
Zitat von @151434:

Wie viele Meldungen innerhalb von 24h?

Wenn sie in verschiedenen Bänken getestet wurden und sich daran nichts ändert, und mehr wie 10 Meldungen / 24h auftreten, Module austauschen.

Soße zu seiner (und meiner) Aussage:
www.intel.com/content/www/us/en/support/articles/000024007/server-products.html
www.intel.com/content/www/us/en/support/articles/000088540/server-products.html
MainSEL
MainSEL 06.02.2025 um 09:27:42 Uhr
Goto Top
Es sind auf jeden Fall viele sehr viele. Ich bin keine Stunde im BMC angemeldet und habe über 1000 Meldungen.
151434
151434 06.02.2025 aktualisiert um 09:29:36 Uhr
Goto Top
Dann wirds dringend Zeit zu tauschen.
MainSEL
MainSEL 06.02.2025 um 09:30:01 Uhr
Goto Top
Ich würde ungern die DIMMs tauschen. Die habe ich erst gekauft leider ohne Garantie. Ich werde heute Abend nochmal Module hinbringen her stecken. Habe ich eine Chance eine genauere Fehlermeldung zu bekommen? Also z. B. in welchen DIMM der Fehler aufgetreten ist?
151434
151434 06.02.2025 aktualisiert um 09:49:14 Uhr
Goto Top
Zitat von @MainSEL:

Ich würde ungern die DIMMs tauschen. Die habe ich erst gekauft leider ohne Garantie.
Auch bei gebrauchten Modulen hast du bei Mängeln als Verbraucher noch ein Recht auf Rückgabe sofern sie denn vom Verkäufer als Fehlerfrei angepriesen wurden.

Ich werde heute Abend nochmal Module hinbringen her stecken.
👍 Und die Slots vorher mit Pressluft ausblasen.
Habe ich eine Chance eine genauere Fehlermeldung zu bekommen? Also z. B. in welchen DIMM der Fehler aufgetreten ist?
Je nach Board gibt es Tools dafür , bei Intel bspw.
https://www.intel.com/content/www/us/en/support/articles/000023940/serve ...
godlie
godlie 06.02.2025 aktualisiert um 10:54:03 Uhr
Goto Top
Hallo,

mit einem Blick in die QVL von Gigabyte wirst du sehen, dass deine Hynix nicht dabei sind.

https://download.gigabyte.com/FileList/QVL/server_mb_qvl_MJ11-ECx_v1.0.p ...

grüße
Xerebus
Xerebus 06.02.2025 um 10:20:02 Uhr
Goto Top
Zitat von @godlie:
mit einem Blick in die QVL von Gigabyte wirst du sehen, dass dein Hynix nicht dabei sind.

Habe ich vor langer Zeit auch mal festgestellt das so eine Kompatibilitätsliste nicht zum spaß da ist face-big-smile
MainSEL
MainSEL 06.02.2025 um 10:34:40 Uhr
Goto Top
Also sollte ich den Arbeitsspeicher tauschen? Dann würde ich schauen das ich zwei Module HMA84GR7AFR4N-VKT3 bekomme. Oder gibt es eine bessere Alternative?
godlie
godlie 06.02.2025 um 10:57:02 Uhr
Goto Top
Zitat von @MainSEL:

Also sollte ich den Arbeitsspeicher tauschen? Dann würde ich schauen das ich zwei Module HMA84GR7AFR4N-VKT3 bekomme. Oder gibt es eine bessere Alternative?

Aus Erfahrung heraus Kingston, Crucial und Samsung machen die wenigstens Probleme

grüße
MainSEL
MainSEL 06.02.2025 um 11:26:19 Uhr
Goto Top
Okay danke für den Tipp. Ich habe mal auf Kleinanzeigen geschaut aber leider nichts gescheites außer Hynix gefunden. Demnach habe ich folgende Module gefunden.

https://www.gekko-computer.de/p/Samsung-DDR4-RAM-32GB-PC4-2666V-ECC-RDIM ...

Wären diese optimal kompatibel? Laut meiner Auffassung werden diese gelistet in dem Dokument was geschickt wurde. Wo auch immer das her kommt. Ich selbst finde zu dem Mainboard bei Gigabyte nichts.
godlie
godlie 06.02.2025 um 11:53:54 Uhr
Goto Top
MainSEL
MainSEL 06.02.2025 um 11:55:25 Uhr
Goto Top
Dies ist leider das EC0 und nicht EC1 Board. Das habe ich auch schon gefunden.
godlie
godlie 06.02.2025 aktualisiert um 12:14:27 Uhr
Goto Top
Da brauchst dir nicht viel Gedanken zu machen, das EC1 dürfte einfach der Systembuilder vom EC0 sein, ist ja auch von der Bestückung her eher für NAS Systeme gedacht, was für Systembuilder spricht.

grüße
MainSEL
MainSEL 06.02.2025 um 12:16:34 Uhr
Goto Top
Dann wundert mich aber wieso auf meinem aktuellen Board F09 als Version ist und ich dort nur F02 herunterladen kann.

Ist der Arbeitsspeicher, welchen ich geschickt habe mit dem Board kompatibel?
godlie
Lösung godlie 06.02.2025 um 13:19:39 Uhr
Goto Top
Ja der Arbeitsspeicher passt.

Bzgl. F09 / F02 Ja weil dein Board eigentlich nicht an einen Enduser verkauft werden solte.

grüße
Pjordorf
Pjordorf 06.02.2025 um 19:59:28 Uhr
Goto Top
Hallo,

Zitat von @MainSEL:
Wo auch immer das her kommt.
Steht doch im Link. Gigabyte.

Und stehen deine nun in dieser Liste oder nicht? Bedenke das auch Teilenummern sich in Buchstaben ändern können, die dann was ganz anderes bedeuten.

Gruss,
Peter