wern2000
Goto Top

SuperMicro X10dri-t erkennt speicher an zwei DIMMs nicht

Hallo,
hab hier einen Supermicro-Server der irgendwie stellenweiße verdächtig langsamm ist. Hab da mit AIDA64 ein paar Benchmarks gemacht. Das gleiche Board mit ähnlicher CPU (2660 V3) war da zufällig in der liste und der Server hier hat z.B. nur 25% der Ramgeschwindigkeit. Bei reiner CPU-Last ca 2-4% langsammer was normal ist da 4 Kerne weniger.
Bei der Fehlersuche hab ich festgestellt das RAM in den Slot A1 und A2 nicht erkannt werden.
Ich hab zum test die CPUs (E5-2667 V4) von CPU 1<->2 getauscht und der Fehler blieb an der gleichen stelle. Allerdings muste ich dabei feststellen das 3 Pins im CPU-Sockel leicht verbogen sind. Rote kringel auf dem Bild.
Die Dimm-Steckplätze scheinen Optisch in ordnung zu sein. Ich hab mir einen PIN-Out von dem Sockel angeschaut und an dieser stelle müsten eigentlich Pins für die Stromversorgung sein.
Als Rams sind 8x hynix HMA82GR7AFR8N-UH verbaut. Das 8te Modul ist aktuell in B2 verbaut damit das Teil 128 GB erkennt.
Hat da jemand ein Tip für mich was das sein könnte? Pins vorsichtig gerade biegen?
x10dri-t-2

Content-ID: 1478948744

Url: https://administrator.de/contentid/1478948744

Ausgedruckt am: 21.11.2024 um 15:11 Uhr

sabines
sabines 07.11.2021 um 09:49:00 Uhr
Goto Top
Moin, ohne das genau zu analysieren:
Dein RAM Baustein erscheint nicht in der tested memory list von Supermicro, d.h. er kann laufen, muss es aber nicht.
Hast Du überall den selben Baustein drin.
Bei Supermicro, mindestens bei den alten Boards, war die Reihenfolge der Bestückung, d.h. welcher Hersteller/Kapazität in welchem Slot steckt extrem wichtig.

Gruss
Wern2000
Wern2000 07.11.2021 aktualisiert um 10:38:51 Uhr
Goto Top
Sind 8 gleiche RAM-Module
So eine Richtige tested memory list hab ich nicht gefunden. Die Liste memory list sagt leider nicht viel aus. Vor gar nicht allzulanger Zeit hat man ja noch unterschiedliche Hersteller gesehen. Bei DDR3 waren die Boards richtig kleinlich.

Ich hab zum test alle 8 RAMs in die ersten Steckplätze von CPU1 rein (Laut Handbuch sollten die blauen zuerst bestückt werden) und RAMs werden in A1 und A2 nicht erkannt. Alle anderen DIMMs auch alle von CPU2 funktionieren.

Ich schätze das hauptproblem für die Geschwindigkeit ist dass das Board auf hex-channel umschaltet
hier das ergebniss von CPU-AES
zwischenablage01
hier das ergebniss von CPU-ZLib
[image 0162fd1b3d73771f2de9c40dcf9a808d]]
zwischenablage02
sabines
sabines 07.11.2021 um 10:08:26 Uhr
Goto Top
Stimmt, Du musst in die Archived (EOL Memories) Liste schauen, sieht aber so aus, als ob die nur noch eigenen RAM supporten. Als ich die Boards mal gut fand, passte immerhin noch Kingston rein.

Das könnte, in Kombination mit den verbogenen PINS, auf einen Hardwaredefekt hinweisen, scheint ja auch schon ein älteres Board zu sein. BMC und BIOS ist aktuell?

Gruss
Wern2000
Wern2000 07.11.2021 aktualisiert um 10:20:28 Uhr
Goto Top
Das mit den Speichern hab ich schon gesehen man kam nur in deren Shop
BIOS 3.3 ist drauf. Das 3.4a hat anscheinend nur microcode update.

Ein CLR-CMOS hab ich natürlich gemacht face-wink
Vision2015
Vision2015 07.11.2021 um 10:50:18 Uhr
Goto Top
moin...
Zitat von @Wern2000:

Hallo,
hab hier einen Supermicro-Server der irgendwie stellenweiße verdächtig langsamm ist. Hab da mit AIDA64 ein paar Benchmarks gemacht. Das gleiche Board mit ähnlicher CPU (2660 V3) war da zufällig in der liste und der Server hier hat z.B. nur 25% der Ramgeschwindigkeit. Bei reiner CPU-Last ca 2-4% langsammer was normal ist da 4 Kerne weniger.
Bei der Fehlersuche hab ich festgestellt das RAM in den Slot A1 und A2 nicht erkannt werden.
Ich hab zum test die CPUs (E5-2667 V4) von CPU 1<->2 getauscht und der Fehler blieb an der gleichen stelle. Allerdings muste ich dabei feststellen das 3 Pins im CPU-Sockel leicht verbogen sind. Rote kringel auf dem Bild.
nun, da wo dein kringel ist, ist die socket abdeckung, da sieht keiner die verborgenen pins..... face-smile
Die Dimm-Steckplätze scheinen Optisch in ordnung zu sein. Ich hab mir einen PIN-Out von dem Sockel angeschaut und an dieser stelle müsten eigentlich Pins für die Stromversorgung sein.
Als Rams sind 8x hynix HMA82GR7AFR8N-UH verbaut. Das 8te Modul ist aktuell in B2 verbaut damit das Teil 128 GB erkennt.
Hat da jemand ein Tip für mich was das sein könnte? Pins vorsichtig gerade biegen?
das mit dem biegen kannst du wohl knicken, und klappt selten bis überhaupt nicht!
wenn dem wirklich so ist, kannst du das board entsorgen.....
hast du die ram module mal untereinander getauscht, oder einen satz neue eingebaut?
Frank
Wern2000
Wern2000 07.11.2021 aktualisiert um 12:04:51 Uhr
Goto Top
Die Pins sind nur leicht verbogen nicht soweit das sie andere Pins berühren könnten.
hab die module untereiander getauscht.
wenn ich das 8te Modul in B2 einbaue werden alle also 128 GB erkannt.
Wenn ich alle 8 Module bei CPU2 einbaue werden ebenfalls alle erkannt.
Stecke ich alle 8 Module bei CPU1, dann fehlen A1 und A2.

hatte kein bild gemacht. ist das original bild von Supermicro

Hab über nacht per AIDA CPU und RAM Stresstest laufen lassen. Stabiel laufen tut es.
cykes
cykes 07.11.2021 um 12:38:33 Uhr
Goto Top
Moin,

hast Du auch schon probiert, nur jeweil ein Modul in A1 und E1 zu stecken?

Erkennt er da ebenfalls das Modul in A1 nicht?

Bei 4 Modulen pro CPU sollte man eigentlich A1/B1/C1/D1 sowie E1/F1/G1/H1 bestücken. Kommen da irgendwelche *2 Slots ins Spiel taktet er den Speicher runter.

Gruß

cykes
Wern2000
Wern2000 07.11.2021 aktualisiert um 14:01:46 Uhr
Goto Top
Zitat von @cykes:
Bei 4 Modulen pro CPU sollte man eigentlich A1/B1/C1/D1 sowie E1/F1/G1/H1 bestücken. Kommen da irgendwelche *2 Slots ins Spiel taktet er den Speicher runter.


Das sind die blauen Slots. Bei A1 und E1 wird ebenfalls nur E1 erkannt. Bei nur A1 bootet das Board nicht mehr mit der Meldung kein RAM.
Ja wenn die schwarzen Slots belegt sind wird der RAM-Takt um eine Stufe runter gesetzt. Man kann aber im BIOS einstellen dass das nicht gemacht wird und das sie zwangsweiße auf 2400 laufen.

Wie schon geschrieben bei bestückung nur CPU1 also A1/A2/B1/B2/C1/C2/D1/D2 werden A1 und A2 nicht erkannt. Im BIOS sieht man die belegten RAM-Slots
Das gleiche Spiel mit CPU2 also E1-H2 werden alle 8 RAM-Module im BIOS angezeigt.
Vision2015
Vision2015 07.11.2021 um 14:23:11 Uhr
Goto Top
Zitat von @Wern2000:

Die Pins sind nur leicht verbogen nicht soweit das sie andere Pins berühren könnten.
aber keinen richtigen kontakt, da wo es sein soll....
hab die module untereiander getauscht.
wenn ich das 8te Modul in B2 einbaue werden alle also 128 GB erkannt.
Wenn ich alle 8 Module bei CPU2 einbaue werden ebenfalls alle erkannt.
Stecke ich alle 8 Module bei CPU1, dann fehlen A1 und A2.

hatte kein bild gemacht. ist das original bild von Supermicro

Hab über nacht per AIDA CPU und RAM Stresstest laufen lassen. Stabiel laufen tut es.

nun... produktiv würde ich das nicht mehr nutzen wollen....

Frank
cykes
cykes 07.11.2021 um 17:43:12 Uhr
Goto Top
Ist das eigentlich ein Selbstbauserver oder ein Supermicro Komplettsystem?
Ein Kollege hatte vor einger Zeit mal ein ähnliches Problem mit einem Selbstbau mit einem Supermicro X8DTE Mainboard. Da wurden auch von einem Tag auf den anderen die CPU1 DIMMs in den ersten Slots nicht mehr erkannt. Das System lief aber ansonsten auch stabil weiter. Er konnte aber auch nur Vermutungen anstellen, das Board wurde wohl nicht ausreichend gekühlt (ungeeignetes Gehäuse) und die Spannungsversorgung der DIMMs war nicht mehr stabil. Vermutlich ist einer der Spannungsregler auf dem Board gestorben, die werden ja extrem heiß und haben bei einigen Modellen auch noch einen Kühlkörper installiert, das war aber bei seinem nicht der Fall und bei Deinem gibt es den Kühlkörper auch nicht. Bei Komplettsystemen sind ja ausreichend (Gehäuse-)Lüfter verbaut, die für einen kontinuierlichen Luftstrom über das gesamte Mainboard sorgen.

Gruß

cykes
Vision2015
Vision2015 07.11.2021 um 17:50:17 Uhr
Goto Top
Zitat von @cykes:

Ist das eigentlich ein Selbstbauserver oder ein Supermicro Komplettsystem?
Ein Kollege hatte vor einger Zeit mal ein ähnliches Problem mit einem Selbstbau mit einem Supermicro X8DTE Mainboard. Da wurden auch von einem Tag auf den anderen die CPU1 DIMMs in den ersten Slots nicht mehr erkannt. Das System lief aber ansonsten auch stabil weiter. Er konnte aber auch nur Vermutungen anstellen, das Board wurde wohl nicht ausreichend gekühlt (ungeeignetes Gehäuse) und die Spannungsversorgung der DIMMs war nicht mehr stabil. Vermutlich ist einer der Spannungsregler auf dem Board gestorben, die werden ja extrem heiß und haben bei einigen Modellen auch noch einen Kühlkörper installiert, das war aber bei seinem nicht der Fall und bei Deinem gibt es den Kühlkörper auch nicht. Bei Komplettsystemen sind ja ausreichend (Gehäuse-)Lüfter verbaut, die für einen kontinuierlichen Luftstrom über das gesamte Mainboard sorgen.
na ja... das mag ja alles sein, aber wenn im CPU Sockel schon einige "Beinschen"verborgen sind, und die CPU nicht richtig sitzt- funktionieren die Bänke nicht richtig... das ergebniss steht ja oben!
Doof ist es nur, das es bei CPU1 ist....

Gruß

cykes

Frank
Wern2000
Wern2000 07.11.2021 aktualisiert um 18:50:44 Uhr
Goto Top
Ist ein komplettsystem. Gehäuse ist das Ding was man zu 19" umbauen kann.
Die CPUs werden mit den Pasivkühler und dem Windtunel gekühlt. Ich bin da erst später dazugekommen. Das Teil läuft schon eine weile.
Und B1/B2 waren schon gesteckt.

Ein 600€ Board möchte ich ungern in die Tonne tretten aber auf der anderen Seite kein User hat es bis jetzt bemerkt.
Vision2015
Vision2015 07.11.2021 um 19:24:43 Uhr
Goto Top
moin...
Zitat von @Wern2000:

Ist ein komplettsystem. Gehäuse ist das Ding was man zu 19" umbauen kann.
das ding.... face-smile
Die CPUs werden mit den Pasivkühler und dem Windtunel gekühlt. Ich bin da erst später dazugekommen. Das Teil läuft schon eine weile.
nun, das ist kein grund, das MB so weiter laufen zu lassen......
Und B1/B2 waren schon gesteckt.

Ein 600€ Board möchte ich ungern in die Tonne tretten aber auf der anderen Seite kein User hat es bis jetzt bemerkt.
nun ja.. was willste machen, das ist nicht betriebsicher!
was sind 600 Euro... wenn der Server die grätsche macht- und was kostet eine 2 tage eine betriebsunterbrechung.. oder länger!
habt ihr wenigstens eine ordentlich image datensicherung?
frag wegen dem MB mal beim Hersteller nach...
Frank
Wern2000
Wern2000 08.11.2021 aktualisiert um 19:19:42 Uhr
Goto Top
Das mit der Datensicherung hab ich schon auf vorderman gebracht.
Gibt Bootfähige CD die den Streamer erkennt und ein offline image vom BS Partion wurde gemacht.