Fehlerhaften RAM identifizieren?
Hallo,
ein Server von mir stieg vor kurzem mit einer Kernel Panic aus. Ich konnte grad noch so erkennen, daß er ein virtuelles Adressierungsproblem hat. Meine Vermutung ist, daß es sich entweder um einen Fehler in der Speicherverwaltung des Kernels handelt oder schlicht und ergreifend der RAM defekt ist. Um letzteres auszuschließen, suche ich ein Tool, welches mitprotokolliert, ob es beim Schreiben in einzelne physische Speicherbereiche Probleme hat. Das Tool sollte im Live-Betrieb laufen.
Hat da jemand einen Tipp?
ein Server von mir stieg vor kurzem mit einer Kernel Panic aus. Ich konnte grad noch so erkennen, daß er ein virtuelles Adressierungsproblem hat. Meine Vermutung ist, daß es sich entweder um einen Fehler in der Speicherverwaltung des Kernels handelt oder schlicht und ergreifend der RAM defekt ist. Um letzteres auszuschließen, suche ich ein Tool, welches mitprotokolliert, ob es beim Schreiben in einzelne physische Speicherbereiche Probleme hat. Das Tool sollte im Live-Betrieb laufen.
Hat da jemand einen Tipp?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 24786
Url: https://administrator.de/forum/fehlerhaften-ram-identifizieren-24786.html
Ausgedruckt am: 23.12.2024 um 00:12 Uhr
9 Kommentare
Neuester Kommentar
Is es bisher einmmal passiert? Es gibt ein tool um was im falle der Kernelpanic alles aufzeichnet.
http://lkcd.sourceforge.net/
Wenn es ein Fehler im RAM ist, sollte der Server häufiger abstürzen. Es könnte jedoch ein der Speichercontroller oder die CPU selbst sein. Falls dein Server ECC oder Chip-Kill RAM hat, sollte der Kernel eigenlich den Fehler erkennen können. Desweiteren sollte im Log ein Eintrag zu finden sein.(vom BIOS)
http://lkcd.sourceforge.net/
Wenn es ein Fehler im RAM ist, sollte der Server häufiger abstürzen. Es könnte jedoch ein der Speichercontroller oder die CPU selbst sein. Falls dein Server ECC oder Chip-Kill RAM hat, sollte der Kernel eigenlich den Fehler erkennen können. Desweiteren sollte im Log ein Eintrag zu finden sein.(vom BIOS)
Tag,
vielleicht kann hier Memtest (http://www.memtest86.com) helfen, ist eine Bootdiskette oder
CD, die den Speicher mit Mustern vollschreibt und anschliessend diese überprüft. Das Funktioniert einigermassen zufriedenstellend, dauert aber etliche Stunden.
Gruss Phisch.
vielleicht kann hier Memtest (http://www.memtest86.com) helfen, ist eine Bootdiskette oder
CD, die den Speicher mit Mustern vollschreibt und anschliessend diese überprüft. Das Funktioniert einigermassen zufriedenstellend, dauert aber etliche Stunden.
Gruss Phisch.
Ja, leider dauert mir die Downtime des
Servers dann zulange...
Servers dann zulange...
Habt ihr "Ersatzram"? Wenn ja würde ich hingehen und den Server kurzzeitig mit Ersatzram ausstatten und in einem Testsystem den zu testenden Ramriegel mit memtest86 konfrontieren. Ist der Riegel kaputt, ist er auch in einem anderen System kaputt...
CIAO Thorsten
http://www.simmtester.com/PAGE/products/doc/docinfo.asp
damit kannst du deinen ram testen, gute ergebnisse!
damit kannst du deinen ram testen, gute ergebnisse!
ahrg,
hier der richtige link. da gibts sehr gute soft:
http://www.soft-ware.net/system/steuerung/benchmark/index.asp?licht=sis ...
hier der richtige link. da gibts sehr gute soft:
http://www.soft-ware.net/system/steuerung/benchmark/index.asp?licht=sis ...