wesser-h
Goto Top

Fehlerhaften RAM identifizieren?

Hallo,

ein Server von mir stieg vor kurzem mit einer Kernel Panic aus. Ich konnte grad noch so erkennen, daß er ein virtuelles Adressierungsproblem hat. Meine Vermutung ist, daß es sich entweder um einen Fehler in der Speicherverwaltung des Kernels handelt oder schlicht und ergreifend der RAM defekt ist. Um letzteres auszuschließen, suche ich ein Tool, welches mitprotokolliert, ob es beim Schreiben in einzelne physische Speicherbereiche Probleme hat. Das Tool sollte im Live-Betrieb laufen.

Hat da jemand einen Tipp?

Content-ID: 24786

Url: https://administrator.de/forum/fehlerhaften-ram-identifizieren-24786.html

Ausgedruckt am: 23.12.2024 um 00:12 Uhr

BartSimpson
BartSimpson 30.01.2006 um 10:11:33 Uhr
Goto Top
Is es bisher einmmal passiert? Es gibt ein tool um was im falle der Kernelpanic alles aufzeichnet.
http://lkcd.sourceforge.net/
Wenn es ein Fehler im RAM ist, sollte der Server häufiger abstürzen. Es könnte jedoch ein der Speichercontroller oder die CPU selbst sein. Falls dein Server ECC oder Chip-Kill RAM hat, sollte der Kernel eigenlich den Fehler erkennen können. Desweiteren sollte im Log ein Eintrag zu finden sein.(vom BIOS)
wesser-h
wesser-h 30.01.2006 um 10:23:25 Uhr
Goto Top
Danke für die flotte Antwort.

Der Server ist leider eine Altlast, die keinen ECC-Speicher hat face-sad Meine erste Vermutung lief auch in Richtung CPU, jedoch sind die Probleme, die ich in der Vergangenheit mit Prozessoren hatte, eher thermischer Natur. Das kann ich hier aber ausschliessen.

Ich geb zu, das LKCD-Projekt hört sich interessant an, aber erst den Kernel zu patchen bzw. neu zu bauen ist IMHO bei einem Server im Produktivbetrieb etwas heikel.

Kann man den Kernel nicht dahingehend bringen, daß er beim Schreibzugriff auf den RAM die Speicherseiten verifiziert? Auch wenn dies enorme Leistungseinbußen mit sich bringt...
Phisch
Phisch 30.01.2006 um 10:38:33 Uhr
Goto Top
Tag,

vielleicht kann hier Memtest (http://www.memtest86.com) helfen, ist eine Bootdiskette oder
CD, die den Speicher mit Mustern vollschreibt und anschliessend diese überprüft. Das Funktioniert einigermassen zufriedenstellend, dauert aber etliche Stunden.

Gruss Phisch.
BartSimpson
BartSimpson 30.01.2006 um 11:06:33 Uhr
Goto Top
Genau deswegen hatte ich das jetzte nicht abgeführt. Weil es halt Stunden dauertface-sad
wesser-h
wesser-h 30.01.2006 um 11:12:09 Uhr
Goto Top
Ja, leider dauert mir die Downtime des Servers dann zulange...
netstorm
netstorm 30.01.2006 um 11:28:04 Uhr
Goto Top
Ja, leider dauert mir die Downtime des
Servers dann zulange...

Habt ihr "Ersatzram"? Wenn ja würde ich hingehen und den Server kurzzeitig mit Ersatzram ausstatten und in einem Testsystem den zu testenden Ramriegel mit memtest86 konfrontieren. Ist der Riegel kaputt, ist er auch in einem anderen System kaputt...

CIAO Thorsten
14078
14078 30.01.2006 um 11:51:31 Uhr
Goto Top
http://www.simmtester.com/PAGE/products/doc/docinfo.asp

damit kannst du deinen ram testen, gute ergebnisse!
wesser-h
wesser-h 30.01.2006 um 12:07:57 Uhr
Goto Top
Läuft nur unter DOS/W95/W98 face-sad
14078
14078 30.01.2006 um 12:58:10 Uhr
Goto Top
ahrg,

hier der richtige link. da gibts sehr gute soft:

http://www.soft-ware.net/system/steuerung/benchmark/index.asp?licht=sis ...