coldzero
Goto Top

Kernel Panic nach 2 Minuten Laufzeit!

Moin Moin,

wiedereinmal wende ich mich an euch, diesesmal nicht bezüglich Windows sondern bezüglich eines Unix systems.

Wir haben einen sogenannten LOGServer, BS Centos5.2, dieser lief nun etliche jahre ohne Probleme in unserem Datacenter in einem Reck.

Aufeinmal war der Server nicht mehr über SSH zu erreichen. Also sind wir hingefahren und geprüft was er für Probleme haben.
Nach dem Rebooten lief er 2 Minuten und bekommt dann einen "Kernel Panic".

Also wir den Server mit ins Büro genommen, ab aufn OP-Tisch, aufgemacht und mal gestartet, läuft super das ding.
Also wieder in den Reck eingebaut, das selbe, Kernel Panic nach 2 Minuten laufzeit.

Wieder ins Büro, ALLE Komponenten getauscht, außer die HDDS ( 1 Mirror Raid, eine Hauptplatte auf der das BS läuft ) diese Getestet ohne Fehler. Wieder lief er im Büro 1a, ließ sich über SSH ansprechen und war glücklich, ab ins Reck mit dem und wieder Kernel Panic.

Der Logserver fürht keine Crontabs aus oder ähnliches, das einzige was er tut sind RSnapshots, die immer funktionierten und gemacht wurden.
Gut die platte war voll, wir also Alte Snapshots gelöscht damit er Platz hat, evt liegt dort das problem, auch nicht wieder Kernel Panic...

nun sind wir soweit das wir echt Ratlos sind wo das Problem liegen könnte... Haben in die Logs geschaut ob er uns was sagt, Booten tut er 1a, ohne murren und Knurren, sobald er in Produktiven Betrieb gehen muss, schmiert er weg!

Evt habt ihr noch ideen woran es liegen könnte.

Danke im vorraus.

Mfg Coldi

Content-ID: 115759

Url: https://administrator.de/contentid/115759

Ausgedruckt am: 26.11.2024 um 16:11 Uhr

dog
dog 11.05.2009 um 13:09:43 Uhr
Goto Top
Nun, da würde ich sagen, das ist umgebungsinduziert face-smile

Evtl. DOSt einer der Logger den Server oder sendet Daten die den Syslog-Server zum Absturz bringen.
Du hast da drei Möglichkeiten:
  • Prüfen, ob die syslog Software aktuell ist
  • Mit Wireshark etc. den Traffic beobachten, ob etwas besonderes passiert, wenn der Server panict
  • Die Kernel-Log anschauen. Wenn es eine waschechte Kernel Panic ist, hilft da nur vom Bildschirm abschauen, ansonsten sollte in /var/log/messages was zu finden sein

Grüße

Max
ColdZero
ColdZero 11.05.2009 um 13:16:23 Uhr
Goto Top
Also auf möglicjhkeit 3 sind wir auch gekommen, NICHTS

mit Syslog und nen bisschen Sniffen gute idee, was halt als letztes passiert bevor er die gretsche macht. gut gut, danke werd ich mal Probieren.


EDIT:

So hat sich erledigt
konnte cheffe nicht überzeugen einmal zwischen zu sniffern, wäre lustig geworden =D

Er Deaktiviert alle Crons und das NFS und schaut ob er immer noch panict.

Eine Information die mich eben erreicht hat, sobald er Netzwerk bekommt Panict er. Ohne Network bootet er einwandfrei und läuft auch, Netzwerk Drinne und er Panict SOFORT, also irgendwas am Trafiic wird es sein, aber cheffe will lieber den umweg gehen und neu Aufsetzen. Kann ich nichts gegen sagen.

Dennoch Danke.
ColdZero
ColdZero 12.05.2009 um 11:17:56 Uhr
Goto Top
Moin Moin,

Also weitere Information die mich heute morgen erreicht hat:

Der Kernel Panic kommt vom NFS!

Was könnte da nun schief gehen?
dog
dog 12.05.2009 um 16:08:36 Uhr
Goto Top
Hm, fällt mir so erstmal nichts weiter zu ein...
ColdZero
ColdZero 10.06.2009 um 09:24:04 Uhr
Goto Top
Haben das Problem mehr oder weniger gelöst. NFS Deaktiviert und fertig. Läuft wie heißes Messer durch Budder ;)