CentOS 6 Crash - wie Fehler analysieren?
Hallo,
mein Root-Server crashed seit ein paar Tagen immer wieder (Zeitraum: immer nach ~ 2 Tagen).
OS: CentOS6
Updates: up-to-date
Anbieter: Strato
Das System lief einwandfrei. Ich habe qemu mit einer VM am laufen, diese nutzt 6 von 8 Cores des Hosts.
Wie kann ich jetzt analysieren, wie diese Crash's zustande kommen?
Welche Log-Dateien kann ich da durchsuchen?
Nach einem Crash kann ich über den Strato-Kundenservicebereich einen Hardware-Test anstarten. Laut Infobox dauert dieser 2h. Nach 4h habe ich abgebrochen und das System rebootet. Anschließend kann ich wieder normal arbeiten. Ob der Test überhaupt lief, weiß ich nicht.
Temperatur von CPU liegt bei ~50-60°. Anzeige über Paket "lm_sensors".
Warte z.Z. auf Antwort von Strato.
Habt ihr noch Tipps für mich? Ich bin ratlos.....
MfG Hannes
mein Root-Server crashed seit ein paar Tagen immer wieder (Zeitraum: immer nach ~ 2 Tagen).
OS: CentOS6
Updates: up-to-date
Anbieter: Strato
Das System lief einwandfrei. Ich habe qemu mit einer VM am laufen, diese nutzt 6 von 8 Cores des Hosts.
Wie kann ich jetzt analysieren, wie diese Crash's zustande kommen?
Welche Log-Dateien kann ich da durchsuchen?
Nach einem Crash kann ich über den Strato-Kundenservicebereich einen Hardware-Test anstarten. Laut Infobox dauert dieser 2h. Nach 4h habe ich abgebrochen und das System rebootet. Anschließend kann ich wieder normal arbeiten. Ob der Test überhaupt lief, weiß ich nicht.
Temperatur von CPU liegt bei ~50-60°. Anzeige über Paket "lm_sensors".
Warte z.Z. auf Antwort von Strato.
Habt ihr noch Tipps für mich? Ich bin ratlos.....
MfG Hannes
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 238653
Url: https://administrator.de/forum/centos-6-crash-wie-fehler-analysieren-238653.html
Ausgedruckt am: 19.04.2025 um 00:04 Uhr
3 Kommentare
Neuester Kommentar
Hallo,
generell alles unter /var/log/ durchsuchen. Wenn es sich allerdings um einen Hardware Fehler handelt was nach deiner Beschreibung eher wahrscheinlich ist dann kann es sein das dort nur die Einträge vom Neustart zu finden sind. Im allgemeinen ist es meistens so das wenn die Maschine "stehenbleibt" der Fehler eher im I/O System zu suchen ist, wenn die Kiste neu startet eher im RAM. Ein weiterer Punkt ist das grob geschätzt nur die Hälfte der Hardware Fehler tatsächlich auch von den Diagnose Routinen entdeckt werden.
Viel Erfolg
Andi
generell alles unter /var/log/ durchsuchen. Wenn es sich allerdings um einen Hardware Fehler handelt was nach deiner Beschreibung eher wahrscheinlich ist dann kann es sein das dort nur die Einträge vom Neustart zu finden sind. Im allgemeinen ist es meistens so das wenn die Maschine "stehenbleibt" der Fehler eher im I/O System zu suchen ist, wenn die Kiste neu startet eher im RAM. Ein weiterer Punkt ist das grob geschätzt nur die Hälfte der Hardware Fehler tatsächlich auch von den Diagnose Routinen entdeckt werden.
Viel Erfolg
Andi
Du könntest, falls vorhanden, die Core-dumps untersuchen. das sind dateien, die "core" heißen und die das System schreibt, wenn es abschmiert.
Welche Log-Dateien kann ich da durchsuchen?
/var/log/messages oder /var/log/syslog, je nachdem was da vorhanden ist.
lks