tuffli
Goto Top

Nagios Website zeigt "Not running"

Hallo Leute,

ich habe einen XenServer 6.2 in Betrieb und darunter eine VM mit Ubuntu 14.04.1 worauf ein Nagios Core 4.1.1 installiert ist.
Das Ganze lief bis vor zwei Tagen super. Dann habe ich wegen einer Fehlkonfiguration einen Snapshot der VM zurückgespielt.
Dabei wurde meine NIC seltsamerweise von eth1 auf eth0 gesetzt. Sonst schien zunächst alles zu laufen.
Wenn ich nun allerdings auf 192.168.101.150/nagios zugreife steht dort "Not running" und ich kann weder auf Host-Infos noch auf sonst irgendetwas zugreifen.
service nagios status besagt allerdings, der Dienst würde laufen.
Das Log (/usr/local/nagios/var/nagios.log) ist unauffällig und behauptet es wäre alles "successfully" und "ready to rock"
Hat jemand eine Idee dazu?
Vielen Dank schonmal im Voraus!

Content-ID: 287681

Url: https://administrator.de/contentid/287681

Ausgedruckt am: 22.11.2024 um 10:11 Uhr

cptkrabbe
cptkrabbe 06.11.2015 um 09:18:49 Uhr
Goto Top
nagios ist lange her bei mir... aber muss zum anzeigen der website nicht auch der apache laufen? tut der das?
Tuffli
Tuffli 06.11.2015 um 10:21:27 Uhr
Goto Top
Hallo cptkrabbe,

Der Apache läuft. Auf den Web-Server kann ich auch zugreifen. Nur auf der Seite von Nagios selbst erscheint dann eben die Info "Not running"
Looser27
Looser27 06.11.2015 um 10:34:57 Uhr
Goto Top
Und Du bist sicher das der nagios-Dienst läuft?
Hast Du den mal separat im Debug-Modus gestartet? Vielleicht kneift es doch irgendwo...
Tuffli
Tuffli 06.11.2015 aktualisiert um 11:09:03 Uhr
Goto Top
servic nagios status:
Active: active (exited)
In dem Zusammenhang fällt mir ein, dass ich ihn allerding per Hand starten musste, und er nicht beim Starten der VM automatisch angeworfen wurde.
Kann dass das Problem sein (Stichwort SELinux)
Looser27
Looser27 06.11.2015 um 11:14:09 Uhr
Goto Top
Es spielt keine Rolle, ob Du den Dienst automatisch oder manuell startest. Die Ausgabe über das Webinterface muss in beiden Fällen funktionieren.
Tuffli
Tuffli 06.11.2015 um 11:32:41 Uhr
Goto Top
Okay... Hast du dann vielleicht noch eine Idee für mich?
Looser27
Looser27 06.11.2015 um 11:36:44 Uhr
Goto Top
Setz in der nagios.cfg mal den Debug-Level auf -1 und starte dann den nagios Dienst neu. Vielleicht findest Du hier eine Fehlermeldung.

Aber unbedingt nach dem Test wieder zurück auf 0 setzen, sonst platzt der Logfile aus allen Nähten.
Tuffli
Tuffli 06.11.2015 um 11:43:21 Uhr
Goto Top
Okay. Bin gerade unterwegs und hab keinen Zugriff auf mein VPN.
Ich melde mich demnächst mit dem Ergebnis zurück.
Danke schonmal im Voraus
Looser27
Looser27 06.11.2015 um 11:48:32 Uhr
Goto Top
Vielleicht hilft dir das weiter.
Pjordorf
Pjordorf 06.11.2015 um 12:12:55 Uhr
Goto Top
Hallo,

Zitat von @Tuffli:
NIC seltsamerweise von eth1 auf eth0 gesetzt
Du erwähnst hier zwar das es gerade an den "eths" Änderungen gab, ab du erwähnst nirgends das du dann deine eths anschließend in der VM wieder gerade gebogen hast damit dein Linux und dein darauf laufendes NAGIOS sich wider mit den ursprünglichen eths verbinden können. Oder hast du deinem NAGIOS (und allem was dazu gehört) gesagt er möge ab jetzt eine andere Konfiguration nutzen?

Wenn ich nun allerdings auf 192.168.101.150
Feste IPs oder bekommen die was von einen DHCP?

Und du willst wirklich keine Änderung seit dem Snapshot gemacht haben was deine Hardware betrifft - oder wie erklärst du dir dann warum ein zurückspielen eines Snapshots dein Linux dazu bringt - Äh Hardware ist irgendwie geändert....

Gruß,
Peter
Tuffli
Tuffli 06.11.2015 aktualisiert um 14:17:50 Uhr
Goto Top
Oha... Der Ton wird rauer...

Zunächst einmal @Looser27:

1) Ich habe mal das Debug-Level von 0 auf -1 umgestellt, den Dienst gestoppt und gestartet. Das Ergebnis in nagios.log ist genau das selbe. Kein Fehler protokoliert
2) system-config-network-tui hilft mir, so glaube ich zumindest, nicht weiter. Erstens ist meine Umgebung eine ganz andere, zweitens läuft das Tool, nach allem was ich gelesen habe, nicht unter Ubuntu.

@Pjordorf

Du erwähnst hier zwar das es gerade an den "eths" Änderungen gab, ab du erwähnst nirgends das du dann deine eths anschließend in der VM wieder gerade gebogen hast damit dein Linux und dein darauf laufendes NAGIOS sich wider mit den ursprünglichen eths verbinden können.

Die Änderung der eths habe ich nicht thematisiert, da es aus meiner Sicht keine große Sache war. Vielleicht bin ich da einem Irrglauben erlegen. Ich habe die Änderung der NIC nicht als problematisch angesehen.
Tatsächlich habe ich den Server nach dem Zurückspielen des Snapshots hochgefahren und gemerkt, dass ich keine Netzwerkverbindung habe.
ifconfig zeigte mir nur das Loopback-Interface. Daher dachte ich, beim Zurückspielen wäre das IF vielleich deaktiviert worden.
Also habe ich
 ifconfig eth1 up 
eingetippt, und gestaunt, dass dieses Gerät nicht zur Verfügung steht.
 ifconfig eth0 up 
brachte ein Interface zu Tage, also habe ich /etc/network/interfaces entsprechend auf eth0 angepasst.
Feste IPs oder bekommen die was von einen DHCP?

Die IP ist also statisch und die selbe wie zuvor.

Ping funktionierte, der Apache-Webserver funktionierte, und auch der Nagios sammelt wieder Informationen. Somit war das "Problem" für mich erstmal gelöst. Dass die Website den Dienst als "not running" erkennt, ist mir erst viel später aufgefallen.

Und du willst wirklich keine Änderung seit dem Snapshot gemacht haben was deine Hardware betrifft - oder wie erklärst du dir dann warum ein zurückspielen eines Snapshots dein Linux dazu bringt - Äh Hardware ist irgendwie geändert....

Ganz ehrlich: Zwischen Snapshot-Erstellung und -Zurückspielen lagen etwa 20 Minuten. Wenn sich in dieser Zeit nicht zufällig ein Bösewicht in mein Arbeitszimmer geschlichen, und an meinem Server zu schaffen gemacht hat, wurde Hardwareseitig nichts geändert. Und an der VM kann ich ja keine "Hardware" geändert haben.
Der einzigen Grund, der mir einfällt, warum die NIC "geändert" worden sein könnte, ist die Einstellung "Auto-genarte a MAC-Address". Sollte sich beim Rückspielen die Adresse geänder haben, kann ich das nun nicht mehr nachvollziehen, aber das könnte die Änderung von eth1 auf eth0 evtl. erklären. Natürlich habe ich mir die MAC vorm Zurückspielen nicht notiert...
Muss ich nun auf eth1 zurück? Sollte das wirklich der Fehler sein?
Tuffli
Tuffli 08.11.2015 um 16:24:09 Uhr
Goto Top
Bin jetzt noch einen Snapshot weiter zurück, habe Nagios neu installiert und die Config-Dateien kopiert. Nun läuft es wieder.
Schade, dass es offensichtlich keine andere Lösung gab...
Pjordorf
Pjordorf 08.11.2015 um 20:42:55 Uhr
Goto Top
Hallo,

Zitat von @Tuffli:
Zwischen Snapshot-Erstellung und -Zurückspielen lagen etwa 20 Minuten. Wenn sich in dieser Zeit nicht zufällig ein Bösewicht in mein Arbeitszimmer geschlichen, und an meinem Server zu schaffen gemacht hat, wurde Hardwareseitig nichts geändert.
Um so mehr solltest du dich also fragen warum ein Snapshot dann so merkwürdig reagiert. Einen Grund muss es haben und nein, es ist nicht normal.

Und an der VM kann ich ja keine "Hardware" geändert haben.
Aber du kannst einer VM sagen was der Gast dort an Hardware vorfindetface-smile

Der einzigen Grund, der mir einfällt, warum die NIC "geändert" worden sein könnte, ist die Einstellung "Auto-genarte a MAC-Address".
Und auch hier sollte sich die MAC deine Virtuellen Hardware beim Gast nicht ändern, sofern eben von dir nichts geändert wurde.

Muss ich nun auf eth1 zurück? Sollte das wirklich der Fehler sein?
Frage dich lieber warum dein Nagios und dein Webserver sich so verhalten obwohl du ja nichts geändert hast face-smile und wer hier mit welcher MAC was veranstaltet bzw. einrichtet.

Bin jetzt noch einen Snapshot weiter zurück, habe Nagios neu installiert und die Config-Dateien kopiert
Weil nach dem zurückspielen von diesen Snapshot auch nichts ging obwohl dort Nagios schon Installiert und konfiguriert war? Welchen sinn haben also deine Snapshots?

Aber schön wenn es wieder läuft....

Gruß,
Peter