47530
Goto Top

Nagios Eskalationsmanagement

Nagios Eskalationsmanagement bei Netzproblemen

Hallo zusammen,

ich bräuchte mal eure Hilfe. Ich finde im Nagios Handbuch bzw bei Google nicht zu diesem Thema, evtl. suche ich auch nach den falschen Begriffen (sagt dann bitte kurz bescheid)!

Mein Problem:

Wir haben im Moment hier ziemlich viele Netzprobleme (das Netzwerk wir nicht von uns selbst verwaltet, sondern nur die Server). Nagios registriert das natürlich und schick eine e-Mail das der betreffende Server nicht mehr erreichbar ist. Das wäre nicht das Problem, allerding hängen an diesen Netzwerkkomponenten >30 Server die alle über das Nagios überwacht werden. Dadurch bekomme ich (und andere Kollegen der gleichen Eskalationsstufe) 40-60 e-Mails das unsere Server ausgefallen sind (Der Ausfall dauert meist 1-5 Minuten, kommt unregelmässig und wird wohl nicht so schnell behoben werden. Die komplette Konfiguration so um zu stellen das er erst ab 5 Minuten warnt ist keine Option).

Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)

Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?


THX
MFG

Takeoo

Content-ID: 148705

Url: https://administrator.de/forum/nagios-eskalationsmanagement-148705.html

Ausgedruckt am: 22.12.2024 um 13:12 Uhr

Wolfsrudel
Wolfsrudel 10.08.2010 um 13:39:58 Uhr
Goto Top
47530
47530 10.08.2010 um 15:15:07 Uhr
Goto Top
Das ist ja ganz nett nur wird es Nagios nicht davon abhalten mir weiterhin für alles andere eine Mail zu schicken!(?)
Mir wäre lieber wenn jemand eine "offzielle" Lösung für dieses Problem hätte (evtl. ein Befehl der schon mit Nagios selbst mit kommt. Bzw. eine Filterregel)
CadelPigott
CadelPigott 10.08.2010 um 16:19:30 Uhr
Goto Top
Hallo Takeoo,

soweit ich weis ist das mit Nagios Boardmitteln nicht möglich.

Die Onlinedoku gibt hierzu folgenden Tip: http://nagios.sourceforge.net/docs/2_0/escalations.html (ganz unten)

Gruß
Cadel
chrismass
chrismass 12.08.2010 um 11:40:30 Uhr
Goto Top
Zitat von @47530:

Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer
Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur
eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)

Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?


THX
MFG

Takeoo

Hallo!
Ich bin ganz neu im Thema Monitoring und lese mich gerade erst ein. Im Buch "Nagios - System und Netzwerkmonitoring" von Wolfgang Barth wird aber bereits in den ersten Kapiteln genau dieser Anwendungsfall beschrieben. Er schreibt davon, dass man Abhängigkeiten und die Netztopologie berücksichtigen soll.
Also in deinem Fall:
Du hast eine Anzahl x an Services die auf den Servern überwacht werden. Die Server hängen jedoch alle hinter einem oder mehreren Netzkomponenten wie Router und / oder Switches. Wenn du nun diese Netzkomponenten überwachst, kann man eine Abhängigkeit bilden. Also wenn Netzkomponente A ausfällt, soll Nagios keine Fehler mehr bezüglich der dahinterliegenden Services melden (weidl die ja dann eh nicht geprüft werden können).
Also so viel mal zur Theorie face-smile Hoffe das hilft dir etwas weiter.
Wie es in der Praxis funktioniert? ... So weit bin ich noch nicht mit lesen face-big-smile

Grüße
chrismass
47530
47530 07.09.2010 um 10:24:48 Uhr
Goto Top
Hi Chrismass,
hab mir jetzt auch mal das Buch angeschafft!
THX
lg Takeoo
JackONeil
JackONeil 22.09.2010 um 19:00:53 Uhr
Goto Top
HI Takeoo,

Ich nutzte bei uns in der Firma seit knapp 1,5 Jahren NAgios . Habe letztens ein 2 . System aufgesetzt was 80 Server mit jeweils 15 services monitort. Falls du deine Server an einem Standort oder mehreren hast, und die PLattformen (OS etc) gleich ist, würde ich dir das Addon check_mk empfehlen. EIn agent auf jeden Rechner...einen befehl und du hast alle auto. inventarisiert.
Jedenfalls zu den eskalationsmanagement hier ein sehr hilfreicher Link aus der offiziellen Doku. Ich nutzte es zur zeit.
http://nagios.sourceforge.net/docs/3_0/objecttricks.html#serviceescalat ...

ein paar tips vor weg: wenn du SMS und email nutzt würde ich für jeden User einen extra SMS user anlegen und diese beispiels weise in eine extra"sms contactgroup" packen. Dann kannst mit den servicesscalation prima loslegen.

Ich habe zur Zeit 3 Eskalationen geplant: 1. 24 stunden alle Services von allen Hostgroups an admins , 2. nach der 4. Untätigkeit der admins sollen bis zu 4 weitere nachrichten an eine 2. Gruppe gehen. 3. wenn sich diese auch nicht meldet dann werden max. 2 sms an eine 3. gruppe geschickt. Wenn du willst kann ich dir eine Beispielkonfig schicken.