47530
10.08.2010
7492
6
0
Nagios Eskalationsmanagement
Nagios Eskalationsmanagement bei Netzproblemen
Hallo zusammen,
ich bräuchte mal eure Hilfe. Ich finde im Nagios Handbuch bzw bei Google nicht zu diesem Thema, evtl. suche ich auch nach den falschen Begriffen (sagt dann bitte kurz bescheid)!
Mein Problem:
Wir haben im Moment hier ziemlich viele Netzprobleme (das Netzwerk wir nicht von uns selbst verwaltet, sondern nur die Server). Nagios registriert das natürlich und schick eine e-Mail das der betreffende Server nicht mehr erreichbar ist. Das wäre nicht das Problem, allerding hängen an diesen Netzwerkkomponenten >30 Server die alle über das Nagios überwacht werden. Dadurch bekomme ich (und andere Kollegen der gleichen Eskalationsstufe) 40-60 e-Mails das unsere Server ausgefallen sind (Der Ausfall dauert meist 1-5 Minuten, kommt unregelmässig und wird wohl nicht so schnell behoben werden. Die komplette Konfiguration so um zu stellen das er erst ab 5 Minuten warnt ist keine Option).
Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)
Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?
THX
MFG
Takeoo
Hallo zusammen,
ich bräuchte mal eure Hilfe. Ich finde im Nagios Handbuch bzw bei Google nicht zu diesem Thema, evtl. suche ich auch nach den falschen Begriffen (sagt dann bitte kurz bescheid)!
Mein Problem:
Wir haben im Moment hier ziemlich viele Netzprobleme (das Netzwerk wir nicht von uns selbst verwaltet, sondern nur die Server). Nagios registriert das natürlich und schick eine e-Mail das der betreffende Server nicht mehr erreichbar ist. Das wäre nicht das Problem, allerding hängen an diesen Netzwerkkomponenten >30 Server die alle über das Nagios überwacht werden. Dadurch bekomme ich (und andere Kollegen der gleichen Eskalationsstufe) 40-60 e-Mails das unsere Server ausgefallen sind (Der Ausfall dauert meist 1-5 Minuten, kommt unregelmässig und wird wohl nicht so schnell behoben werden. Die komplette Konfiguration so um zu stellen das er erst ab 5 Minuten warnt ist keine Option).
Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)
Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?
THX
MFG
Takeoo
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 148705
Url: https://administrator.de/forum/nagios-eskalationsmanagement-148705.html
Ausgedruckt am: 22.12.2024 um 13:12 Uhr
6 Kommentare
Neuester Kommentar
Hallo Takeoo,
soweit ich weis ist das mit Nagios Boardmitteln nicht möglich.
Die Onlinedoku gibt hierzu folgenden Tip: http://nagios.sourceforge.net/docs/2_0/escalations.html (ganz unten)
Gruß
Cadel
soweit ich weis ist das mit Nagios Boardmitteln nicht möglich.
Die Onlinedoku gibt hierzu folgenden Tip: http://nagios.sourceforge.net/docs/2_0/escalations.html (ganz unten)
Gruß
Cadel
Zitat von @47530:
Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer
Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur
eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)
Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?
THX
MFG
Takeoo
Mein Gedanke war einfach zu sagen:
Wenn Server A, B, C ausfallen oder >10 Server (unterschiedliche Gebäude) muss es entweder ein größerer
Stromausfall (hatten wir in letzer Zeit leider auch öffter) oder ein Netzproblem sein. Dann soll Nagios garkeine bzw. nur
eine e-Mail verschicken und nicht für jeden Server einzeln.
Nur leider finde ich dafür keinen Befehl (evtl. such ich ja auch falsch)
Hat jemand einen kleinen Hinweis für mich wie ich das Problem umgehen könnte?
THX
MFG
Takeoo
Hallo!
Ich bin ganz neu im Thema Monitoring und lese mich gerade erst ein. Im Buch "Nagios - System und Netzwerkmonitoring" von Wolfgang Barth wird aber bereits in den ersten Kapiteln genau dieser Anwendungsfall beschrieben. Er schreibt davon, dass man Abhängigkeiten und die Netztopologie berücksichtigen soll.
Also in deinem Fall:
Du hast eine Anzahl x an Services die auf den Servern überwacht werden. Die Server hängen jedoch alle hinter einem oder mehreren Netzkomponenten wie Router und / oder Switches. Wenn du nun diese Netzkomponenten überwachst, kann man eine Abhängigkeit bilden. Also wenn Netzkomponente A ausfällt, soll Nagios keine Fehler mehr bezüglich der dahinterliegenden Services melden (weidl die ja dann eh nicht geprüft werden können).
Also so viel mal zur Theorie Hoffe das hilft dir etwas weiter.
Wie es in der Praxis funktioniert? ... So weit bin ich noch nicht mit lesen
Grüße
chrismass
HI Takeoo,
Ich nutzte bei uns in der Firma seit knapp 1,5 Jahren NAgios . Habe letztens ein 2 . System aufgesetzt was 80 Server mit jeweils 15 services monitort. Falls du deine Server an einem Standort oder mehreren hast, und die PLattformen (OS etc) gleich ist, würde ich dir das Addon check_mk empfehlen. EIn agent auf jeden Rechner...einen befehl und du hast alle auto. inventarisiert.
Jedenfalls zu den eskalationsmanagement hier ein sehr hilfreicher Link aus der offiziellen Doku. Ich nutzte es zur zeit.
http://nagios.sourceforge.net/docs/3_0/objecttricks.html#serviceescalat ...
ein paar tips vor weg: wenn du SMS und email nutzt würde ich für jeden User einen extra SMS user anlegen und diese beispiels weise in eine extra"sms contactgroup" packen. Dann kannst mit den servicesscalation prima loslegen.
Ich habe zur Zeit 3 Eskalationen geplant: 1. 24 stunden alle Services von allen Hostgroups an admins , 2. nach der 4. Untätigkeit der admins sollen bis zu 4 weitere nachrichten an eine 2. Gruppe gehen. 3. wenn sich diese auch nicht meldet dann werden max. 2 sms an eine 3. gruppe geschickt. Wenn du willst kann ich dir eine Beispielkonfig schicken.
Ich nutzte bei uns in der Firma seit knapp 1,5 Jahren NAgios . Habe letztens ein 2 . System aufgesetzt was 80 Server mit jeweils 15 services monitort. Falls du deine Server an einem Standort oder mehreren hast, und die PLattformen (OS etc) gleich ist, würde ich dir das Addon check_mk empfehlen. EIn agent auf jeden Rechner...einen befehl und du hast alle auto. inventarisiert.
Jedenfalls zu den eskalationsmanagement hier ein sehr hilfreicher Link aus der offiziellen Doku. Ich nutzte es zur zeit.
http://nagios.sourceforge.net/docs/3_0/objecttricks.html#serviceescalat ...
ein paar tips vor weg: wenn du SMS und email nutzt würde ich für jeden User einen extra SMS user anlegen und diese beispiels weise in eine extra"sms contactgroup" packen. Dann kannst mit den servicesscalation prima loslegen.
Ich habe zur Zeit 3 Eskalationen geplant: 1. 24 stunden alle Services von allen Hostgroups an admins , 2. nach der 4. Untätigkeit der admins sollen bis zu 4 weitere nachrichten an eine 2. Gruppe gehen. 3. wenn sich diese auch nicht meldet dann werden max. 2 sms an eine 3. gruppe geschickt. Wenn du willst kann ich dir eine Beispielkonfig schicken.