istike2
Goto Top

Monitoring Tool für komplexer Firmeninsfrastruktur

Hallo,

ich suche aktuell nach einem passenden Monitoring-Tool für eine mittelgroße Infrastruktur:

  • 4 Standorte + Rechenzentrum jeweils Switch + VPN-Router (die Standorte + RZ sind in einem MPLS Netzwerk)
(Im RZ gibt es Switche von Dell, an den Standorten von D-Link, Firewall sind von Fortinet)
  • 300 Mitarbeiter-PC an den vier Standorten
  • Domain Contr. im RZ
  • Unterschiedlichen Kundenserver (IAAS) mit Datenbanken und Backend
  • VMWare Infrastruktur mit ca. 1000 VM, wobei dort nur ein Teil gleichzeitig online ist. Testsysteme werden nur bei Bedarf gestartet.
  • Ansible-Server
  • Build-Pipeline mit OpenStack als "zentrales Herzstück"

Überwacht werden sollte natürlich primär Erreichbarkeit.
bei Netzwerkkomponenten der eigenen Infrastruktur brauchten wir

  • CPU-Auslastung (SNMP)
  • WAN-Auslastung (SNMP)
  • LAN-Auslastung bei Switche (SNMP)
  • RAM (SNMP)
  • Temperatur (SNMP)
  • Speicherplatz bei Servern und PC (via WMI)
  • Bei Kundensysteme kommen noch Datenbanken dazu. Wenn es technisch möglich ist, ihre Performance zu testen, wäre es auch sehr sinnvoll.

Das Monitoring ist aktuell nicht einheitlich gelöst.
Wir würden gerne alle vier Standorte inkl. VM-Infrastruktur einheitlich überwachen.

Offene Fragen:

  • ergibt es Sinn statt des VMWare-eigene Monitoring das gesamte - sich stets ändernde - VM-Landschaft in einem weiteren Tool zu überwachen oder ist es einfach zu aufwändig es stets zu aktualisieren?
  • Würdet ihr die Logs, die von den Komponenten versendet oder abgefragt werden können mit einem spezialisierten SIEM Tool (wie Splunk oder mit einem FOSS-Software Stack), getrennt auswerten oder ergibt es eurer Meinung nach keinen Sinn die Komplexität der Überwachung soweit zu erhöhen.
  • Ist es möglich Datenbank-Performance mit einem Monitoring-Tool zu messen? Mit "Free Database Performance Analyser" ist es zwar möglich, die Frage ist nur, wie weit wir all diese Anforderungen mit einem Tool abdecken können.
  • Ist es möglich das Build-Pipeline mit einem weiteren Tool zu überwachen oder ist es effizienter uns auf die Möglichkeiten von OpenStack zu verlassen?
  • wir setzen mehr und mehr auf Teams (u. A. auch für ausgehende Telefonie). Solarwinds scheint auch Möglichkeiten zu haben Azure-Komponenten zu überwachen. Besteht auch die Möglichkeit irgendwelche Teams Systemmerkmale in die Überwachung einzubauen?

Wir haben im Betrieb noch ein altes Nagios System. Es scheint aber keine praktikable Lösung zu sein, weiter auf Nagios zu setzen und dieses weitere "aufzubohren"
Unsere erste Idee war es all diese Anforderungen mit Solarwinds SAM umzusetzen, was aber bei dieser Anzahl von Sensoren schon ziemlich teuer sein wird.
Hat jemand einen besseren Vorschlag (Im Vergleich zu Solarwinds) ...?

Vielen Dank für eure Rückmeldungen.

Gr. I.

Content-Key: 1503817119

Url: https://administrator.de/contentid/1503817119

Printed on: May 4, 2024 at 21:05 o'clock

Member: NordicMike
NordicMike Nov 14, 2021 updated at 01:57:58 (UTC)
Goto Top
Zabbix kann einen Haufen. Was es nicht kann, kann als Batch oder Shell Befehl ausgeführt werden und ins Zabbix übertragen werden. z.B. habe ich einen Shell befehl 'asterisk -xr "sip show registry" ' ausgeführt und erhalte die Amtsleitungen und ob sie online sind. Das führt Zabbix selbstständig aus und wertet die Antwort aus, ob eine Leitung offline ist. Somit lässt sich eigentlich so gut wie alles monitoren. Natürlich gibt es auch einen Haufen fertige Pakete von Fritzbox bis VMware und kostet nichts.

CPU, RAM, LAN Traffic lasse ich mir auch grafisch anzeigen.
Member: Penny.Cilin
Penny.Cilin Nov 14, 2021 at 07:23:55 (UTC)
Goto Top
Hallo da gibt es unzuzählige Tools.
  • nagios
  • check_mk

Gruss
Penny.
Member: BirdyB
BirdyB Nov 14, 2021 at 08:15:01 (UTC)
Goto Top
Moin,

check_mk wäre eine Option oder PRTG...

VG
Member: nachgefragt
nachgefragt Nov 14, 2021 at 08:20:49 (UTC)
Goto Top
Moin,

nach Nagios,... sind wir noch immer bei PRTG, weil der administrative Aufwand damit minimiert wurde (automatische Suche, Sensoren,...). Ich kenne sonst kein Monitoring welches sich so einfach einrichten lässt, hat natürlich seinen Preis. PRTG von bietet einen 30 Tage Testzeitraum, welchen man auch einzweimal verlängern kann, ich hatte es zuvor 90 Tage getestet und verglichen.

https://www.paessler.com
https://www.youtube.com/c/PRTGNetworkMonitorByPAESSLER/playlists
Member: em-pie
em-pie Nov 14, 2021 at 08:22:59 (UTC)
Goto Top
Moin,

Da ihr ja schon Nagios einsetzt:
Ich würde das weiter ausbauen.

Nagios lässt sich auch in Hierarchien aufteilen: man könnte quasi vier einzelne Instanzen etablieren (je Standort einen) und einen Madter, der dann alle Daten zusammenfasst und darstellt:
https://assets.nagios.com/downloads/nagiosxi/docs/Integrating_MNTOS_With ...

Lohnt IMHO aber erst ab größeren Installationen oder wenn man mehrere Kunden betreut, dort ein Monitoring etabliert und das eigene Supportteam nur eine Instanz kontrollieren soll/ muss…

Geht aber auch mit anderen Tools…


Ansonsten sind die anderen Tools (Zabbix, Icinga, check_mk, PRTG,…) ja schon gefallen…

Gruß
em-pie
Member: istike2
istike2 Nov 14, 2021 updated at 08:50:23 (UTC)
Goto Top
Ok. Vielen Dank!

eurer Meinung nach entsprechen dann all diese Tools unseren technischen Anforderungen ...
In diesem Fall werden wir noch die Kosten für diese Größenordnung vergleichen.

@em-pie wie weit Nagios noch zeitgemäß erweitert werden kann werden wir noch prüfen:

Laut CheckMK diese sind die Gründe, warum Nagios ersetzt werden sollte:
https://checkmk.com/guides/nagios-alternative

Gr. I.
Member: Dani
Dani Nov 14, 2021 at 08:57:36 (UTC)
Goto Top
Moin,
Überwacht werden sollte natürlich primär Erreichbarkeit.
geht es primär um einen Ping oder auch Prüfung der Server und deren Applikationen?

bei Netzwerkkomponenten der eigenen Infrastruktur brauchten wir
Hier hängt es von dem Herstellern der Netzwerk-Komponenten ab.

Bei Kundensysteme kommen noch Datenbanken dazu.
Um welche Datenbank-Systeme geht es denn?

Würdet ihr die Logs, die von den Komponenten versendet oder abgefragt werden können mit einem spezialisierten SIEM Tool (wie Splunk oder mit einem FOSS-Software Stack), getrennt auswerten oder ergibt es eurer Meinung nach keinen Sinn die Komplexität der Überwachung soweit zu erhöhen.
Das hängt von eurer Situation ab. Wenn Ihr irgendwann eine ISO Zertifizierung anstrebt, wird an einem SIEM Tool kein Weg vorbei führen. Ein SIEM Tool hat ganz andere Anforderungen und damit ein Monitoring gleich zusetzen, ist wie mit Äpfel und Birnen.

Ist es möglich Datenbank-Performance mit einem Monitoring-Tool zu messen?
Auch hier hängt es meiner Meinung nach von dem eingesetzten Datenbank-Server ab. Man kann grundsätzlich alles via Skript abfragen. Aber wenn die Daten nicht aus der Software kommt, wird's schwierig. Unabhängig davon um welche Performance geht es dir, eine einfache SQL Query?


Gruß,
Dani
Mitglied: 148848
148848 Nov 14, 2021 updated at 09:56:06 (UTC)
Goto Top
sind wir noch immer bei PRTG, weil der administrative Aufwand damit minimiert wurde (automatische Suche, Sensoren,...)

Auto Discovery funktioniert auch mit Nagios. Bei Verwendung von Icinga kann man auch den Icinga Agent verwenden. Das ist dann sogar noch komfortabler als unter PRTG. Ansonsten bleibt der administrative Aufwand gleich, da man die Feinkonfiguration ohnehin per Hand machen muss. Daher empfehle ich die Verwendung von Templates. (Egal ob PRTG, Nagios oder ein anderes Monitoring Tool).

Laut CheckMK diese sind die Gründe, warum Nagios ersetzt werden sollte:

Wenn es ein unabhängiger Blog wäre, der die Vor- und Nachteile von Nagios erläutern würde, wäre der Artikel sehr interessant. Aber in diesem Fall handelt es sich um die Konkurrenz. Klar werden die nur die schlechten Seiten von Nagios erläutern und deren Produkt voll in den Himmel loben.
Member: tech-flare
tech-flare Nov 14, 2021 at 16:03:29 (UTC)
Goto Top
Hallo,

Wir nutzen PRTG in der 5000er Lizenz und Zabbix. Wobei wir immer mehr auf Zabbix umsteigen, da mir die Template Funktion von Zabbix mehr Möglichkeiten gibt, als die von PRTG.

Zabbix finde ich persönlich auch von der Performance besser als PRTG, schon allein deswegen, weil bei Zabbix eine Datenbank dahinter steht
Member: ITghost
ITghost Nov 15, 2021 at 07:59:09 (UTC)
Goto Top
Zitat von @tech-flare:

Hallo,

Wir nutzen PRTG in der 5000er Lizenz und Zabbix. Wobei wir immer mehr auf Zabbix umsteigen, da mir die Template Funktion von Zabbix mehr Möglichkeiten gibt, als die von PRTG.

Zabbix finde ich persönlich auch von der Performance besser als PRTG, schon allein deswegen, weil bei Zabbix eine Datenbank dahinter steht

Hey,
Zabbix super Monitoring, ehrlich.
Wenn man das gut eingerichtet hat und sich ein bisschen damit befasst - mega.
Hab das ganze Zabbix umgebaut, weil mein Vorgänger das so besch***en eingerichtet hat, dass das der üble Dreck war. - Also wichtig ! Gute und Verständliche Konfiguration bei dem Ding & ich bin mega zufrieden :D
Member: wecanIT
wecanIT Nov 15, 2021 updated at 13:51:55 (UTC)
Goto Top
Hallo,

Zitat von @nachgefragt:

nach Nagios,... sind wir noch immer bei PRTG, weil der administrative Aufwand damit minimiert wurde (automatische Suche, Sensoren,...). Ich kenne sonst kein Monitoring welches sich so einfach einrichten lässt, hat natürlich seinen Preis. PRTG von bietet einen 30 Tage Testzeitraum, welchen man auch einzweimal verlängern kann, ich hatte es zuvor 90 Tage getestet und verglichen.

https://www.paessler.com
https://www.youtube.com/c/PRTGNetworkMonitorByPAESSLER/playlists

dem kann ich mich nur anschließen.

Zabbix kenne ich nicht.

Testen, testen, testen ! face-wink

Grüße

Ralf
Member: istike2
istike2 Nov 16, 2021 at 09:55:17 (UTC)
Goto Top
Hallo Zusammen,

herzlichen Dank für Eure Rückmeldungen. Ich werde also CheckMK, Zabbix und PRTG miteinander vergleichen.

LG

I.