fortimi
Goto Top

Monitoring Tool für 200 virtuelle Server

Hallo zusammen

Ich bin auf der Suche nach einem Monitoring Tool für unsere Informatik mit ca. 200 virtuellen Servern.
Die meisten davon sind Windows Server. Ob sie mittels Agent oder SNMP überwacht werden spielt keine Rolle.
Momentan verwenden wir noch vRealize Hyperic von VMware.

Ich habe mir schon Zabbix, Icinga, Naggios, PRTG, Site24x7 und Prometheus angeschaut.
Leider hat keines davon alle Anforderungen richtig erfüllt.

Folgend liste ich euch die wichtigsten Anforderungen auf:
- Echtzeit Daten
- Monitoring History
- Dashboard
- Alarmierung und Quittierung von Alerts über App
- Alarmierung via SMS und E-Mail
- LDAP Integration
- Threshold
- SLAs (ob ein Alert 24x7 oder nur 9x5 aktiv ist)

Hier noch ein paar Nice-to-haves
- SSO
- ESXi Überwachung
- Auto-detect
- Alerts manuell schliessen
- Als Appliance zu haben

Ich hoffe Ihr könnt mir ein bisschen weiterhelfen.
Danke euch schon im Voraus für eure Bemühungen.

Gruss
Fortimi

Content-Key: 476440

Url: https://administrator.de/contentid/476440

Printed on: April 26, 2024 at 22:04 o'clock

Member: falscher-sperrstatus
Solution falscher-sperrstatus Jul 23, 2019 updated at 07:32:11 (UTC)
Goto Top
Hallo Fortimi,

Rein praktisch, generell: kein Monitoringtool kann Out of the Box und ohne aufwändige Konfiguration auch nur in die Reichweite eines praktikabel einsetzbaren Systems kommen und einfach so aufsetzen bringt einen da leider auch nicht weiter. Im Grunde ist das ein für sich stehendes, größeres, Projekt, wenn man es wirklich sinnvoll haben möchte.

Viele Grüße,

Christian
certifiedit.net
Member: Penny.Cilin
Penny.Cilin Jul 23, 2019 at 07:28:27 (UTC)
Goto Top
Hallo und moin,

Du hast Dir schon ein paar Produkte angeschaut.

Fakt ist:
Ohne umfangreiche Anpassungen an Deine / Eure Anforderungen wird das definitiv nichts werden. Ein Monitoring Tool ist nicht zu vergleichen mit einer simplen Officeinstallation.
D.h. wie @certifiedit.net schon geschrieben hat, das ist ein größeres Projekt.

Und hier noch ein paar weitere Produkte, bzgl. Monitoring:

Nagios in Verbindung mit openITCockpit und check_mk habe ich schon mehrfach bei Kunden empfohlen und eingeführt.

Und nein ich arbeite NICHT für Nagios, openITCockpit bzw. check_mk.

Größenordnung der Umgebungen: 100 bis 5000 Systeme (Server, Switches, Router, SAN, VMs, Bare Metal, Mainframes, auch Clients (soferrn kritisch) usw.)

Gruss Penny.
Member: Dani
Dani Jul 23, 2019 at 08:28:20 (UTC)
Goto Top
Moin,
Ich habe mir schon Zabbix, Icinga, Nagios, PRTG, Site24x7 und Prometheus angeschaut.
Welches der genannten Applikationen erfüllt jeweils die verschiedenen Anforderungen nicht?!

Ob sie mittels Agent oder SNMP überwacht werden spielt keine Rolle.
Clientless ist dahingehend "hübsch", da die Pflege eines Agents entfällt. Gerade bei 200 Servern eine nicht unerheblicher Aufwand (Installation, Konfiguration/Wartung/Troubleshooting).


Gruß,
Dani
Member: nook24
nook24 Jul 23, 2019 updated at 10:12:07 (UTC)
Goto Top
Vorab, ich arbeite als Entwickler für openITCOCKPIT und betreue Statusengine.

Grundsätzlich sollte was du vorhast mit allen Tools funktionieren die du dir angeschaut hast.

Eine Alarmierung über SMS wird in der Regel entweder über ein GSM-Modem, oder über einen Webservices im Internet gemacht.
Ich würde immer ein GSM-Modem nutzen, damit Alarmierungen auch verschickt werden können wenn das Internet ausgefallen ist. Ansonsten kann man meiner Meinung nach einfach einen Push-Services nutzen wenn man nur Smartphones hat.

Bei den Punkten History und Dashboards gibt es denke die größten Unterschiede bei den Tools. Hier setzen manche auf Datenbanken andere auf Logfiles.

Schau dir am besten vorab verschiedene Tools und probiere sie in einem kurzen Test aus.
Ein weiterer Punkt auf den ich achten würde ist, ob Updates in Zukunft einfach eingespielt werden können.
Member: visiooo
Solution visiooo Jul 23, 2019 updated at 13:15:15 (UTC)
Goto Top
Hi,

ich würde mal behaupten dass PRTG deine Anforderungen durchaus erfüllen kann wenn man es sich entsprechend zusammenbaut (ist aber auch ootb schon ziemlich mächtig). ESXi Überwachung ist zb. mit vorgefertigten Sensoren schon ohne große anpassung möglich. SMS halt Gateway oder Onlinedienste und die PRTG App funktioniert seit dem letzten Update (nutze Android) auch einwandfrei (Push-Nachrichten etc.).

LG
Member: Fortimi
Fortimi Jul 23, 2019 at 14:02:24 (UTC)
Goto Top
Hallo Christian

Ich denke da hasst du recht, dass ich nicht um eine aufwändige Konfiguration drum herum komme.
Die weiteren Schritte werde ich mal mit meinem Chef zusammen anschauen. Er wird auch der Meinung sein, dass dies ein Projekt geben wird.

Danke dir für dein Feedback

Gruss
Fortimi
Member: Fortimi
Fortimi Jul 23, 2019 at 14:09:52 (UTC)
Goto Top
Hallo Penny

Danke für die drei Produkte. Ich werde sie mir mal anschauen und eventuell könnte etwas für mich dabei sein.
Wie schon erwähnt denke ich auch dass dies in einem grösseren Projekt enden wird.

Gruss
Fortimi
Member: Fortimi
Fortimi Jul 23, 2019 at 14:24:51 (UTC)
Goto Top
Hallo Dani


Die aufgelisteten Tools erfüllen ein Grossteil der Anforderungen.
Bei allen fehlt mir aber, dass ich SLAs für Triggers oder Alerts bestimmen kann. Drei haben ein App. Auch wenn es nicht das wichtigste Kriterium ist, währe es doch gut für uns da wir Unterwegs dann ganz einfach die Alerts quittieren können.

Wenn das Tool SNMP fähig ist, wäre dies ein riesen Vorteil, da wie du schon gesagt hast die Wartung der einzelnen Agents entfällt

Gruss
Fortimi
Member: Fortimi
Fortimi Jul 23, 2019 at 14:29:52 (UTC)
Goto Top
Hallo nook24

Das werde ich au noch machen. Ich werde sicher auch openITCOCKPIT mal anschauen.
Der Punkt bezüglich Updates ist meiner Meinung sehr wichtig aber auch das eine grosse Community dahinter steht oder ein zuverlässiger Support.

Bei Hyperic wie wir es momentan verwenden, kommt ein GSM-Modem zum Einsatz und sollte daher kein Problem darstellen.

Gruss
Fortimi
Member: Dani
Dani Jul 23, 2019 updated at 15:36:06 (UTC)
Goto Top
Moin,
Bei allen fehlt mir aber, dass ich SLAs für Triggers oder Alerts bestimmen kann.
Ich weiß, dass man SLA Reports/Alerts bei Icinga und PRTG (hier durch ein Modul) konfigurieren kann.

Drei haben ein App. Auch wenn es nicht das wichtigste Kriterium ist, währe es doch gut für uns da wir Unterwegs dann ganz einfach die Alerts quittieren können.
Bei Icinga wird es mit der App schwer. Da gibt es meines Wissens nach "nur" die mobile Ansicht des Web-Moduls. Ist aber durchaus nutzbar. Bei PRTG gibt es für Android und iOS entsprechende Apps. Hier kann man ebenfalls Meldungen quittieren. Wobei ich in dem Raum stelle, ob das von unterwegs aus Sinn macht. Du kannst die zu dem Zeitpunkt keinen Überblick verschaffen und somit auch nicht qualifiziert sagen ob der Sachverhalt "so" ist.

Bei Hyperic wie wir es momentan verwenden, kommt ein GSM-Modem zum Einsatz und sollte daher kein Problem darstellen.
Versucht am Besten ein SMS-Gateway zu bekommen. Denn dies bietet in der Regel mehere Schnittstellen an, so dass zukünftig nicht nur das Monitoring dieses nutzen kann, sondern auch andere Applikationen.


Gruß,
Dani
Member: Fortimi
Fortimi Jul 23, 2019 at 14:33:48 (UTC)
Goto Top
Hi visiooo

Wie sieht es bezüglich Quittierung mit der App aus? Ist das sofern möglich oder sieht man nur die Alerts?
Kann man mit PRTG auch SLA bestimmen? Dass zum beispiel ein spezifischer Trigger eines Servers nur 9x5 überwacht wird aber trotzdem Daten für die History sendet?

Danke dir für Empfehlung.

Gruss
Fortimi
Member: Fortimi
Fortimi Jul 23, 2019 at 14:41:51 (UTC)
Goto Top
Moin Dani

Danke für das schnelle Feedback.
Ich denke, dass ich mal mit Icinga und PRTG anfangen werde. Da die SLAs für uns wichtig sind, höre ich das gerne, dass diese zwei das unterstützen.

Am Wochenende ist es sicher noch praktisch für denjenigen, der Picket hat mit der App die Alerts zu quittieren. Dann muss er dafür nicht immer das Notebook mitnehmen.

So wie ich mitbekommen habe, ist SMS-Gateway der nächste Schritt bei uns.

Gruss
Fortimi
Member: Dani
Dani Jul 23, 2019 at 15:40:25 (UTC)
Goto Top
Moin,
Ich denke, dass ich mal mit Icinga und PRTG anfangen werde. Da die SLAs für uns wichtig sind, höre ich das gerne, dass diese zwei das unterstützen.
folgende Links sollte eine Suchmaschine dir anzeigen:
https://icinga.com/2019/04/17/releasing-icinga-reporting-for-early-adopt ...
https://www.de.paessler.com/partners/uptimealliance/corp-it

Am Wochenende ist es sicher noch praktisch für denjenigen, der Picket hat mit der App die Alerts zu quittieren. Dann muss er dafür nicht immer das Notebook mitnehmen.
Quittieren ist das Eine - richtig. Aber das sollte im gleichen Zug auch bedeuten, dass sich jemand aktiv um das Problem kümmert. Das ist beim Picknick? ohne ein Tablet oder Notebook schon schwierig. Das ist aus meiner Sicht eine organisatorische Thematik (=Prozess) . Um zurück auf deine Frage zu kommen: Ich weiß es nicht. Ich hab die App zwar auf dem Smartphone, aber nutze diese maximal 1-2x Mal im Jahr.


Gruß,
Dani
Member: manuel-r
Solution manuel-r Jul 23, 2019 at 19:57:30 (UTC)
Goto Top
Folgend liste ich euch die wichtigsten Anforderungen auf:
- Echtzeit Daten
- Monitoring History
- Dashboard
- Alarmierung und Quittierung von Alerts über App
- Alarmierung via SMS und E-Mail
- LDAP Integration
- Threshold
- SLAs (ob ein Alert 24x7 oder nur 9x5 aktiv ist)

Wir nutzen PRTG und ich sehe in deiner Liste nichts was die Software nicht erfüllen würde. Wobei ich aber nicht ganz einordnen kann, was du mit Threshold meinst.

Manuel
Member: Dani
Dani Jul 23, 2019 at 20:31:31 (UTC)
Goto Top
@manuel-r
Gehen SLA (Reports) inzwischen out of the Box bei Paessler PRTG?


Gruß,
Dani
Member: manuel-r
manuel-r Jul 23, 2019 at 20:37:13 (UTC)
Goto Top
Wenn damit gemeint ist, in welchem Zeitraum ein Sensor überwacht und wie schnell ggf alarmiert werden soll, dann ja.
Oder meint SLA in dem Zusammenhang eine Eskalation wenn ein Fehler nach Zeit X immer noch ansteht? Das müsste ich nachsehen.

Manuel
Member: Dani
Dani Jul 23, 2019 at 21:50:16 (UTC)
Goto Top
Moin,
ich denke sowohl als auch... face-smile


Gruß,
Dani
Member: Fortimi
Fortimi Jul 24, 2019 at 06:00:38 (UTC)
Goto Top
Moin

Danke dir für die Links. face-smile

Ich meinte Pikettdienst. Picknick wäre auch schön. ;)
Der hat bei uns immer ein Handy dabei. Das gleiche Handy wird von unserem Supporter unter der Woche verwendet. Dieser ist dann auch als Operator für die Alerts zuständig.
Vom Prozess her sollte es bei uns daher so gut aufgehen.

Danke dir für deine Hilfe Dani.

Gruss
Fortimi
Member: Fortimi
Fortimi Jul 24, 2019 at 06:08:21 (UTC)
Goto Top
Hallo Manuel

Mit Threshold meine ich aus dem Englischen übersetzt "Schwellenwert".
Z.B. soll eine Warnung raus gegeben werden, wenn eine Disk z.B. zu 70% voll ist und dann wenn sie zu 90% voll ist muss eine Eskalation davon folgen.

Aber so wie ich in den Spezifikationen von PRTG gelesen habe, sollte die Software dies erfüllen.

Gruss
Fortimi
Member: visiooo
visiooo Jul 24, 2019 at 06:13:25 (UTC)
Goto Top
Ja PRTG kann das.
Member: manuel-r
manuel-r Jul 24, 2019 at 06:40:26 (UTC)
Goto Top
Funktioniert (Link).

unbenannt
Member: manuel-r
manuel-r Jul 24, 2019 at 06:41:31 (UTC)
Goto Top
Schwellenwerte sind kein Problem. Du kannst je Sensor beliebig einstellen ab wann eine Warnung ausgelöst wird und wann Alarm. Beides sowohl mit relativen als auch absoluten Werten.