Alarm bei Ausfall Cloud Service

useruw
Goto Top
Hallo, wir bieten einen Cloud-Service (Web-Service) an. dessen Verfügbarkeit wir auch überwachen. Bei Störungen erhalten Verantwortliche Hinweise per E-Mail. Inzwischen wird der Service für kritischere Anwendungen eingesetzt, so dass eine E-Mail, die am Montag nach einem Wochenende gelesen wird, nicht mehr reicht. Wir suchen eine Lösung, die den Verantwortlichen ggf. auch nachts aus dem Bett holt!

Uns würde ein Service reichen, an den man eine E-Mail (besser) oder SMS (schlechter, da aufwendiger) sendet, und der dann einen nachhaltigen Alarm erzeugt. Am besten ein Mensch, der eine Telefonliste abarbeitet, aber ggf. auch eine automatische Lösung (Anruf an Handy mit Wiederholung, bis Anruf bestätigt). Außer Testalarmen rechnen wir allerdings kaum mit echten Alarmen ;- )

Ein Problem, das doch sicher viele haben. Wir suchen eine preiswerte, aber zuverlässige Lösung. Hat jemand einen Tipp?

Content-Key: 3500165519

Url: https://administrator.de/contentid/3500165519

Ausgedruckt am: 19.08.2022 um 00:08 Uhr

Mitglied: NordicMike
NordicMike 31.07.2022 aktualisiert um 04:14:15 Uhr
Goto Top
Schreib dir ein Batch als Cronjob. Lass diesen alle 5 Minuten ausführen, bis der Empfänger den Link in der Email anklickt. Der Link startet ein php Programm, das eine Datei oder Datenbankvariable ändert, dann gibt der Cronjob Ruhe. Der Cronjob muss einfach nur vor jeder Email prüfen ob die Variable geändert wurde.

Oder

Ein Monitoring Programm z.B. Zabbix. Dieser kann pro Fehler mehrere Eskalationsstufen auslösen, bis der Admin dann ins Programm rein geht (Web basiert einloggt) und den Fehler auf „in Bearbeitung“ stellt.
Mitglied: maretz
maretz 31.07.2022 um 06:57:35 Uhr
Goto Top
Ich würde direkt zu Zabbix o. ähnlicher Monitoring-Software gehen. Dabei würde ich aber euer SYSTEM selbst überlegen. Jemand bekommt ne Mail und soll ne Telefonliste abarbeiten? Na super... Lass mich kurz überlegen - wenn ich also oben auf dieser Telefon-Liste bin - was meinst du wie lange ich brauche bis die Nummer blockiert wird? Max. 2 Wochen wenn man immer der erste ist der für jeden Sch... angerufen wird.

Von daher: Der TECHNISCHE Teil ist einfach... der organisatorische sollte noch mal überlegt werden...
Mitglied: buddafisch
buddafisch 31.07.2022 aktualisiert um 07:55:07 Uhr
Goto Top
Wir suchen eine Lösung, die den Verantwortlichen ggf. auch nachts aus dem Bett holt!
Ich würde mal über ein mehrfach redundantes System nachdenken... Bei kritischen System sollte das eigentlich Pflichtprogramm sein.
Dann können die Verantwortlichen nach dem Croissant und dem Kaffee das abgesemmelte System wieder zum Leben erwecken während die anderen inzwischen fröhlich weiterarbeiten. Nix mit aus dem Bett holen, das ist sowas von Achtziger 😁🤙 Wozu haben wir die ganze Automatisierung wenn man sie nicht auch dafür nutzt...
Mitglied: manuel-r
manuel-r 31.07.2022 aktualisiert um 10:37:16 Uhr
Goto Top
Wir suchen eine Lösung, die den Verantwortlichen ggf. auch nachts aus dem Bett holt!

Den Dienst mit PRTG o.ä. überwachen und gleichzeitig auf dem Handy die zugehörige App die dann bei Fehler entsprechend informiert.
Zumindest bei PRTG kann ich dir sagen, dass das sehr gut funktioniert und in Kombination mit einem entsprechenden Alarmton auch Tote aufweckt.

Alternativ mal verschiedene Wachdienste anfragen ob die eine Statusseite oder eMails überwachen können/wollen und bei Alarm eure Bereitschaft anrufen. Das machen wir im Bereich EMA, BMA und Video.

Manuel
Mitglied: TwistedAir
TwistedAir 31.07.2022 aktualisiert um 11:13:18 Uhr
Goto Top
Hallo UserUW,

wenn eure Überwachung eh schon E-Mails erzeugt, könnte es eine weitere an einen E-Mail-To-SMS-Dienst generieren. Dann erfolgt zugleich eine Alarmierung via SMS. Ob das ganze dann auf ein dedizierte Bereitschaftshandy aufläuft oder an alle Bereitschaftsleute geht (die dann nach Bedarf das Handy laut/leise stellen), ist dann organisatorischer Natur.

Oder möchtest du absichern, dass zudem eine Unterbrechung der Internet-Verbindung angezeigt wird? Dann kann zumindest von intern keine E-Mail versendet werden.
  • Überwachung von extern und Benachrichtigung wie oben oder
  • Überwachung von intern und Benachrichtigung mit einem eigenen SMS-Modul

Gruß
TA
Mitglied: kaiand1
kaiand1 31.07.2022 um 13:01:54 Uhr
Goto Top
Zitat von @UserUW:

Hallo, wir bieten einen Cloud-Service (Web-Service) an. dessen Verfügbarkeit wir auch überwachen. Bei Störungen erhalten Verantwortliche Hinweise per E-Mail. Inzwischen wird der Service für kritischere Anwendungen eingesetzt, so dass eine E-Mail, die am Montag nach einem Wochenende gelesen wird, nicht mehr reicht. Wir suchen eine Lösung, die den Verantwortlichen ggf. auch nachts aus dem Bett holt!

Hi
Nun da bekommt jeder ein neues Bett
Extreme Bed Shaker Youtube
Das dann zb mit einen Pi angeschlossen ist und sobald die Alarmmeldung eingeht den Mitarbeiter Wach macht ;)
Mitglied: buddafisch
buddafisch 31.07.2022 aktualisiert um 13:08:52 Uhr
Goto Top
Zitat von @kaiand1:
Nun da bekommt jeder ein neues Bett
Extreme Bed Shaker Youtube
Oder gleich 😁
Mitglied: LordGurke
LordGurke 31.07.2022 um 20:16:50 Uhr
Goto Top
Was heißt denn "kritisch" bei euch?
Im Zweifel schaut euch einen externen Dienstleister wie UptimeRobot an, die können auch über verschiedene Kontaktwege benachrichtigen.
Mitglied: C.R.S.
C.R.S. 31.07.2022 um 20:27:02 Uhr
Goto Top
Hi,

Uptrends, New Relic oder CloudWatch (gibt sicher noch andere vergleichbare), wobei letzteres hinsichtlich der Benachrichtigung durch ASNS am flexibelsten ist. Ein Basteln mit der lokalen Monitoring-Lösung hat bei öffentlichen, ggf. weltweit genutzten Angeboten wenig Sinn.

Grüße
Richard
Mitglied: EliteHacker
EliteHacker 31.07.2022 aktualisiert um 23:23:06 Uhr
Goto Top
Hallo.

Endlich mal sinnvolle Fragen.

Die Person, welche im Notfall geweckt werden sollte, installiert sich eine App auf ihr Smartphone. Die App versucht alle 60 Sekunden auf den Server zuzugreifen. Um Fehlalarme zu vermeiden, wird nach einem Fehlgeschlagenen Verbindungsaufbau direkt eine Sekunde später nochmals getestet. Zwei aufeinanderfolgende fehlgeschlagene Verbindungsversuche lösen einen Alarm aus.

Für eine kompliziertere Lösung würde ich einen Monitoring-Server hochziehen, welcher mir nachts um 2:30 Uhr eine Push-Benachrichtigung auf mein Smartphone sendet und Alarm schlägt. Somit kann auch der Prüfintervall auf eine Sekunde verkürzt werden, ohne das mein Smartphone-Akku darunter leiden muss.

Blöd nur, wenn gerade dein eigenes Netzwerk abschmiert und es somit einen Fehlalarm auslöst. Deswegen am besten aus mehreren verschiedenen AS prüfen und abgleichen. Wenn ein AS abschmiert, dann Warnung anzeigen, bei zwei oder mehr: Alarm!

Dann den Kunden eine automatisierte E-Mail zukommen lassen: "Es wird mit Hochdruck an der Problembehebung gearbeitet!"

Dafür muss ich ja nicht geweckt werden. Die Kunden müssen einfach den Eindruck haben, da wäre jemand wach und arbeitet mit Hochdruck an der Problemlösung.

Also wenn ich nachts um 2:30 Uhr aus dem Schlaf gerissen werde, um ein Problem zu beheben, dann würde ich tatsächlich mit Hochdruck arbeiten. Mit Bluthochdruck.

Gruss.
Mitglied: StefanKittel
StefanKittel 01.08.2022 um 00:24:23 Uhr
Goto Top
Hallo,

Entweder Mail2SMS oder ein 24h Callcenter.
Das Callcenter hat eine Liste und ruft solange Personen darauf an bis Jemand rangeht.

Stefan
Mitglied: UserUW
UserUW 01.08.2022 um 01:31:46 Uhr
Goto Top
Vielen Dank für die zahlreichen Vorschläge. Dazu zusammenfassend einige Anmerkungen:
1. SMS ist einfach und da wissen wir auch, wie es ginge. Nur liest die nachts niemand.
2. Ejector Beds: An sich überzeugend. Es scheitert aber daran, dass wir dafür erst die Treiber schreiben müssten ;- )
3. Monitor-Programme: Das Monitoring ist gelöst. Es geht uns nur darum, mit den E-Mails, die es bereits gibt, Alarme zu generieren, die einen ggf. auch nachts wecken.
4. Redundanz: Die Lösung ist bereits redundant. In den gut zehn Jahren seit Bestehen hatten wir auch keinen Ausfall. Es wird also niemand übermäßig belästigt!
Dass wir jetzt einen Alarm installieren wollen, liegt an einem neuen Kunden, der das erwartet. Deswegen suchen wir eine einfache und preiswerte Lösung, die aber im Zweifelsfall zuverlässig alarmiert, auch nachts.
Wir hofften auf einen Service, an den man eine Mail mit einer Telefonnummer sendet, die dann und mit irgend einem Text angerufen wird. (Für SMS gibt es solche Services ja.) (Oder wie auch vorgeschlagen, eine App, die einen Status abfragt und dann alarmiert. Allerdings wollen wir keine eigene App schreiben.)
Soweit ich sehe, ist der Wachdienst die einzige der vorgeschlagenen Lösungen, die das leistet?
Danke, noch einmal,. Ulrich
Mitglied: LordGurke
LordGurke 01.08.2022 um 02:10:04 Uhr
Goto Top
Doch, auch SMS werden nachts gelesen, wenn man das von den Leuten verlangt.
Und zumindest auf Android gibt es Apps, die z.B. alle paar Minuten akustisch an ungelesene SMS erinnern.
Da drückt ihr dann den Leuten, die Rufbereitschaft haben, ein Telefon mit diesem Reminder in die Hand und vereinbart vertraglich, dass die auch nachts/am Wochenende erreichbar sein müssen.
Das ist ein organisatorisches Problem face-wink

Alternativ kann euer Monitoring bestimmt auch Eskalationskontakte verwalten — da muss dann ein Eskalationskontakt rein, der benachrichtigt wird, wenn die anderen Kontakte bis dahin versagt haben.
Der kann dann die Rufbereitschaft anrufen und fragen, was da los ist.

Oder man startet automatisierte Anrufe mit einer aufgezeichneten Nachricht. Das ist etwas, was mit eigentlich jeder ernstzunehmenden Telefonanlage umsetzbar ist.
Mitglied: UserUW
UserUW 01.08.2022 um 02:38:43 Uhr
Goto Top
@LordGurke : Für ein Ereignis, das so gut wie nie eintritt, werden wir keinen eigenen Bereitschaftsdienst einrichten, der dann rund um die Uhr auf's Handy starrt, ob da eine SMS eingeht!

Aber Dein Tipp mit Android-Apps scheint weiterzuhelfen und führt auf offenbar aussichtsreiche Links. Wir werden das prüfen. Vielen Dank!
Mitglied: maretz
maretz 01.08.2022 um 06:19:55 Uhr
Goto Top
Das mit dem Anruf kannst du recht simpel über ne Asterisk lösen (oder wie die ggf. jetzt auch immer heissen ;) ). Da kannst du dann vorgefertigte Texte als Audio-Datei hinterlegen (z.B. das Kotzen nach ner durchzechten Nacht) und mit nem API-Call abspielen. Die wird auch solange telefonieren bis jemand das anhört wenn man das will oder eben div. Rufnummern durchgehen.

Nachteil ist natürlich das ich den Anruf annehmen kann aber gar nich zuhören muss... Das ist aber eben wieder der nicht-technische Teil... Ich habe z.B. mein Telefon idR nachts auf Lautlos...
Mitglied: silent-daniel
silent-daniel 01.08.2022 um 11:22:54 Uhr
Goto Top
Ich würde mal zusätzlich zur Benachrichtigung rausfinden, warum dieser Kritische Dienst ausfallen kann.

Internet? ne Backup Leitung...
Dienst abgestürzt? Neustarten...
x ...
x ...
x ...

Jeder Admin wird es lieben am Sonntag um 02 Uhr aus dem Bett geworfen zu werden.
Mitglied: TwistedAir
TwistedAir 01.08.2022 um 13:44:14 Uhr
Goto Top
Zitat von @UserUW:

Für ein Ereignis, das so gut wie nie eintritt, werden wir keinen eigenen Bereitschaftsdienst einrichten, der dann rund um die Uhr auf's Handy starrt, ob da eine SMS eingeht!

Für einen Bereitschaftsdienst, der nicht eingerichtet ist, würde ich keine Bereitschaft machen!

Also entweder der AG möchte eine Bereitschaft (mit der er dann vor den Kunden werben kann), die diesen Name auch verdient, oder der AN hat das Recht in seiner Freizeit nicht erreichbar zu sein. Bereitschaft heißt ja nicht nur erreichbar zu sein, sondern auch arbeitsfähig, d. h der AN ist nicht angetrunken, kann in einem kurzfristigen Zeitraum auf Arbeitsmittel zurückgreifen (muss evt. ein Notebook mitschleppen, Internetzugang?). Kurz er ist in seiner Freizeitgestaltung eingeschränkt. Dazu spielt noch das Arbeitsrecht mit rein (-> Regenerationszeit zwischen zwei Arbeitseinsätzen). Das soll der AG entsprechend vergüten, ansonsten hat der AN das Recht auf Nichterreichbarkeit.

Und wenn die Bereitschaft entsprechend geregelt ist, dann muss der AN auch das Handy für die Benachrichtigung (in welcher Form auch immer) auf laut stellen. Aber da „starrt“ keiner aufs Handydisplay, sondern reagiert nur auf die Nachricht.

Just my 2c.

TA
Mitglied: LordGurke
LordGurke 01.08.2022 um 14:11:47 Uhr
Goto Top
Genau das, was TwistedAir schreibt.
Ich habe auch Rufbereitschaft und gebe mir daher tagsüber alle Mühe, dass es keine Bereitschaftseinsätze gibt (und erwarte, dass die Kollegen das auch so sehen).
Aber irgendwas ist ja trotzdem immer, weshalb ich auch gelegentlich um 03:27 Uhr am Wochenende per SMS oder Anruf aus dem Bett geholt werde.
Trotz Redundanz wohlgemerkt.
Wir bieten Kunden auch einen 24/7-Notdienst per Telefon an, der dann natürlich auf das Bereitschaftstelefon aufschlägt. Das zahlt der Kunde entsprechend (Grundgebühr dafür, dass er anrufen darf und minutengenaue Abrechnung, wenn er tatsächlich anruft) und deshalb kommt das nur dann vor, wenn es aus Sicht des Kunden alternativlos ist.
Aber diese Kunden rufen gelegentlich auch am Wochenende an und haben ein Problem, was man für sie lösen soll. Das heißt für mich, dass ich entsprechend telefonisch erreichbar sein muss, ein Notebook mit LTE-Modem mit mir herumtrage, mich nicht allzuweit vom Rechenzentrum entfernen darf und ich auch nicht so angetrunken bin, dass man es mir anmerken kann.
Ich bin ganz ehrlich, würde mir das nicht bezahlt werden, würde ich mich nicht freiwillig außerhalb der Arbeitszeiten anrufen lassen, geschweige denn auch irgendwas beheben, möglicherweise sogar persönlich vor Ort im Rechenzentrum.

Kurz: Entweder ihr wollt dem Kunden 24/7-Überwachung und entsprechende Reaktionszeiten anbieten, dann müsst ihr vertraglich mit euren Leuten eine Rufbereitschaft vereinbaren (und vergüten) oder eben nicht. Das gibt es nur als Paket.
Mitglied: erikro
erikro 01.08.2022 um 17:06:16 Uhr
Goto Top
Moin,

mal eine ganz andere Idee: Es gibt eine Menge 24/7-Zentralen, die sich nachts gerne einen Euro hinzuverdienen (Taxen, Hausnotruf, Pflegebereitschaft ...). Hier könnte man die Mail hinschicken und dann einen Menschen damit beauftragen, die Liste abzuarbeiten derer, die zu verständigen sind.

Liebe Grüße

Erik
Mitglied: UserUW
UserUW 01.08.2022 um 22:31:41 Uhr
Goto Top
@TwistedAir, @LordGurke: Der juristische Fachbegriff ist "Rufbereitschaft" (de.wikipedia.org/wiki/Rufbereitschaft, www.hensche.de/Rechtsanwalt_Arbeitsrecht_Handbuch_Rufbereitschaft.html). Insbesondere darf man während einer Rufbereitschaft auch schlafen, auch zu Hause, auch bei Freund*in! Hier geht es mir allerdings um technische Lösungsmöglichkeiten!
Mitglied: manuel-r
manuel-r 02.08.2022 aktualisiert um 09:37:10 Uhr
Goto Top
Zitat von @UserUW:

@TwistedAir, @LordGurke: Der juristische Fachbegriff ist "Rufbereitschaft" (de.wikipedia.org/wiki/Rufbereitschaft, www.hensche.de/Rechtsanwalt_Arbeitsrecht_Handbuch_Rufbereitschaft.html). Insbesondere darf man während einer Rufbereitschaft auch schlafen, auch zu Hause, auch bei Freund*in! Hier geht es mir allerdings um technische Lösungsmöglichkeiten!

Das hat niemand bestritten.
Aber bei der Bereitschaft ist es nunmal so, dass ich mich wie schon beschrieben so verhalten muss diese auch erfüllen/wahrnehmen zu können. Das heißt dann (nicht vollständige Aufzählung):

  • Ich muss grundsätzlich mal fähig sein zu arbeiten. Rauschende Feste mit viel Alkohol fallen in dem Zeitraum also aus.
  • Ich muss erreichbar sein. Irgendwo hin fahren wo ich mit dem/einem Handy keinen Empfang habe fällt aus.
  • Ich muss mein Werkzeug (bspw. Notebook) dabei haben und mich per VPN verbinden können.
  • Ich darf mich für den Fall von Vor-Ort-Einsatz nur eine bestimmte Fahrzeit vom möglichen Einsatzort entfernen.
  • Ich muss für den Fall von Vor-Ort-Einsatz einen fahrbaren Untersatz verfügbar haben
  • Ich muss private Dinge bei Anruf zurückstellen. Es wäre nicht das erste Mal, dass ich ein Kino mitten im Film verlasse.
  • Ggf. muss die Familie entweder auch vorzeitig mit zurück fahren oder mit dem ÖPNV zurück wenn man gerade irgendwo unterwegs ist.
  • usw usw usw

Unter den genannten Bedingungen kannst du am Wochenende noch nicht einmal mit der Familie spazieren gehen oder eine Radtour machen sofern es weiter sein soll als einmal um den Block. Außer natürlich du schleppst dein Notebook mit.

Für all diese Einschränkungen will der Arbeitnehmer in der Regel einen Ausgleich sehen. Bei uns ist es bspw. so vereinbart, dass es für eine Woche reine Bereitschaft einen Freitag frei gibt. Tatsächliche Einsätze zählen extra.

Manuel
Mitglied: UserUW
UserUW 02.08.2022 um 11:22:41 Uhr
Goto Top
@manuel-r: Danke für Deine Überlegungen. Aber hab bitte Verständnis, wenn es mir hier nur um die technische Lösung geht und ich nicht diskutieren wollte, wie wir unser System redundant bekommen, mal zu prüfen, warum es überhaupt ausfallen könnte, oder auch, wie wir die Bereitschaft personell organisiert bekommen.

Dienste: Inzwischen bin ich auf folgende Dienste gestoßen, die genau das zu leisten scheinen, was ich suche (noch nicht genauer angesehen), z. B.: https://www.clicksend.com/de/ und https://www.tetronik.com/de/. Da wird es sicher noch mehr geben.

Die anderen Dienste, die genannt wurden, hatten Ihren Fokus offenbar auf der Überwachung, die wir aber nicht benötigen.

Vielen Dank an die Tippgeber, Ulrich
Mitglied: manuel-r
manuel-r 02.08.2022 um 11:30:26 Uhr
Goto Top
Aber hab bitte Verständnis, wenn es mir hier nur um die technische Lösung geht

Eine technische Lösung die funktioniert habe ich dir oben genannt.

Die Einwände von mir und anderen wollen einfach nur auf die Möglichkeit hinweisen, dass der in Frage kommende Personenkreis bei nicht geregelten Bedingungen irgendwann sagt "L**k mich. Ich schlafe jetzt". Damit ist niemandem gedient.

Manuel
Mitglied: LordGurke
LordGurke 02.08.2022 um 13:20:26 Uhr
Goto Top
Zitat von @UserUW:
Die anderen Dienste, die genannt wurden, hatten Ihren Fokus offenbar auf der Überwachung, die wir aber nicht benötigen.

Du kannst ja das eine mit dem anderen Verbinden: Du erzeugst eine Statusseite, die vom externen Dienst auf Inhalt überwacht wird und wenn etwas ausfällt änderst du den Inhalt der Statusseite, das löst dann den Alarm aus, der externe Dienst versendet die Nachricht.
Mitglied: sonderbarer
sonderbarer 02.08.2022 um 14:00:18 Uhr
Goto Top
Also ich komme vom Feuerwehrbereich und betreue hier die IT. Ich denke was du suchst ist ganz einfach und vielleicht ein bisschen zweckenfremdet aber damit meine ich kannst du es am besten abbilden. Hier kannst du deine eingehenden Fehlermeldungen per Mail auswerten lassen und entsprechende Einheiten/Personen wie auch immer alarmieren lassen. Das ganze funktioniert auch bei Stummschaltung des Handy´s und ist eigentlich echt Preisgünstig.
Wie gesagt Fehler A -> XY alarmieren, Fehler B -> Gruppe A und Z alarmieren. Mit rückmeldung wer den fall übernehmen würde.

FeuerSoftware

Vielleicht ist das das passende.

Gruß sonderbarer
Mitglied: UserUW
UserUW 02.08.2022 um 16:59:00 Uhr
Goto Top
Danke!