malawi
Goto Top

Zabbix discovery rule legt Items an, sammelt aber keine Daten (failed: first network error, wait for 15 seconds)

Ich grüße euch!


Zabbix-Installation

Zabbix-Server Version: 4.4.0
Betriebssystem: centos-release-8.0-0.1905.0.9.el8.x86_64

Anforderung

Ich möchte den Status und die Temperatur der Festplatten meiner Synology (RS818RP+) über eine Discovery rule überwachen.

Problembeschreibung

Ich bekomme keine Werte geliefert, wenn ich die Festplatten über eine Discovery rule erkennen lasse und anschließend eine Abfrage läuft. Wenn ich die Werte einzeln als Item abfrage, funktioniert alles problemlos.


Zunächst einmal der Beweis, dass SNMP im Grunde funktioniert und ich auch die besagten Werte geliefert bekomme, wenn ich einzeln Abfrage:

einzelne abfrage geht

Einstellungen meiner Discovery rule:

discovery rule

Wie nachfolgend zu sehen, werden die vier verbauten Festplatten erkannt und als Items angelegt:

2019-11-13 09_34_02-admin2stb - remotedesktopverbindung


Problem ist nur, dass keinerlei Werte ankommen, egal wie lange ich warte oder wie oft ich den Vorgang mit Check now anstoße.

Ein tail -f /var/log/zabbix/zabbix_server.log gibt mir unter anderem folgende Meldungen aus:

2019-11-13 09_39_02-admin2stb - remotedesktopverbindung

Ein tcpdump bei aktivierter Discovery rule gibt mir folgendes aus:

tcpdump

Dabei sieht man auch, dass wohl die richtigen OIDs abgefragt werden. Dazwischen sieht man immer einen GetRequest(31) E:6574.1.4.2.0, dass ist der CPU Lüfter Status der Synology, der wiederrum einen Wert liefert.

Ein direkter SNMPWALK vom Zabbix-Server funktioniert auch:

Neben snmpwalk -v 2c -c public 10.20.14.3 .1.3.6.1.4.1.6574.2.1.1.5 habe ich auch snmpbulkwalk -v 2c -c public 10.20.14.3 .1.3.6.1.4.1.6574.2.1.1.5 getestet und bekomme auch da das korrekte Ergebnis geliefert.

2019-11-13 11_02_53-admin2stb - remotedesktopverbindung

Mir ist im Zusammenhang mit dem zabbix_server.log aufgefallen, dass mein Zabbix-Server zeitweise keine Verbindung zu meiner Synology aufbauen kann, mit folgender Fehlermeldung:

2019-11-13 09_32_28-admin2stb - remotedesktopverbindung

Was irgendwo auch wieder quatsch ist, da SNMP ansonsten ja problemlos funktioniert.


Wireshark habe ich auch einmal angeschmissen. Hier zunächst eine Übersicht zweier Anfragen + Antworten:

wireshark_Übersicht

Hier sieht soweit alles normal aus. Es wird der CPU Lüfter Status (Paket 43+44) + mein Bulk-Request (Paket 45+46) der Festplatten abgefragt und es kommt sogar eine Antwort zurück.

Hier der Bulk-Request im Detail:

wireshark_bulkrequest

Und hier der Response im Detail:

wireshark_bulkresponse

Sieht für mich alles korrekt und normal aus...

Ich habe den Haken meines Host Synology1 bei Use bulk requests mal rausgenommen (auch ohne Erfolg):

2019-11-13 11_39_31-admin2stb - remotedesktopverbindung

Ich bin aktuell an einem Punkt, wo ich nicht weiß, was ich noch tun kann. Womöglich ein Bug?

Content-Key: 514576

Url: https://administrator.de/contentid/514576

Printed on: April 25, 2024 at 16:04 o'clock

Member: SeaStorm
SeaStorm Nov 13, 2019 at 11:28:02 (UTC)
Goto Top
Hi

versuch mal deine Poller hochzusetzen. in der config vom Server bzw Proxy
StartPollers
StartPollersUnreachable

Wenn zu wenige Poller da sind, kann es durchaus sein das die Zeit zwischen Request und Verarbeitung zu lange ist
Member: malawi
malawi Nov 13, 2019 updated at 11:45:54 (UTC)
Goto Top
Zitat von @SeaStorm:
versuch mal deine Poller hochzusetzen. in der config vom Server bzw Proxy
StartPollers
StartPollersUnreachable

Wenn zu wenige Poller da sind, kann es durchaus sein das die Zeit zwischen Request und Verarbeitung zu lange ist

Gibt es hier grobe Richtwerte?

StartPollers=50
StartPollersUnreachable=10

und

systemctl restart zabbix-server.service

ergibt keine Besserung.
Member: SeaStorm
SeaStorm Nov 13, 2019 at 11:51:02 (UTC)
Goto Top
kommt auf die Anzahl der Abfragen Pro Sekunde an. Aber wenn du den Server mit dem Server-Template monitorst, dann sagt er dir eigentlich, wenn du langsam voll läufst.

Ggf mal dein Timeout hochsetzen. Vielleicht braucht deine Synology zu lange? Auch in der Config Timeout=
Musste ich auch mal hochschrauben. Steht bei mir zZ auf 10
Member: malawi
malawi Nov 13, 2019 updated at 12:14:22 (UTC)
Goto Top
Ggf mal dein Timeout hochsetzen
Timeout steht bei mir auch schon auf 30.

Vielleicht braucht deine Synology zu lange?
Sie gibt ja aber die Werte zurück, siehe SNMPWALK von der Console des Zabbix-Servers aus. Da ich damit Antworten erhalte, würde ich das Problem nicht bei der Synology suchen.

EDIT:

kommt auf die Anzahl der Abfragen Pro Sekunde an. Aber wenn du den Server mit dem Server-Template monitorst, dann sagt er dir eigentlich, wenn du langsam voll läufst.
Die Auslastung hat sich zwar verringert, aber leider mein Problem nicht gelöst.

2019-11-13 13_12_38-admin2stb - remotedesktopverbindung

Es ist aktuell aber auch nur eine Testinstallation mit vielleicht fünf Hosts und einer Hand voll Abfragen...
Member: SeaStorm
Solution SeaStorm Nov 13, 2019, updated at Apr 21, 2022 at 13:16:54 (UTC)
Goto Top
ähm also wenn ich mir deine Frage noch mal durchlese: Das Discovery selbst funktioniert und du legst ein Item per Prototype an, aber dieses bekommt dann keine Daten?
Wie sieht denn das Item aus? Prototype und erstelltest

Hier ist der Index vom Item ja in Klammern. Die gehören da eigentlich nicht hin
Member: malawi
malawi Nov 13, 2019 at 12:51:19 (UTC)
Goto Top
Das Discovery selbst legt die Items nach den Item-Prototypes an, ja richtig.

Hier das "normale" Item (Status für Disk0), das ich händisch angelegt habe:

item normal

Und hier der "Item-Prototype" innerhalb der Discovery rule:

item nicht normal

Du meintest die im letzten Bild markierten eckigen Klammern richtig? Das hatte ich auch schon im Auge, allerdings bekomme ich eine Fehlermeldung mit Syntaxfehler, wenn ich die Klammern weg lasse.
Member: malawi
malawi Nov 13, 2019 at 13:05:32 (UTC)
Goto Top
Jetzt funktioniert meine Konstellation:

Discovery rule:

2019-11-13 14_03_10-admin2stb - remotedesktopverbindung

Item Prototype:

testtest

Ich habe die Keys angepasst. Ich muss ehrlich gestehen, dass ich nicht zu 100% weiß, was da eigentlich stehen muss. Ich habe halt immer die OID angegeben, da meistens eindeutig. Jetzt habe ich die entsprechende Bezeichnung aus der MIB eingegeben.

Vielleicht kann mich hier jemand aufklären bzw. sagen, was ich da sinnvollerweise zukünftig angeben kann...
Member: SeaStorm
SeaStorm Nov 13, 2019 at 13:21:37 (UTC)
Goto Top
ach Gott das mit den Keys hab ich gar nicht gesehen.
Keys sind die "internen" Namen der Werte für das System. Da verweist man z.B in den Triggern drauf.
Grundsätzlich hast du hier freie Wahl, aber irgendwas sprechendes ist natürlich nicht blöd, damit man weis um was es da grad geht face-smile

Und mit dem geänderten Key funktioniert das ganze jetzt? ist ja auch sonderbar
Member: malawi
malawi Nov 13, 2019 at 13:24:33 (UTC)
Goto Top
Ja, schau:

2019-11-13 14_23_16-admin2stb - remotedesktopverbindung

Ruft jetzt alle 30 Sekunden ab face-smile