dirmhirn
Goto Top

VoIP Geräte nach einigen Sekunden nicht erreichbar

Hi,

wir haben eine virtuelle Telefonanalage bei einem Provider.

Jedes SIP-Gerät(~15) meldet sich mit User und Passwort ein und hat die Provider URL als Proxy eingetragen.

seit etwa 2 Wochen sind die Geräte sporadisch nicht erreichbar. meistens funktioniren die internen Druchwahlen (2 stellig) nicht. Manche Geräte können raus telefonieren. manche sind dann auch über die externe Nummer nicht mehr erreichbar.
Zeitweise kommt man direkt auf die VoiceBox. Meistens läutet dann aber das Gerät mit der Huptnummer ohne Durchwahl.


Geräte sind Cisco SPA502g bzw SPA525g (Hautpgerät ohne Durchwahl).


Nach einigem Probieren scheint es so, als wären die Geräte 1-3 Minuten nach dem Start nicht erreichbar. Durch irgendein Event sind sie manchmal auch so wieder erreichbar.

Das Setup hat seit 5 Jahren unauffällig gearbeitet. Seit 2 Wochen spinnt es komplett.

VoIP Provider sagt bei ihnen passt alles, es liegt an der Leitung oder ein NAT Problem.
Leitung ist leider von einem anderen Provider. Der Sagt - kein Problem. Mit Leitung von anderem Provider haben wir die gleichen Probleme.

eine Sophos UTM125 haben wir als Firewall. NAT Masquerading und eine FW Rule die alles von der PBX in die DMZ durchlässt. VoIP Helper ist deaktiviert. (War nie nötig und zeigt auch keine Verbesserung.)

Sophos ist aktuell auf 9.702-1
dahinter steht eine HP 5406

Die PBX zeigt eine Anrufstatistik. Dort werden alle Anrufe gelistet - kommen also zur PBX und wieder raus.
Außerdem sieht man die Geräte mit registrierter IP und Port. Die Anzeige ist aber sehr verzögert. Ich hätte den Eindruck, dass sich der Port einmal nach der Registrierung ändert und dann fix bleibt.

Verbindungsabbrüche gibt es keine. Wenn die Verbindung da ist, dann passts. Als scheint ein reines SIP Problem zu sein.

irgendjemand eine Idee wo ich weiter suchen könnte?

sg Dirm

Content-ID: 557148

Url: https://administrator.de/contentid/557148

Printed on: December 12, 2024 at 21:12 o'clock

aqui
aqui Mar 12, 2020 at 17:05:47 (UTC)
Goto Top
Seit 2 Wochen spinnt es komplett.
Was wurde an dem Zeitpunkt verändert ? Gibt es ein SIP Application Gateway in der FW ?
VoIP Helper ist deaktiviert.
Was soll das technisch sein ?? Sowas gibt es nicht.
Looser27
Looser27 Mar 12, 2020 at 17:23:30 (UTC)
Goto Top
VoIP Helper ist deaktiviert.
Was soll das technisch sein ?? Sowas gibt es nicht.

SIP Proxys haben die tollsten Namen.
erikro
erikro Mar 12, 2020 updated at 17:52:10 (UTC)
Goto Top
Moin,

Zitat von @Dirmhirn:
seit etwa 2 Wochen sind die Geräte sporadisch nicht erreichbar. meistens funktioniren die internen Druchwahlen (2 stellig) nicht. Manche Geräte können raus telefonieren. manche sind dann auch über die externe Nummer nicht mehr erreichbar.

Anders ausgedrückt: Manche funktionieren, manche funktionieren halb und manche gar nicht? Das gleichzeitig? Sind die Störungen bei den Geräten konsistent? Oder wechselt das Fehlerbild bei den einzelnen Endgeräten?

Zeitweise kommt man direkt auf die VoiceBox. Meistens läutet dann aber das Gerät mit der Huptnummer ohne Durchwahl.

Es gibt keine Nummer ohne Durchwahl beim Anlagenanschluss. Ich vermute, Du meinst die Zentrale. Ist das der Abwurfplatz bei Nichtmelden?

Nach einigem Probieren scheint es so, als wären die Geräte 1-3 Minuten nach dem Start nicht erreichbar.

Oben steht nach einigen Sekunden? Warum wurden die Geräte vor zwei Wochen neu gestartet? Update?

Durch irgendein Event sind sie manchmal auch so wieder erreichbar.

Das heißt, dass der Fehler von alleine verschwindet? Gibt es eine Gemeinsamkeit, wenn der Fehler verschwindet? Sowas wie "Hörer wird abgenommen" oder "Zentrale wird angewählt". Oder was auch immer.

Das Setup hat seit 5 Jahren unauffällig gearbeitet. Seit 2 Wochen spinnt es komplett.

Da schließe ich mich der Frage von @aqui an. Was ist vor zwei Wochen passiert?

VoIP Provider sagt bei ihnen passt alles, es liegt an der Leitung oder ein NAT Problem.

Wenn es am VoIP-Provider läge, dann hätten wahrscheinlich viele andere auch das Problem. Dann hätte er wahrscheinlich eher gesagt: Wir arbeiten daran. Ich neige nach Deiner Beschreibung dazu, das zu glauben.

Leitung ist leider von einem anderen Provider. Der Sagt - kein Problem. Mit Leitung von anderem Provider haben wir die gleichen Probleme.

Dann ist auch die Außenanbindung wahrscheinlich nicht das Problem. Wenn es auf zwei unabhängigen Außenanbindungen das gleiche Fehlerbild gibt, dann ist sie es höchstwahrscheinlich nicht.

eine Sophos UTM125 haben wir als Firewall. NAT Masquerading und eine FW Rule die alles von der PBX in die DMZ durchlässt. VoIP Helper ist deaktiviert. (War nie nötig und zeigt auch keine Verbesserung.)

Sophos ist aktuell auf 9.702-1

Ei gugge. Das Update wurde am 2.3. veröffentlicht. Das ist ca. zwei Wochen her. Oder wurde das Update nach dem Fehler eingespielt?

Die PBX zeigt eine Anrufstatistik. Dort werden alle Anrufe gelistet - kommen also zur PBX und wieder raus.

Heißt was? Im Log steht, dass die Anrufe erfolgreich zum Endgerät durchgereicht wurden? Was passiert eigentlich auf der Gegenstelle? Hört der Anrufer ein Freizeichen?

Außerdem sieht man die Geräte mit registrierter IP und Port. Die Anzeige ist aber sehr verzögert.

Welche Anzeige ist wann verzögert?

Ich hätte den Eindruck, dass sich der Port einmal nach der Registrierung ändert und dann fix bleibt.

Dann solltest Du das verifizieren und, wenn dem so ist, nachlesen, ob das vielleicht normal ist.

Verbindungsabbrüche gibt es keine. Wenn die Verbindung da ist, dann passts. Als scheint ein reines SIP Problem zu sein.

irgendjemand eine Idee wo ich weiter suchen könnte?

Ich erinnere mich dunkel an ein solches Problem, bei dem es zu ähnlich diffusen Fehlerbildern kam. Das war, wenn ich mich recht erinnere, ein Update auf Seiten des Providers, das in bestimmten Konstellationen Protokollfehler produzierte. Deshalb wäre meine erste Vermutung ein (automatisches) Update. Die PBX schließe ich mal aus. Ich hoffe doch, dass der Provider die kommuniziert. Es könnte die Sophos sein, weil die gerade ein frisches Update bekommen hat. Es könnten aber auch die Endgeräte sein. Wann war da das letzte Update?

hth

Erik
Dirmhirn
Dirmhirn Mar 12, 2020 at 17:52:12 (UTC)
Goto Top
Geändert - was soll ich sagen :- D nichts.

Hab die changelogs der FW durchgeschaut. Updates habe ich gestern erst auf verdacht installiert. Switch läuft auch so vor sich hin.

SIP Helper, dürfte dann mehr für RTP da sein. Lief aber immer ohne. Wollts nur erwähnen, dass ichs probiert habe.

Beim NAT auf der FW gibt es auch keine weiteren Optionen. Sophos hat Masquerading - das ist so das übliche Privates Netz auf eine externe IP.
Außerdem Source NAT, damit kann man die externe IP "frei" wählen.

Anscheinend gibt es ein cmd conntracker auf der shell. Damit kann man das nat mapping ansehen. Muss ich mir erst ansehen.

wirkt es als würde die FW die Pakete annehmen, aber dann verwerfen. Die PBX meint es hat funktioniert.

NAT keep alive ist in den Telefonen auf 15 Sekunden. Kann man testen ob das NAT mapping "offen" bleibt?

Die PBX wurde in den letuten 10 Jahren 3 mal übernommen. Dachte zuerst, die lassen sie sterben. Hatte dann aber einen Techniker am Telefon der echt motiviert war und sich mit der PBX auskannte. Soweit ich das beurteilen kann.
Dirmhirn
Dirmhirn Mar 12, 2020 at 18:14:54 (UTC)
Goto Top
Zitat von @erikro:

Moin,

Zitat von @Dirmhirn:
seit etwa 2 Wochen sind die Geräte sporadisch nicht erreichbar. meistens funktioniren die internen Druchwahlen (2 stellig) nicht. Manche Geräte können raus telefonieren. manche sind dann auch über die externe Nummer nicht mehr erreichbar.

Anders ausgedrückt: Manche funktionieren, manche funktionieren halb und manche gar nicht? Das gleichzeitig? Sind die Störungen bei den Geräten konsistent? Oder wechselt das Fehlerbild bei den einzelnen Endgeräten?

Zuerst dachten wir es wäre nur eines - Gigaset DECT. (Nicht erwähnt, da es schon so lange war..)
Aber das sind die einzigen die das Telefon noch regelmäßig verwenden.

Seitdem ich teste betrifft es alle. Ja sie "sterben" nach der Reihe. Meist interne Durchwahl nicht erreichbar. Dann extern und ganz selten kommt man nicht mehr raus.


Zeitweise kommt man direkt auf die VoiceBox. Meistens läutet dann aber das Gerät mit der Huptnummer ohne Durchwahl.

Es gibt keine Nummer ohne Durchwahl beim Anlagenanschluss. Ich vermute, Du meinst die Zentrale. Ist das der Abwurfplatz bei Nichtmelden?


Die DW wird nach 20 sekunden läuten auf die HauptDW geleitet oder gleich bei besetzt/nicht erreichen. Hebt an der Hauptnummer keiner ab, dann VoiceBox.
In dem Fall kommt die Box aber sofort. Also wohl beide DWs nicht erreichbar. Habe noch nicht probiert zu welcher VoiceBox ich komme. TODO

Nach einigem Probieren scheint es so, als wären die Geräte 1-3 Minuten nach dem Start nicht erreichbar.

Oben steht nach einigen Sekunden? Warum wurden die Geräte vor zwei Wochen neu gestartet? Update?

~ 240 Sekunden. Nein, kein Neustart. Update gibts keins mehr für die Krücken.


Durch irgendein Event sind sie manchmal auch so wieder erreichbar.

Das heißt, dass der Fehler von alleine verschwindet? Gibt es eine Gemeinsamkeit, wenn der Fehler verschwindet? Sowas wie "Hörer wird abgenommen" oder "Zentrale wird angewählt". Oder was auch immer.

Mir wäre noch kein Muster aufgefallen. Dachte auch schon, das eine Gerät, das den Port 5060 im NAT Mapping erwischt, ist immer erreichbar nein. Die Geräte registrieren sich ja immer wieder neu. Soweit ich das verstanden habe.

Manchmal gings am Abend, in der früh gaben sich die User beschwert, aber Stunde später gings.


Das Setup hat seit 5 Jahren unauffällig gearbeitet. Seit 2 Wochen spinnt es komplett.

Da schließe ich mich der Frage von @aqui an. Was ist vor zwei Wochen passiert?

VoIP Provider sagt bei ihnen passt alles, es liegt an der Leitung oder ein NAT Problem.

Wenn es am VoIP-Provider läge, dann hätten wahrscheinlich viele andere auch das Problem. Dann hätte er wahrscheinlich eher gesagt: Wir arbeiten daran. Ich neige nach Deiner Beschreibung dazu, das zu glauben.

Leitung ist leider von einem anderen Provider. Der Sagt - kein Problem. Mit Leitung von anderem Provider haben wir die gleichen Probleme.

Dann ist auch die Außenanbindung wahrscheinlich nicht das Problem. Wenn es auf zwei unabhängigen Außenanbindungen das gleiche Fehlerbild gibt, dann ist sie es höchstwahrscheinlich nicht.


Ja ich glaubs leider inzwischen auch, dass es an uns liegt. face-big-smile
VoIp Client am iPhone und Android geht auch.

eine Sophos UTM125 haben wir als Firewall. NAT Masquerading und eine FW Rule die alles von der PBX in die DMZ durchlässt. VoIP Helper ist deaktiviert. (War nie nötig und zeigt auch keine Verbesserung.)

Sophos ist aktuell auf 9.702-1

Ei gugge. Das Update wurde am 2.3. veröffentlicht. Das ist ca. zwei Wochen her. Oder wurde das Update nach dem Fehler eingespielt?

Update erst gestern. So auf verdacht. Es werden aber keine Updates automatisch eingespielt. Es waren 3 fällig.


Die PBX zeigt eine Anrufstatistik. Dort werden alle Anrufe gelistet - kommen also zur PBX und wieder raus.

Heißt was? Im Log steht, dass die Anrufe erfolgreich zum Endgerät durchgereicht wurden? Was passiert eigentlich auf der Gegenstelle? Hört der Anrufer ein Freizeichen?

"Log" ist eine webtabelle mit von nach, Zeit und dauer. Ja dort werden auch Anrufe gelistet, bei denen des Ziel nicht geläutet hat.

Freizeichen (aber da läutet die HauptDW) oder VoiceBox.


Außerdem sieht man die Geräte mit registrierter IP und Port. Die Anzeige ist aber sehr verzögert.

Welche Anzeige ist wann verzögert?

In der PBX weboberfläche, sehe ich extIP und Port der Geräte. Das aber mit paar Minuten Verzögerung.


Ich hätte den Eindruck, dass sich der Port einmal nach der Registrierung ändert und dann fix bleibt.

Dann solltest Du das verifizieren und, wenn dem so ist, nachlesen, ob das vielleicht normal ist.

Konnte mir der Techniker nicht sagen. Er meint kann sich ändern, muss aber nicht.


Verbindungsabbrüche gibt es keine. Wenn die Verbindung da ist, dann passts. Als scheint ein reines SIP Problem zu sein.

irgendjemand eine Idee wo ich weiter suchen könnte?

Ich erinnere mich dunkel an ein solches Problem, bei dem es zu ähnlich diffusen Fehlerbildern kam. Das war, wenn ich mich recht erinnere, ein Update auf Seiten des Providers, das in bestimmten Konstellationen Protokollfehler produzierte. Deshalb wäre meine erste Vermutung ein (automatisches) Update. Die PBX schließe ich mal aus. Ich hoffe doch, dass der Provider die kommuniziert. Es könnte die Sophos sein, weil die gerade ein frisches Update bekommen hat. Es könnten aber auch die Endgeräte sein. Wann war da das letzte Update?

Die Geräte sind scho paar Jahre EOL.

Danke mal für eure Inputs. Werde das ganz nochmal durchgehen. Falls bis dahin noch keine Quarantäne gibt ^^

Sg Dirm
erikro
erikro Mar 12, 2020 at 18:54:50 (UTC)
Goto Top
Moin,

Zitat von @Dirmhirn:
In dem Fall kommt die Box aber sofort. Also wohl beide DWs nicht erreichbar. Habe noch nicht probiert zu welcher VoiceBox ich komme. TODO

Ja, das wäre sicher hilfreich.

Oben steht nach einigen Sekunden? Warum wurden die Geräte vor zwei Wochen neu gestartet? Update?

~ 240 Sekunden. Nein, kein Neustart. Update gibts keins mehr für die Krücken.

Einige ist halt ein relativer Begriff. face-wink

Das heißt, dass der Fehler von alleine verschwindet? Gibt es eine Gemeinsamkeit, wenn der Fehler verschwindet? Sowas wie "Hörer wird abgenommen" oder "Zentrale wird angewählt". Oder was auch immer.

Mir wäre noch kein Muster aufgefallen.

Das würde ich mal beobachten.

VoIp Client am iPhone und Android geht auch.

Moment. WLAN-Clients funktionieren problemlos? Das führt mich zu meiner spontanen Idee zurück: Störungen im WLAN. Dann habe ich mir ein Foto der Geräte angeguckt und gesehen, dass die LAN-gebunden sind. Idee verworfen. Aber jetzt wird wieder ein Schuh daraus. Ich vermute mal, dass die Geräte alle am selben Switch hängen. Hast Du Dir den schon mal angeguckt? Wir hatten letzt einen, der hatte einen kaputten Port, was dazu führte, dass das ganze Teilnetz grottenlahm wurde. Und zwar deshalb, weil der kaputte Port dafür gesorgt hat, dass der Switch sekundenlang still stand. Sowas wäre für VoIP tödlich.

Update erst gestern.

Idee gestorben. face-wink

Die PBX zeigt eine Anrufstatistik. Dort werden alle Anrufe gelistet - kommen also zur PBX und wieder raus.

Heißt was? Im Log steht, dass die Anrufe erfolgreich zum Endgerät durchgereicht wurden? Was passiert eigentlich auf der Gegenstelle? Hört der Anrufer ein Freizeichen?

"Log" ist eine webtabelle mit von nach, Zeit und dauer. Ja dort werden auch Anrufe gelistet, bei denen des Ziel nicht geläutet hat.

Dann würde ich den Provider mal fragen, wie Du denn an die richtigen Logs kommst. Also die, in denen steht, was protkollseitig so passiert. Aber erstmal der Switch.

Freizeichen (aber da läutet die HauptDW) oder VoiceBox.

Aha. Die PBX ist also der Meinung, sie klingelt auf dem richtigen Endgerät. Es klingelt aber auf einem anderen. Wenn ich das richtig verstanden habe, dann kommt dann auch ein Gespräch mit diesem Endgeräte (Zentrale oder AB) zustande, das normal verläuft.

Das heißt, dass die Kommunikation zwischen PBX und dem NAT-Mapping, also der Sophos nicht richtig funktioniert. Aber warum wechseln die denn ständig den Port? Weiter oben hast Du geschrieben, dass die sich ständig neu registrieren. Warum? Kannst Du die Ports fest vergeben? Wenn ja, hast Du probiert, was passiert, wenn Du Endgeräten einen festen Port zuweist?

Welche Anzeige ist wann verzögert?

In der PBX weboberfläche, sehe ich extIP und Port der Geräte. Das aber mit paar Minuten Verzögerung.

Aha. Du hast also eine Liste oder eine Maske mit einzelnen Endgeräten, in der IP und Port stehen. Das baut sich mit minutenlanger (gemessen oder gefühlt?) Verzögerung auf. Die gesamte Liste/Maske oder nur die Spalten/Felder mit IP und Port?

Auch das spricht für die Störung der Kommunikation des Portmappings.

Dann solltest Du das verifizieren und, wenn dem so ist, nachlesen, ob das vielleicht normal ist.

Konnte mir der Techniker nicht sagen. Er meint kann sich ändern, muss aber nicht.

Na dann. face-wink

Die Geräte sind scho paar Jahre EOL.

Wie gesagt, ich habe mir nur schnell ein Foto in Tante Googles Album angeguckt. face-wink Telefone sind verdammt langlebig.

Liebe Grüße

Erik