Sporadisch, temporäre nicht erreichbare IPs

Hallo zusammen,

ich habe ein Problem seit mehreren Monaten schon mit meinem Netzwerk. Ich hoffe jemand hat eine Idee oder einen Tipp.

Hin und wieder (leider kann ich es nicht genauer eingrenzen) sind beliebige ips im Netzwerk für 2-3 Minuten nicht erreichbar.
Das Gerät ist über die Ip nicht ansprechbar. Als Fehlermeldung wird allerdings ein Dns fehler im browser angezeigt, aber wenn ich selbst über die ip nicht erreiche, hat es ja nichts mit dem dns zu tun, oder?

Manchmal erwischt es auch ein Tablet, welches dann gar nichts mehr im Netzwerk erreicht.

Es trifft Geräte mit und ohne WLan.

Ich hab keine Idee wie ich dem Fehler auf die schliche kommen soll.

Zum Aufbau:
Ich hab leider noch eine alte Fritzbox, welche den Anschluss per Glasfaser und Dhcp übernimmt.
Normaler Netzwerkbereich mit 192.168.178.0-255
Dadran einen asus router RT-AX88U als acesspoint.
Dazwischen und dahinter noch mehrer switches...
Der DNS Server läuft über ein NAS.


Die örtlichen Gegebenheiten führten zu diesem Aufbau.

Kann man irgendwie das Fehlverhalten eingrenzen?
In den Logs von den Routern steht leider nichts.

Viele Grüße
BB

Content-Key: 666538

Url: https://administrator.de/contentid/666538

Ausgedruckt am: 17.06.2021 um 19:06 Uhr

Mitglied: aqui
aqui am 08.05.2021
Dazwischen und dahinter noch mehrer switches...
Auf denen vermutlich ein Spanning Tree Protokoll rennt und (auch mal vermutet) keinerlei richtige Spanning Tree Konfig.
Das führt dann bei Loop Situationen oder bei nicht kompatiblem Spanning Tree Protokollen (Per VLAN STP zu Single STP usw.) genau zu solchen Aussetzern wenn es zu einem Topology Change kommt.
In den Logs von den Routern steht leider nichts.
Kein Wunder, denn das ist eine Layer 2 Problematik in der die Router gar nicht involviert sind. Dazu kommt das diese (meist) nicht am Spanning Tree teilnehmen.
Da solltest du also mal suchen. Für weitere zielführende Troubleshooting Tips sind deine aktuelle Beschreibung oben einfach zu mager und zu oberflächlich mit viel zu wenigen Infos. :-( face-sad
Switch Logs und vor allem der Wireshark ist hier wie immer dein bester Freund !
Mitglied: BlueBook
BlueBook am 08.05.2021
Danke für die Antwort.
Ich brauchte ja erstmal einen Ansatzpunkt.

"Spanning Tree Protokollen" hab ich noch nie gehört.
Und daran das es an den switches liegen könnte, okay....

Ich lese mich mal ein und melde mich dann wieder mit mehr infos bzw fragen ;)

Danke sehr schon einmal soweit.

Gruß
BB
Mitglied: incisor2k
incisor2k am 08.05.2021
Guten Abend, ich rate mal mit.

Ich sage: DHCP Problem, Lease-Time evtl?! Hat zumindest mal mit dem DNS rein gar nix zu tun.

Fix nem Client ne IP hart zu weisen und testen :-) face-smile

Schonen Abend.
Mitglied: wellknown
wellknown aktualisiert am 09.05.2021
Ja, erster Schritt Doku. Zweiter Schritt feste IPs (oder im DHCP-Server IP über MAC-Adresse reserviert, Vorteil, Du musst nichts an den Clients ändern). Dann beobachten.
Mitglied: 148121
148121 aktualisiert am 08.05.2021
Dazwischen und dahinter noch mehrer switches...
Bei dieser mehr als schwammigen Aussage bin ich auch in der Ratestunde bei "da hat sich der TO doch sicherlich irgendwo 'dazwischen' einen Loop gebaut" 🤔
Manchmal frag ich mich echt hier was sich jemand denkt wenn man eine Frage stellt aber dann gleichzeitig keinerlei Detailinfos zum Netz postet ... Liebe Leute wir sind ja schon gut möcht ich mal behaupten, aber nur so gut wie unsere Glaskugeln es erlauben 👎.

Also am besten Schaubild und Detail-Config der Gerätschaften posten dann kann man auch gezielt helfen und muss nicht immer erst was vom Pferd erzählen!

Gruß w.
Mitglied: em-pie
em-pie am 09.05.2021
Moin,

Ich hab leider noch eine alte Fritzbox, welche den Anschluss per Glasfaser und Dhcp übernimmt.
Normaler Netzwerkbereich mit 192.168.178.0-255
Dadran einen asus router RT-AX88U als acesspoint.

Mich stört ja eher das hier.
Ich vermute(!), dass es im Netz zwei DHCP-Server gibt und der Asus gar nicht als AP sondern als (unkonfigurierter) Router mitspielt.

Eigentlich würde das Problem dann länger den die o.g. zwei bis drei Minuten bestehen, aber es soll Leute geben, die haben auch schon Pferde ko**en sehen o.o

Gruß
em-pie
Mitglied: incisor2k
incisor2k aktualisiert am 09.05.2021
Ebenfalls ne gute Vermutung. Nur würden dann aber entweder
a) Clients ausm Fritz-Netz Clients hinterm Asus Router nicht erreichen können und/oder
b) er hätte neben dem klassischem ...178.0 Netz zumindest noch ein weiteres?!

Das wäre aber doch sicher aufgefallen?! ;-) face-wink
Mitglied: CyborgWeasel
CyborgWeasel am 10.05.2021
Zitat von @incisor2k:

Ebenfalls ne gute Vermutung. Nur würden dann aber entweder
a) Clients ausm Fritz-Netz Clients hinterm Asus Router nicht erreichen können und/oder
b) er hätte neben dem klassischem ...178.0 Netz zumindest noch ein weiteres?!

Naja oder der 2. DHCP ist ebenfalls auf das 178er Netz konfiguriert, dann hätte man evtl. sogar IP Konflikte, weil 2mal die gleiche IP?! Oder fängt das DHCP Protokoll sowas ab?

Gruß
Mitglied: 148121
148121 aktualisiert am 10.05.2021
Zitat von @CyborgWeasel:
Naja oder der 2. DHCP ist ebenfalls auf das 178er Netz konfiguriert, dann hätte man evtl. sogar IP Konflikte, weil 2mal die gleiche IP?!
Nein, der Client prüft nach dem DHCPOFFER des DHCP Servers zur Sicherheit noch per ARP Request ob ein Device auf diese IP antwortet. Bekommt dieser eine Antwort auf den Request lehnt der Client die OFFER des DHCP-Servers ab und fragt eine neue Adresse an.
Oder fängt das DHCP Protokoll sowas ab?
Nicht DHCP sondern ARP regelt solche Konflikek in der Broadcast-Domain.

Man bekommt halt immer von dem DHCP eine Antwort der am schnellsten antwortet, und das muss nicht immer der selbe sein. Wenn also ein DHCP Server mit anderen Subnetzangaben wie GW, DNS Server und falschen IPs im selben Netz wie ein anderer DHCP Server agiert kann es also durchaus zu so einer Nichterreichbarkeit eines Clients kommen, weil er eben Daten für ein falsches Subnetz erhält und so das Routing unterbrochen ist.
Mitglied: BlueBook
BlueBook am 10.05.2021
Vielen Dank erst einmal für die vielen Antworten!
Das macht Hoffnung das Problem zu finden.

Das mit dem SpanningTreeProtokoll und dessen Zusammenhang habe ich jetzt verstanden und auf Grund meines Netzaufbaus direkt wieder ausgeschlossen - jetzt verstehe ich aber, wieso man dafür z.B. mehr Infos braucht.

Um die Antwort auch nicht schuldig zu bleiben versuche ich meinen Aufbau bei mir "runter zu schreiben"
und ergänze die Infos die angesprochen wurden.
Der Aufbau ist historisch gewachsen - wie es meist so ist.
Die untere Ebene sind die daran angeschlossenen Geräte (ohne Endgeräte...)


Internet
-FritzBox6360

FritzBox6360
-8Port Switch Nr1
-DLink DGS-1100-24 Switch L2

DLink DGS-1100-24 Switch L2
- Synology NAS u.a. als DNS-Server
- Synology NAS mit Docker
- Asus RT-AX88U als AP
- Asus RT-AC66U als AI-Mesh-Node
- Asus RT-AC68U als AI-Mesh-Node

Asus RT-AX88U
- 8Port Switch Nr2

8Port Switch Nr2
- 8Port Switch Nr3


Ergänzende Infos
Die FritzBox wird hoffentlich in 3-4 Monaten durch ein neues Modell ersetzt...
WLAN ist deaktiviert.
Z.Z. ist diese auch der DHCP-Server mit überwiegend festenIPs über MAC (teilweise zusätzlich auch im Client)
Leider verschwinden auch die "festen" IPs.

Der Asus ist als AP konfiguriert - ist auch über die Bedienungsoberfläche recht gut zu konfigurieren.
Dort gibt es jetzt keine DHCP Einstellmöglichkeiten mehr und es steht sogar ein Hinweis, dass die IP über DHCP bezogen wird - das sollte also wirklich deaktiviert sein - hab es extra noch mal kontrolliert.
Trotzdem ist der Gedanke mit dem zweiten DHCP-Server eine gute Vermutung, die mich auch nicht so richtig los lässt.
Ich bin gerade einige Geräte, welche DHCP haben könnten, durchgegangen, dort ist aber überall der DHCP deaktiviert.

An den weiteren Asus Routern mit AIMesh-funktion liegt es wohl nicht. Dieses hatte ich offline genommen und der Fehler trat weiter auf.


Was mich gerade noch total irritiert hat, dass ich beim Blick in die Fritzbox zwei Geräte in der Netzwerkübersicht mit der gleichen IP sah, obwohl die IPs auch noch fest vergeben sind. In der Detailansicht, als auch beim Aufruf passte wieder alles - je Gerät unterschiedliche und die festgelegten IPs - irgendwie aber schon merkwürdig. Nach der Aktualisierung wird es jetzt wieder richtig angezeigt.


Ich hab oben bewusst mein "Synology NAS mit Docker" aufgelistet. Dort wird ja "intern" auch viel mit IPs hantiert.
Ich hatte mal über macVLan dem NAS zwei IPs zugewiesen. Das hab ich aber eigentlich wieder raus genommen.
Kann sich dort ein Fehler eingeschlichen haben, der so etwas bewirkt?
Leider kann ich den nicht einfach testweise vom Netz nehmen, da mein ganzen SmartHome darüber läuft.

Bei den 8PortSwitches kann man ja meistens gar nichts konfigurieren. Diese hängen zwar ggf. unschön in Reihe, aber das sollte ja nicht zu solchen Fehlern führen. Erst recht nicht bei festen IPs, oder?

Den L2-Switch habe ich bisher nicht groß konfiguriert, dass sind eher die Standard-Einstellungen.
Ich wollte mal wegen VLAN schauen, fehlende Zeit und der doch hohe Einarbeitungsaufwand für mich, hat mich bisher abgeschreckt ;)


Kann man irgendwie schauen, ob es zwei DHCP-Server im Netz gibt?
Wahrscheinlich auch nicht so leicht, oder?

Wenn es weitere Detailfragen gibt, gerne fragen.
Wenn ich wüsste, welche Logs/Configs hilfreich sind und wo diese sind, würde ich diese posten.


Vielen Dank schon einmal für die Unterstützung!

Viele Grüße
BB
Mitglied: CyborgWeasel
Lösung CyborgWeasel am 11.05.2021
Also einen 2. DHCP ausfindig zu machen sollte ja ganz einfach sein: Einfach den bekannten DHCP in der Fritzbox einmal ausschalten und dann einen PC mit IP-Autoconfig starten. Dann sieht man ja, ob noch eine IP verteilt wird oder nicht. Btw: Die Netzwerkliste der Fritzbox kann schon mal etwas unvollständig oder fehlerhaft sein, speziell wenn man mit IPs rumexperimentiert und unterschiedlichen PCs mal die gleiche IP zuweist. Hatte ich auch schon mal, ich weiß nur gerade nicht mehr wie rum: 2 PCs die gleiche Adresse oder 2 Adressen die gleichen PCs... Da würde ich mir jetzt erst mal keine Gedanken machen.

Aber: ich glaube aktuell nicht, dass es ein 2. DHCP ist. Du hast ja geschrieben, dass das Phänomen immer nur von kurzer Dauer ist. Könnte dies die Dauer eines Neustarts eines deiner Switche / APs sein? Ist es evtl. möglich, dass eins dieser Geräte neustartet und dann alle Geräte dahinter nicht erreichbar sind? Vielleicht sogar ein Wackelkontakt am Kabel oder Netzteil defekt? Autoupdate mit Neustart?

Wie häufig tritt das Problem denn auf, könnte man mal Langzeit-Ping-Tests starten?

Gruß
Mitglied: BlueBook
BlueBook am 12.05.2021
Danke sehr für Deine Ideen!

Einige Dinge können dann doch auch mal ganz einfach sein.
Das mit dem DHCP Server ausschalten war wirklich ganz leicht in der FritzBox, als auch der Test der IP.
Leider (wie man es sehen möchte) hast Du recht - keine IP - kein zweiter DHCP - nun gut.

Der Ping-Test ist auch eine super Idee, um das Problem systematisch anzugehen - perfekt!
Das bekomm ich sogar noch halbwegs unaufwändig hin - ich schau mal und melde mich wieder dazu - das Dauert jetzt aber ein Weilchen.

Ein Hardware-Defekt ist natürlich auch eine Variante.
Ein Wackelkontakt - ggf. - wobei es ja eigentlich nicht so viele bewegliche Teile sind.
Man weiß es nicht.
Ich bin sehr gespannt auf den Ping-Test.

Merkwürdig ist, dass sogar die Tablets im WLAN betroffen sind.
Das würde also auf eine Leitung zwischen Router und AP hindeuten - oder auf eines der Bauteile.
Wir warten es ab - spekulieren bringt nix.

Bisher ist es gefühlt 2-3 mal die Woche der Fall mit unterschiedlichen Geräten - also eher selten - aber man bekommt es ja auch schlecht aktiv mit, wenn irgendein Gerät mal 3-4 Min. nicht erreichbar ist - nur wenn man es gerade aktiv nutzt...
Aufgefallen ist das Problem daher bisher bei Tablets(WLAN), Überwachungskameras(LAN) und Laptops(WLAN/LAN)

Melde mich spätestens denk ich in 1-2 Wochen wieder.

Viele Grüße
BB
Mitglied: BlueBook
BlueBook vor 26 Tagen
Hallo zusammen,

ich hab folgendes nun eine Woche ausgewertet:

pingletzte7tage - Klicke auf das Bild, um es zu vergrößern

Ich habe bewusst, keine Wartungstätigkeiten in der letzten Woche gemacht, um die Auswertung nicht zu stören.

Man sieht, dass die Ausfälle doch selten anscheinend sind. (Zumindest laut dem Ping-Log)
Die Werte sind übrigens vollständig - jedes Gerät wird jede Minute einmal angepingt - nur es werden nicht alle Ergebnisse, wenn diese
gleich sind, gespeichert. Unterschiedliche Ergebnisse werden gespeichert.

Ab und zu scheint mein mein NAS1 nicht erreichbar zu sein, welches auch den DNS-Server bereitstellt.
Das wäre natürlich unglücklich und würde Folgefehler nach sich ziehen - die ich teilweise meine ich so schon hatte.
Hier verstehe ich nicht wie es dazu kommt, dass der Ping nicht ankommt - die Geräte (NAS2 hat die Ping-Überwachung durchgeführt) hängen am gleichen Switch...
Selbst bei einer Vollauslastung des NAS1, funktioniert der Ping noch.
Das kann ich mir so nicht erklären.

Die Cam_West war einmal nicht erreichbar. Auch das Verhalten hatte ich ab und zu schon bemerkt.
Den Grund kann ich hier nicht sehen. Laut Log der Cam, sieht es wie ein Neustart aus - warum auch immer... (AutoUpdate ist off)

Spannender ist der hintere Ausfall:

kurzfristigerausfall - Klicke auf das Bild, um es zu vergrößern

Hier waren sogar mehrere Geräte betroffen.

Physikalisch hängen diese aber an verschiedenen Stellen.
Deshalb kann ich so schwer einen Zusammenhang finden.
Es macht aus meiner Sicht keinen Sinn, selbst falls ein Kabel/Link (warum auch immer) DOWN ist (wie gleich weiter unten vermutet), warum dann meine "photovoltaik", welche am Anfang des Netzes(Fritzbox) hängt, davon betroffen ist.


In den Logs zum Ausfall, konnte ich dem Asus etwas abgewinnen:
May 21 18:32:26 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link DOWN.

Und erst 8 Stunden später!

May 22 02:25:07 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link UP at 100 mbps full duplex
May 22 02:25:27 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link DOWN.
May 22 02:25:29 kernel: eth1 (Ext switch port: 0) (Logical Port: 8) (phyId: 8) Link UP at 100 mbps full duplex

Wenn ich nur dem Log glaube, wäre ja der Port vom 21.5 18 Uhr - 22.5 um 2 Uhr down gewesen.
Das fällt mir schwer zu glauben, da dies die Hauptverbindung zwischen dem Asus-AP und dem L2-Switch und dementsprechend auch zum Internet ist.
Wenn 8 Stunden per WLAN kein Internet mehr zur Verfügung gestanden hätte - wäre das hier kritisch vor Ort geworden.
Vielleicht hat das "schlaue" Asus-AI-Mesh dies über WLAN kompensiert - leider kann ich dies nicht in den Logs sehen.
Theoretisch wäre dies möglich gewesen. Wenn dem so wäre, wäre ich beeindruckt vom Asus-AI-Mesh.
Mein Ping zum Asus-Router ist weiterhin durchgegangen, also irgendwie ist dieser durchgekommen.

Ich werden den Ausfall wahrscheinlich die Tage noch einmal manuell nachstellen und "schauen" was dann passiert. So gut man das "einfach" sehen kann.

Zumindest habe ich jetzt einen ersten Verdächtigen.
Ein Kabel, welches leider fest verbaut(Unterputz), 15m lang und quer durch die Wohnung geht.

Ich werde es weiter "tracken" und im Auge behalten.
Ich werden bei Zeit noch einmal alle Steckverbindungen prüfen.

Falls jemand zu anderen Schlüssen/Vermutungen/Ideen kommt, gerne her damit :) face-smile
Gerade auch zur Erreichbarkeit des NAS1 - da fehlt mir noch jede Idee.

Gruß
BB
Mitglied: CyborgWeasel
CyborgWeasel vor 23 Tagen
Kannst du mal ein Schema von deinem Netzwerk posten? Also welcher AP an welchem Switch hinter welchem Router hängt? Ist sonst schwierig was dazu zu sagen...
Mitglied: BlueBook
BlueBook vor 17 Tagen
@CyborgWeasel
Danke für Deine Hilfe - du hast vollkommen das richtige Gespür gehabt!

Und ich hätte es nicht vermutet.

Nachdem ich den Fehler zeitlich eingrenzen konnte, hab ich eine Zeugenbefragung durchgeführt.
Der Router steht bei uns im Vorratsschrank und zuerst war ich wohl selbst um ca. 18.30 Uhr daran und gegen 2.20 Uhr nachts noch mal meine Frau.
Nach der Info war irgendwie klar: wirklich ein "Wackelkontakt".

Wobei ich das Gefühl hatte, dass das betroffene Kabel gut sitzt.
Finden konnte ich den Wackelkontakt nicht direkt.
Aber nachdem das Kabel jetzt in einem anderen Port im Router sitzt -
kein einziges Ping-Problem mehr!

Vielen Danke an dieser Stelle noch einmal an alle!
Gruß
BB
Heiß diskutierte Beiträge
Administrator.de Feedback
Neue Administrator Version
FrankVor 1 TagInformationAdministrator.de Feedback58 Kommentare

Hallo User, heute Nacht haben wir Release 5.9 unserer Seite veröffentlicht. Diese bringt ein paar grundlegende Neuerungen für unsere User mit sich: Die Suche nach ...

Backup
Backupstrategie
Xaero1982Vor 1 TagFrageBackup38 Kommentare

Nabend Zusammen, wir bekommen es ja leider alle immer wieder mal mit, dass es auch große Firmen gibt, die von irgendwelchen Verschlüsselungstrojanern verseucht werden. Aktuell ...

Windows 10
Windows 11 Vorabversion aufgetaucht
NixVerstehenVor 1 TagTippWindows 1020 Kommentare

Auf Deskmodder.de ist ein Bericht über eine im Netz aufgetauchte Vorabversion von Windows 11 aufgetaucht. Der Bericht: Deskmodder.de - Windows 11 Vorabversion Bericht Download der ...

Internet Domänen
Domaine Join via VPN
SpryceeVor 1 TagFrageInternet Domänen4 Kommentare

Hallo, ich bin gerade dabei die namen einiger rechner umzubenennen dabei verwende ich ein Powershell script welches auf dem rechner ausgeführt wird. Jetzt gibt es ...

Windows Server
Durchgeschliffener Drucker funktioniert auf dem Server nicht
Disse1987Vor 1 TagFrageWindows Server12 Kommentare

Hallo zusammen, wieder einmal muss ich mich an euch wenden da wir mit unserem Latein am Ende sind. Seid ein paar Tagen hat eine Kundin ...

Hardware
PC und Monitor über Entfernung verbinden
gelöst ben1300Vor 12 StundenFrageHardware14 Kommentare

Guten Morgen :) folgende IST Situation: Ich habe einen Gaming PC, welchen meine Freundin gerne nutzt, z.B. für das "legendäre" Spiel Sims 4 ;) Normalerweise ...

Windows Server
Auf Active Directory Benutzer und Computer von Windows 10 zugreifen
RealThoreVor 1 TagFrageWindows Server9 Kommentare

Hallo zusammen, da wir in der Abteilung (10 Leute) uns regelmäßig um die RDP Sessions auf unseren DCs (2012 R2) prügeln, wolle ich mal nachfragen, ...

Sicherheit
Windows Server und Callback Server
gelöst samreinVor 1 TagFrageSicherheit4 Kommentare

Moin zusammen, heute Nacht wurde unser öffentlicher IP Addressbereich angegriffen. Auf einem Windows 2016 Gateway Server der ausschliesslich über Port 443 erreichbar ist sprang sogar ...