Netzwerkausfall
Hallo
Hab da ein Problem und bräuchte vorschläge wie ich noch nach einer lösung suchen könnte.
Ich betreue ua ein schulnetzwerk mit ca 200 PCs und notebooks und einen Hauptserver 2003 der auch die adressen vergiebt und 7 klassenserver 2003.
das problem ist dass das netzwerk sporadisch (manchmal 5 mal am tag, manchmal gar nicht) ausfällt. dann kann kein pc den anderen oder einen server erreichen (nicht mal anpingen). durch aus und eischalten der switches kan das problem gelöst werden und danach läuft das gesammte netzwerk uu. für tage wieder einwandfrei. es müssen aber nicht alle switches dafür neu gestartet werden, aber immer andere.
habe alle server upgedatet und auch schon einige switches testweise durch einen neuen ersetzt - ohne erfolg
was könnte der grund für solche ausfälle sein? währe für jede anregung dankbar um die fehlersuche einzugrenzen.
danke im voraus...
Hab da ein Problem und bräuchte vorschläge wie ich noch nach einer lösung suchen könnte.
Ich betreue ua ein schulnetzwerk mit ca 200 PCs und notebooks und einen Hauptserver 2003 der auch die adressen vergiebt und 7 klassenserver 2003.
das problem ist dass das netzwerk sporadisch (manchmal 5 mal am tag, manchmal gar nicht) ausfällt. dann kann kein pc den anderen oder einen server erreichen (nicht mal anpingen). durch aus und eischalten der switches kan das problem gelöst werden und danach läuft das gesammte netzwerk uu. für tage wieder einwandfrei. es müssen aber nicht alle switches dafür neu gestartet werden, aber immer andere.
habe alle server upgedatet und auch schon einige switches testweise durch einen neuen ersetzt - ohne erfolg
was könnte der grund für solche ausfälle sein? währe für jede anregung dankbar um die fehlersuche einzugrenzen.
danke im voraus...
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 82673
Url: https://administrator.de/contentid/82673
Ausgedruckt am: 22.11.2024 um 19:11 Uhr
14 Kommentare
Neuester Kommentar
Morgen.
Naja, die Infos sind etwas spährlich. Was hast Du seither gemacht/geprüft?
Behalten die Clients Ihre IP-Adressen, wenn das Problem auftritt bzw. können Sie diese neu beziehen? Oder wird die Verbindung physikalisch getrennt (keine Netzwerkverbindung mehr vorhanden)?
Hast Du die Konfiguration der Switche mal gepüft? Wie sieht es da mit der Firmware aus?
Und, wichtige Frage, seit wann tritt es auf und gibt es Änderungen, die kurz vor Auftreten des Problemes durchgeführt wurden? Ich vermute hier die Ursache weniger in den Servern denn in den Switchen bzw. Netzwerkseitig.
Was sagen die die Eventlogs auf den Maschinen und auf den Servern?
Auf was hast Du die PINGs gesendet? Name oder IP? Wenn Ping auf Name nicht funktioniert, Ping auf IP aber doch, wäre die Ursache im DNS zu suchen.
Naja, die Infos sind etwas spährlich. Was hast Du seither gemacht/geprüft?
Behalten die Clients Ihre IP-Adressen, wenn das Problem auftritt bzw. können Sie diese neu beziehen? Oder wird die Verbindung physikalisch getrennt (keine Netzwerkverbindung mehr vorhanden)?
Hast Du die Konfiguration der Switche mal gepüft? Wie sieht es da mit der Firmware aus?
Und, wichtige Frage, seit wann tritt es auf und gibt es Änderungen, die kurz vor Auftreten des Problemes durchgeführt wurden? Ich vermute hier die Ursache weniger in den Servern denn in den Switchen bzw. Netzwerkseitig.
Was sagen die die Eventlogs auf den Maschinen und auf den Servern?
Auf was hast Du die PINGs gesendet? Name oder IP? Wenn Ping auf Name nicht funktioniert, Ping auf IP aber doch, wäre die Ursache im DNS zu suchen.
Vermutlich sind das Billigswitches und du fährst kein Spanning Tree.
Nach deinen in der Tat sehr rudimentären Schilderungen (kein Netzdesign, VLANs ja oder nein, Verschaltung der Switches) kann man dir auch nur sehr oberflächlich helfen.
Vermutlich looped (Layer 2 Loop) dein Netz durch Nichtverwendung von Spanning Tree oder Fehlkonfiguriation einiger Endkomponenten.
Der Loop bedeutet dann 99% Auslastung auf den Switches und dann ist klar das nichts mehr funktioniert.
Ohne detailiertere Infos ist eine sinnvolle Hilfestellung nicht möglich wenn das nicht in Raten oder Wahrsagen ausarten soll...
Nach deinen in der Tat sehr rudimentären Schilderungen (kein Netzdesign, VLANs ja oder nein, Verschaltung der Switches) kann man dir auch nur sehr oberflächlich helfen.
Vermutlich looped (Layer 2 Loop) dein Netz durch Nichtverwendung von Spanning Tree oder Fehlkonfiguriation einiger Endkomponenten.
Der Loop bedeutet dann 99% Auslastung auf den Switches und dann ist klar das nichts mehr funktioniert.
Ohne detailiertere Infos ist eine sinnvolle Hilfestellung nicht möglich wenn das nicht in Raten oder Wahrsagen ausarten soll...
Ja, da hat aqui absolut recht.
Check mal zuerst die Firmware der Switche und lass uns die Typenbezeichnungen wissen.
Eine kleine Beschreibung (gern Visio und dann als PDF oder JPG) über die Netzstruktur wäre auch ganz gut.
Und Vorsicht mit SpanningTree, daß kann auch nach hinten losgehen.
Nehmen wir als Beispiel zwei Gebäudehälften, welche über 1xKupfer oder 1xLWL verbunden sind. Wenn dann auf beiden Seiten eventuell gestackte Switches vorhanden sind, kann die SpanningTree das ganze LAN zum Kippen bringen, weil keine Redundanz vorhanden ist.
Aqui hat mit evtl. 99% Last recht, daß kann gut sein; aber bitte nicht einfach SpanningTree im Switch aktivieren, ohne daß die Voraussetzungen dafür da sind.
Gruss Jan
Check mal zuerst die Firmware der Switche und lass uns die Typenbezeichnungen wissen.
Eine kleine Beschreibung (gern Visio und dann als PDF oder JPG) über die Netzstruktur wäre auch ganz gut.
Und Vorsicht mit SpanningTree, daß kann auch nach hinten losgehen.
Nehmen wir als Beispiel zwei Gebäudehälften, welche über 1xKupfer oder 1xLWL verbunden sind. Wenn dann auf beiden Seiten eventuell gestackte Switches vorhanden sind, kann die SpanningTree das ganze LAN zum Kippen bringen, weil keine Redundanz vorhanden ist.
Aqui hat mit evtl. 99% Last recht, daß kann gut sein; aber bitte nicht einfach SpanningTree im Switch aktivieren, ohne daß die Voraussetzungen dafür da sind.
Gruss Jan
Du hast recht, wie ich schon sagte!
Aber STP setzt redundante Leitungen voraus. Wenn die nicht da sind, steigert STP die Last und die Latenzzeiten.
Aber es ist natürlich immer abhängig von der Netzwerkarchitektur.
Ich wollte nur vorbeugen, daß nicht blauäugig STP aktiviert wird und es keine Verbesserung sondern eher eine Verschlechterung bewirkt, weil das Netzwerk nicht entsprechend aufgebaut ist.
Schauen wir erstmal, was condor83 sagt. Ihm wollen wir ja erstmal helfen, und dafür benötigen wir INFOS.
Gruss Jan
Aber STP setzt redundante Leitungen voraus. Wenn die nicht da sind, steigert STP die Last und die Latenzzeiten.
Aber es ist natürlich immer abhängig von der Netzwerkarchitektur.
Ich wollte nur vorbeugen, daß nicht blauäugig STP aktiviert wird und es keine Verbesserung sondern eher eine Verschlechterung bewirkt, weil das Netzwerk nicht entsprechend aufgebaut ist.
Schauen wir erstmal, was condor83 sagt. Ihm wollen wir ja erstmal helfen, und dafür benötigen wir INFOS.
Gruss Jan
@bluecolors
Oha...nun bewegst du dich aber auf sehr dünnem Eis. Zwei Dinge zur sachlichen Korrektur da man die o.a. Statements technisch so nicht ganz stehenlassen kann:
STP setzt natürlich niemals per se ein redundantes Netz voraus, das ist Unsinn ! Es funktioniert natürlich auch ohne Leitungs Redundanz, da nur Packete gesendet werden, ist aber dann ohne redundante Links gewissermaßen funktionell sinnlos.
Es beugt aber immer der latenten Gefahr vor das bei einer Fehlkonfiguration oder falschem Stecken von Kabeln das Netz kollabiert und sorgt so dafür das niemals ein Loop entstehen kann !
Ein Grund warum alle Premium Hersteller von Switches grundsätzlich auf ihren Layer 2 Switches STP per Default immer eingeschaltet haben !
Aktiviertes STP bewirkt folglich niemals eine Verschlechterung der Performance weder in redundanten noch in nicht redundanten Netzen !!!
STP steigert nur minimal die Last. STP BPDU Packete kommen alle 3 Sekunden mit 64 Byte Länge. Minipackete die also in heutigen Strukturen mit GiG Backbones absolut irrelevant sind und niemals ins Gewicht in puncto Performance fallen. Der Sicherheitsaspekt von STP ist da erheblich höher zu bewerten !!
Die Latenzzeit eines Switches ist niemals von externen Protokollen und/oder Features wie Z.B. STP bestimmt, sondern immer durch die verwendete Hardware eine Switches. Auf die Latenz hat also STP niemals einen Einfluss das ist technisch nicht möglich !!!
Ok, dann sind wir mal gespannt was der condor83 dann noch so für Infos für uns hat...
Oha...nun bewegst du dich aber auf sehr dünnem Eis. Zwei Dinge zur sachlichen Korrektur da man die o.a. Statements technisch so nicht ganz stehenlassen kann:
STP setzt natürlich niemals per se ein redundantes Netz voraus, das ist Unsinn ! Es funktioniert natürlich auch ohne Leitungs Redundanz, da nur Packete gesendet werden, ist aber dann ohne redundante Links gewissermaßen funktionell sinnlos.
Es beugt aber immer der latenten Gefahr vor das bei einer Fehlkonfiguration oder falschem Stecken von Kabeln das Netz kollabiert und sorgt so dafür das niemals ein Loop entstehen kann !
Ein Grund warum alle Premium Hersteller von Switches grundsätzlich auf ihren Layer 2 Switches STP per Default immer eingeschaltet haben !
Aktiviertes STP bewirkt folglich niemals eine Verschlechterung der Performance weder in redundanten noch in nicht redundanten Netzen !!!
STP steigert nur minimal die Last. STP BPDU Packete kommen alle 3 Sekunden mit 64 Byte Länge. Minipackete die also in heutigen Strukturen mit GiG Backbones absolut irrelevant sind und niemals ins Gewicht in puncto Performance fallen. Der Sicherheitsaspekt von STP ist da erheblich höher zu bewerten !!
Die Latenzzeit eines Switches ist niemals von externen Protokollen und/oder Features wie Z.B. STP bestimmt, sondern immer durch die verwendete Hardware eine Switches. Auf die Latenz hat also STP niemals einen Einfluss das ist technisch nicht möglich !!!
Ok, dann sind wir mal gespannt was der condor83 dann noch so für Infos für uns hat...
Auch da hat Aqui wieder recht.
STP setzt die Redundanz nicht zwingend voraus. Macht aber damit eigentlich nur Sinn, da über die Redundanz auch verschiedene Pfade durch STP ermittelt werden können, wovon der schnellste Pfad zu einem Ziel dann auch gewählt wird.
Nehmen wir aber jetzt als Beispiel zwei Gebäudeteile (oder mehr), welche per LWL oder Kupfer (von mir aus GB) verbunden sind. In jedem Gebäude ist ein "Haupt"-Switch untergebracht. Nun ergibt sich daraus ein Backbone, an dessen beiden Seiten nun wiederum weitere Switche gestackt sind. In ungünstigen Konstellationen und willkürlich aktiviertem STP kann es dazu kommen, daß die Ermittlung des schnellsten Pfades einen deutlichen Zeitaufwand darstellt. Dieser Zeitaufwand kann zu Verzögerungen im Netzwerk (und Latenz heisst nichts anderes als Verzögerung) führen. Dies tritt aber meist nur bei Änderungen im Netzwerk auf bzw. in der Lernphase.
Aber, Aqui, ich gebe Dir natürlich in Deinen Ausführungen recht.
Ich kann hier nur aus recht kurzen Erfahrungen sprechen, wobei ich denke, daß Du als Senior-Admin doch schon einiges auf dem Buckel hast.
Grüße Jan
P.S. Ach ja, condor, wir widmen uns Dir umgehend, sobald ein paar Infos mehr da sind.
STP setzt die Redundanz nicht zwingend voraus. Macht aber damit eigentlich nur Sinn, da über die Redundanz auch verschiedene Pfade durch STP ermittelt werden können, wovon der schnellste Pfad zu einem Ziel dann auch gewählt wird.
Nehmen wir aber jetzt als Beispiel zwei Gebäudeteile (oder mehr), welche per LWL oder Kupfer (von mir aus GB) verbunden sind. In jedem Gebäude ist ein "Haupt"-Switch untergebracht. Nun ergibt sich daraus ein Backbone, an dessen beiden Seiten nun wiederum weitere Switche gestackt sind. In ungünstigen Konstellationen und willkürlich aktiviertem STP kann es dazu kommen, daß die Ermittlung des schnellsten Pfades einen deutlichen Zeitaufwand darstellt. Dieser Zeitaufwand kann zu Verzögerungen im Netzwerk (und Latenz heisst nichts anderes als Verzögerung) führen. Dies tritt aber meist nur bei Änderungen im Netzwerk auf bzw. in der Lernphase.
Aber, Aqui, ich gebe Dir natürlich in Deinen Ausführungen recht.
Ich kann hier nur aus recht kurzen Erfahrungen sprechen, wobei ich denke, daß Du als Senior-Admin doch schon einiges auf dem Buckel hast.
Grüße Jan
P.S. Ach ja, condor, wir widmen uns Dir umgehend, sobald ein paar Infos mehr da sind.
@bluecolors
Du meinst ein redundantes Netzwerk wie dieses hier als Beispiel, richtig ?!?:
Nebenbei bemerkt ist dies ein Design wie man Netzwerke solcher Größenordnung wie condor83 es beschreibt auch technisch umsetzt. Vermutlich sieht es aber nach seiner Problemschilderung anders aus...
Mit willkürlichem STP meinst du sicher nicht sauber konfiguriertes STP, oder ? Ja, da hast du Recht. Die Bridge Priority muss auf den beiden Core Systemen entsprechend gesetzt werden, das diese beiden Maschinen immer die Root- und Backup Root Bridge sind ! Das ist ein einfaches Kommando.
Dann gibt es in einem Netzwerk auch keine Unterbrechungszeiten für eine Neuberechnung der Spanning Tree Hierarchie.
Heute gibt es aber RSTP (Rapid Spanning Tree, 802.1w) Eine kompatible Weiterentwicklung des klassischen STP Protokolls. Hier hast du Neubrechnungszeiten von weit unter einer Sekunde, so das dies nichtmal in VoIP Netzen zu einer Unterbrechnug führt. Damit ist so ein Verhalten auch Geschichte...
Als Latenz bei Switches bezeichnet man gemeinhin die Laufzeit eines Packetes durch die Hardware des Switches von einem Port zum anderen. Latenz ist im Umfeld von STP so in der Bedeutung nicht gebräuchlich.
So nun aber der Condor...
Du meinst ein redundantes Netzwerk wie dieses hier als Beispiel, richtig ?!?:
Nebenbei bemerkt ist dies ein Design wie man Netzwerke solcher Größenordnung wie condor83 es beschreibt auch technisch umsetzt. Vermutlich sieht es aber nach seiner Problemschilderung anders aus...
Mit willkürlichem STP meinst du sicher nicht sauber konfiguriertes STP, oder ? Ja, da hast du Recht. Die Bridge Priority muss auf den beiden Core Systemen entsprechend gesetzt werden, das diese beiden Maschinen immer die Root- und Backup Root Bridge sind ! Das ist ein einfaches Kommando.
Dann gibt es in einem Netzwerk auch keine Unterbrechungszeiten für eine Neuberechnung der Spanning Tree Hierarchie.
Heute gibt es aber RSTP (Rapid Spanning Tree, 802.1w) Eine kompatible Weiterentwicklung des klassischen STP Protokolls. Hier hast du Neubrechnungszeiten von weit unter einer Sekunde, so das dies nichtmal in VoIP Netzen zu einer Unterbrechnug führt. Damit ist so ein Verhalten auch Geschichte...
Als Latenz bei Switches bezeichnet man gemeinhin die Laufzeit eines Packetes durch die Hardware des Switches von einem Port zum anderen. Latenz ist im Umfeld von STP so in der Bedeutung nicht gebräuchlich.
So nun aber der Condor...
Wenn du wenigstens den Hersteller der Switches weisst (Steht meistens vorne drauf !), dann ist doch das Beschaffen von Handbüchern über die Herstellerseite kein Problem, oder ? Das weiss man doch auch ohne lange in der IT Branche zu sein, oder ? (Dr. Google ist dein Freund wie immer...)
Es tut auch nichts zur Sache ob du ein redundantes System realisieren kannst oder nicht. Für eine Schule ohne die Anforderung an ein sicheres Netz ist das ja auch mehr oder weniger irrelevant. Aus Sicht der Stabilität und Störbarkeit durch experimentierfreudige Schüler aber nicht !!
Vermutlich stecken Schüler ein Loop oder experimentieren mit Karteneinstellungen rum die das Netz kollabieren lassen.
Letztlich kann man dir aber nur raten dich schnellstens über die Topologie des Netzes und Einstellungen der Switches zu informieren und wenigstens eine Minimaldokumentation anzufertigen.
Ohne solche Grundlage ist doch alles wie das Blicken in eine Kristallkugel... was letztlich zu nix führt als Raterei aber nicht zur Lösung deines Problems....
Es tut auch nichts zur Sache ob du ein redundantes System realisieren kannst oder nicht. Für eine Schule ohne die Anforderung an ein sicheres Netz ist das ja auch mehr oder weniger irrelevant. Aus Sicht der Stabilität und Störbarkeit durch experimentierfreudige Schüler aber nicht !!
Vermutlich stecken Schüler ein Loop oder experimentieren mit Karteneinstellungen rum die das Netz kollabieren lassen.
Letztlich kann man dir aber nur raten dich schnellstens über die Topologie des Netzes und Einstellungen der Switches zu informieren und wenigstens eine Minimaldokumentation anzufertigen.
Ohne solche Grundlage ist doch alles wie das Blicken in eine Kristallkugel... was letztlich zu nix führt als Raterei aber nicht zur Lösung deines Problems....