syncmaster
Goto Top

Warum starten einige unserer Switches mehrmals am Tag neu

Wir haben seit kurzem das Problem, daß einige unserer 3Com Switches (SS4400 und SS4900) einfach mal so durchstarten und das mehrmals pro Tag.

Nachdem die Neustarts anfänglich alle 2-3 Minuten auftraten, habe ich nach Geräten gesucht, die dieses Phänomen verursachen. Ich konnte auch einen Server feststellen und ihn aus dem Netz nehmen. Nun passieren die Neustarts nur noch 2-3 mal pro Tag.

Da bei einem Neustart des Hauptswitches das gesamte Netz kurzfristig steht, ist dies äußerst ärgerlich. Vor allem auch deshalb, weil auch noch die Telefonanlage mit VoIP über das Netzwerk läuft.

Wie kann ich herausfinden, woran die Neustarts liegen? Kann vielleicht einer der teueren Switches defekt sein und wie stelle ich das fest?

Wäre schön, wenn mir jemand helfen könnte.

Gruß

Content-ID: 42438

Url: https://administrator.de/contentid/42438

Ausgedruckt am: 22.11.2024 um 10:11 Uhr

frost3006
frost3006 18.10.2006 um 08:03:09 Uhr
Goto Top
Guten Morgen Syncmaster,

Ob der Switch defekt ist lässt sich relativ einfach feststellen indem du ihn temporär durch einen anderen ersetzt sollte es dann weiterhin Netzwerkneustarts lag es schonmal nciht am Switch. Sollte es nciht am Switch selber liegen würde ich mal nachschauen ob die Kabel (besonders Strom) alle in Ordnung sind. Wenn das alles nicht Hilft kann es immerncoh an einem der Server liegen das er sich evtl falsche Einstellungen gezogen hatt oder irgendwelche Dienste ihren Geist aufgeben
cykes
cykes 18.10.2006 um 09:14:04 Uhr
Goto Top
Hi,

ich würde die Verkabelung noch einmal durchgehen, ob sich nicht irgendwelche Schleifen
in der Verkabelung befinden. Sind in letzter Zeit neue Geräte eingefügt worden?
Danach mal die Server Logs durchgehen, ob irgendwelche Hardwarefehler in bezug auf die Netzwerkkarten gemeldet werden.
Wenn sich dort nichts findet, würde ich das Netz mal von einem Elektriker, der sich damit auskennt, durchmessen lassen.

Gruß

cykes
syncmaster
syncmaster 19.10.2006 um 01:39:00 Uhr
Goto Top
Hallo,

mein Problem liegt eben genau an der Tatsache, wie ich heraus bekomme, welches Gerät spinnt. Die Verkabelung kann abgehakt werden. Wir haben das Netzwerk durchgemessen und konnten weder Defekte Kabel noch fehlerhafte Patches feststellen. Außerdem ist das Problem aus dem Nichts heraus aufgekommen.

Das mit dem Tausch der Switche ist so eine Sache! 1000 MBit Switche mit LWL Anschlüssen in Layer 3 Technik legt man sich nicht einfach auf Lager. Die kosten auch heute noch richtig Geld.

Vielleicht hast Du noch einen Tip zur Fehlersuche. Vielleicht eine günstige und gute Software zur Protokollanalyse und Aufzeichnung.

Gruß

Syncmaster
syncmaster
syncmaster 19.10.2006 um 01:41:58 Uhr
Goto Top
Hallo cykes,

die Sache mit der fehlerhaften Verkabelung kann man ausschließen, da wir das Netz gemessen haben. Hardwarefehler wurden keine gemeldet. Alle User können nochmal arbeiten.

Vielleicht hast Du noch einen Tip zur Fehlersuche. Vielleicht eine günstige und gute Software zur Protokollanalyse und Aufzeichnung.

Gruß

Syncmaster
Metzger-MCP
Metzger-MCP 19.10.2006 um 10:02:24 Uhr
Goto Top
Ja my starten denn alle Biester nach und nach dur ? nur einige ? ...

Versuche mal folgendes... Da du ja sowieso schon starke Netzprobs hast, kommt es auf ein paar wenige auch nicht mehr an oder ? Ich kenne eure Verkabelung nicht, aber ich nehme an das du auch Patchfelder und Verteilerschränke hast. Klemme doch einfach mal jede Section ab, so das du Verteilergruppen hast. Dann kannst du ja erkennen welche Gruppe die Probleme verursacht. Somit kannst du ja die Fehlerquellen eingrenzen und ...

Wünsche viel Erfolg, helfen könnte ggf auch die Protokolle bei den managbaren Switchen auszuwerten.

MFG Metzger
syncmaster
syncmaster 19.10.2006 um 11:05:53 Uhr
Goto Top
Hallo,

anhand der Meldugen, die uns die Switches schicken, startet ein Switch (Hauptswitch) komplett durch. Das mit der empierischen Ermittlung ist so eine Sache. Einen Rechner konnte ich auf diese Weise ermitteln. Da danach die Zeitabstände für die Neustarts aber im Breich von 7-9 Stunden liegen, hört es hier mit der empierischen Ermittlung auf (denke ich).

Gruß

Syncmaster
Metzger-MCP
Metzger-MCP 19.10.2006 um 11:28:23 Uhr
Goto Top
Da wirst du Recht haben. Aber wenn du doch weist wann das wieder der Fall sein sollte kannst du ja da mal dein Augenmerk darauf richten.

Selbsverständlich kann natürlich sein das der Switch ( Hauptswitch ) ne Macke hat. Ohne Ersatz kannst du da aber wenig machen da es sich ja um ein LWL Switch handelt.

MFg Metzger
flashsurface
flashsurface 19.10.2006 um 18:42:59 Uhr
Goto Top
Hallo zusammen,


um welche Switches handelt es sich denn ? Könntest du ggf. ein Auszug aus dem Logfile vom Switch posten ?

Gruss

Michael
syncmaster
syncmaster 20.10.2006 um 03:24:02 Uhr
Goto Top
Hallo,

bei den Switches handelt es sich um 3COM Superstack 3 4900 und 4400. Die beiden Hauptswitches, wovon einer häufig bootet, sind SS4900. Eine Logdatei kann ich Dir leider nicht bieten, da ich keine gefunden habe.

Gruß

Syncmaster
flashsurface
flashsurface 20.10.2006 um 15:33:20 Uhr
Goto Top
Die Superstack-Serie hat nur ein Menü-basierendes Telnet-Interface sowie Webinterface welches aber keine logs erstellt (soweit mir bekannt), ggf. kann via SNMP etwas ausgelesen werden.

Wir hatten mal zig 1100/3300 SuperstackII im Einsatz, da gabs mit diversen SW-Versionen Probleme, die 2.69 lief dann realtiv stabil, daher ggf. SW-update durchführen.
Was auch problematisch war: Mgnt.-IPs auf einzelne Geräte konfiguriert und diese dann (irrtümlich) gestackt. Im Regelfall sollte ja einer Stackmaster sein, und die anderen IPs deaktiviert werden, aber je nach SW Vers. war dem nicht so.....

Die geschilderten Sympthome lassen keine genaue Ursachen-Forschung zu, aber prüfe dennoch mal ob Spanning ordnungsgemäss konfiguriert ist. Desweiteren würde ich alle verbunden Geräte auf den gleichen Release-Level der Software ziehen.

Gruss

Michael
Webegen
Webegen 08.11.2006 um 19:40:07 Uhr
Goto Top
Hallo,
überprüfe doch einmal genau die Counters der einzelnen Interfaces, auf dem Switch der neustartet!

Überprüfe auch die config der einzelnen interfaces.

Was noch zu checken wäre überprüfe die Mac-Address Tabel des Switches, zusätzlich häng dich an nem SW-Port mal mit Ethereal dran und lass mal mitloggen und prüfe ob das auch "normaler" Traffic ist.

mfg
andi