xpactor
Goto Top

Netzwerkausfälle eingrenzen, aber wie?

Hallo zusammen,

Ich bin auf der Suche nach einer Methodik Netzwerkausfälle einzugrenzen...

Bis jetzt habe ich Nagios in betriebgenommen. Erkenntnis: ein WLAN Router fällt immer vorher heraus...


back-to-topProblembeschreibung

In unserem Firmennetz haben wir teilweise Ausfälle, diese gestallten sich so, das der DC, sowie Exchange und TS für die Mitarbeiter nicht mehr erreichbar sind, ca. 20 Minuten lang, danach ist alles wieder okay.
Die Ausfälle kommen nicht periodisch vor, es kann sein, dass 2-3 Wochen alles gut geht und dann, in einer Woche alle 1-2 Tage Ausfälle vorkommen. Es sind auch keine besonderen Ereignisse (Reinigungskraft, Externe Mitarbeiter, Backups, oder Ähnliches) zur Zeit der Ausfälle geplant bzw. im Haus.


back-to-topBisher unternommene Massnahmen

back-to-topNagios
Nun habe ich als erste Massnahme Nagios in berieb genommen, damit ich das Netzwerk überwachen kann.
Dort ist mir aufgefallen das ein WLAN AP (WAP200) immer vor dem Netzwerkausfall ausfällt.

back-to-topNeue WLAN AP
In unserem Netzwerk habe ich in letzter Zeit zwei WAP200 WLAN APs von Linksys in betrieb genommen.


back-to-topKonfiguration

back-to-topWLAN
WAP200-1
  • Mode: AP
  • Verschlüsselung: WAP2/PSK
  • SSID: Netz1

WAP200-2

  • Mode: AP
  • Verschlüsselung: WAP2/PSK
  • SSID: Netz2

back-to-topNetzwerk
192.168.27.x/32 Netz

back-to-topMeine Rechner :
  • Windows Server 2008 als DC, DHCP, DNS
  • Windows Server 2008 mit Exchangeserver 2007 (Virtuell auf DC)
  • Windows Server 2008 mit TS (Virtuell auf DC)
  • 20 Clients (XP Pro)
  • ca. 20 VMs (Verschiedene Windows Versionen (2003 Server, XP Pro, Suse)
  • ca. 10 Entwicklungsserver (Verschiedene Windows Versionen (2003 Server, XP Pro, Suse)


back-to-topFragestellung

  • Kann es an diesem einen WLAN AP liegen das das Netzwerk nicht richtig funktioniert? Oder meint ihr es ist eine Fehlkonfiguration?
  • Nagios ist ja ein praktisches Tool zu analysieren, jedoch findet es keine Fehler... Gibt es ein Tool welches das Netzwerk nach Fehlkonfigurationen Scannt?

Ich wäre für jegliche Hilfestellungen und Ideen Dankbar.

Danke schon im Voraus,

Grüsse Mat

Content-ID: 127167

Url: https://administrator.de/forum/netzwerkausfaelle-eingrenzen-aber-wie-127167.html

Ausgedruckt am: 23.12.2024 um 08:12 Uhr

Iwan
Iwan 15.10.2009 um 11:20:20 Uhr
Goto Top
Hallo,

ich finde es gut, das die Formatierungshilfe so ausgiebig nutzt. Allerdings solltest du den Text noch mal Korrektur lesen, aber das nur am Rande.
Wenn die Möglichkeit besteht und den Verdacht hast, das dieser eine AP für die Ausfälle zuständig ist, dann tausch ihn doch mal aus.
Wie sieht es denn mit anderen LAN-Komponenten aus oder besteht eure Netzwerkstruktur nur aus diesen beiden APs?
Houben
Houben 15.10.2009 um 11:46:26 Uhr
Goto Top
Hallo,

schau doch mal mit Wireshark nach, ob du viele Broadcasts im Netz hast.
Xpactor
Xpactor 15.10.2009 um 12:00:40 Uhr
Goto Top
Danke erstmal für die schnelle Antwort.

Es ist so, das wir in einer langwierigen Migrationsphase von Windows Server 2003 auf Windows 2008 Server sind. Vor der Umstellung lief das Netzwerk problemlos. Wir haben uns zur Umstellung entschieden, weil der alte DC schon lange am Anschlag lief.
In dieser Migrationsphase wurde der DC neu aufgesetzt auf einem neuen Server mit Windows 2008. Es wurden ebenfalls die meisten Switches ersetzt. Da wäre noch zu erwähnen, dass der alte DC immer noch steht, kann es evtl. auch an dem liegen, das ich 2 DCs im Netz habe mit verschiedenen Domains?

Den WLAN AP habe ich zwar schon mehrmals für 2-3 Tage vom Netz genommen, ich hatte zwar in dieser Zeit keine Ausfälle, jedoch kann das auch nur Zufall sein, dass in dieser Zeit das Netzwerk Problemlos lief. Da ich den Ausfall nicht genau eingrenzen kann, auch Zeitlich nicht, will ich nicht einfach so einen neuen AP einkaufen, bevor ich nicht genau weiss, das dieser den Ausfall auslöst.
Woolfsmann
Woolfsmann 15.10.2009 um 14:47:04 Uhr
Goto Top
Hi,

du schreibst das Ihr auch die Switche getauscht habt.

Was sind das für neue Switche, und habt Ihr Spanning-tree Portfast aktiv?

Ich kann man an ein ähnliches Probelm erinnern, ist schon ein bisschen her damals war es ein Loop im Netz. Der auch immer nur Zeitweise zu ausfällen geführt hat.


gruß
Woolfsmann
Xpactor
Xpactor 15.10.2009 um 15:03:29 Uhr
Goto Top
Einerseits wurden die Switche in den Büroräumen gewechselt. Andererseits ein 16 Port Switch gengen einen 24 Port Switch, alle Switche sind unmanaged.

Wo kann ich das mit dem Spanning-tree Portfast überprüfen?

Jedoch hätte beim verkabeln ein Fehler passieren können, also Loops auf den Swich. Werde gleich noch alle Switche durchgehen.

@ Houben:

Bin gerade noch am Wireshark Studieren... werde mich melden sobald ich mehr weiss.
aqui
aqui 15.10.2009 um 15:24:37 Uhr
Goto Top
Deine Beschreibung ist ziemlich oberflächlich, denn du zählst mit sinnloser Formatierung (von den zig Dreckfuhlern mal ganz abgesehen die man hätte mit einem Klick auf "Bearbeiten" korrigiert) nur die Komponenten auf die im Netz vorhanden sind. Nicht aber die Infrastruktur selber.
Aus was besteht denn dein Netz ??
Aus einem einzigen billigen Taiwan Switch vom Blödmarkt...??
Oder einem redundanten Netzwerk wie sowas hier:
cbd02541153fdaf4376026b03fd512a5-switchnetz
Folglich kann man also nur raten ob es Redundanzprotokolle, der Switch, die Netzwerkkarte(n), das Kabel, die Dosen.... oder oder oder ist ?
Wo soll man mit deiner Beschreibung anfangen und aufhören.
Nagios ist da mehr ein dilletantischer Versuch... wenn der die ausgefallene Dienste zeigt weisst du ja nur das sie weg sind. Ob das an einem falsch gecrimpten Kabel liegt oder an einem Switch der kollabiert ist an Broadcast Stürmen oder Loops, oder am kaputten Netzteil vom Server siehst du ja noch lange nicht.....
Dafür brauchst du dann eher eine Kristallkugel denn ein Nagios ! Mit Wireshark und einem konsequenten Switchcheck bist du eher besser beraten, denn die Infrastruktur sollte dein erster Schritt sein um hier KEINE Fehler zu haben....alles ander sind immer Folgefehler davon, logisch !!
Woolfsmann
Woolfsmann 15.10.2009 um 15:26:45 Uhr
Goto Top
Wenn die Switche unmanaged sind kannst du auch kein Spanning-tree einstellen. Da must du in den Unterlagen der Switche gucken ob die das vielleicht mitbringen. Geh ich aber mal nicht von aus.

Guck dir die Switche an ob du was findest, wenn nicht könnte Houben's Tipp auch gut Helfen.

gruß
Xpactor
Xpactor 15.10.2009 um 17:34:11 Uhr
Goto Top
Da ich leider ein dilettant bin, was Netzwerke angeht, kann ich keine Grafik wie die obenstehende liefern.
Jedoch kann ich zusammentragen was im Netzwerk steht und hoffen das man damit was anfangen kann.

b13766b79d5fa189b93c3eb3d570179b-network

Mir ist auch bewusst das die Grundlage stimmen muss, damit man was Bauen kann. Es führen keine Kabel auf Switches zurück. Ebenfalls habe ich den WLAN AP heute abgehängt, hatte wieder Ausfälle im Netz, somit kann der WLAN AP ausgeschlossen werden.

Folgendes konnte ich beobachten:

  • Wenn ich wärend dem Ausfall auf dem DC die Netzwerkbrücke (2 Netzwerkkarten zusammengeschlossen) deaktiviere, den DHCP und DNS neustarte und die Netzwerkbrücke wieder aktiviere, geht es wieder.
aqui
aqui 15.10.2009, aktualisiert am 18.10.2012 um 18:39:40 Uhr
Goto Top
Warum ist es eigentlich so schwer KEINE externen Grafik Links zu benutzen ???
Adminstrator.de hat eine Funktion zum Uploaden von Bildern !!!

(Ursprungsthread oben mit "Bearbeiten" editieren, Bild hinzufügen anklicken, Bild hochladen, auf den URL mit einem Rechtsklick "alles markieren", nochmal und "Kopieren", Bild URL dann in die Antwort hier pasten.
Was ist daran so schwer..... ?? Wenns an sowas schon hapert, wie soll das denn erst beim Troubleshooting werden zu dem o.a. Problem ??!! )


Würg...wozu denn ein Netzwerkbrücke ??? Das ist dein Ursprungsproblem !!!
Wie man sowas richtig macht steht hier:

Routing von 2 und mehr IP Netzen mit Windows, Linux und Router

Setz das genau so um und dann bist du garantiert auf einen Schlag alle deine Probleme los !
Mit einer Netzwerkbrücke ganz bestimmt NICHT !
2hard4you
2hard4you 15.10.2009 um 22:42:22 Uhr
Goto Top
Moin,

also die Verbindungsausfälle beseitigt es sicher nicht - aber warum nimmst Du nen W2k8 als VM in nen W2k8, nur um TS zu spielen - datt kann der auch direkt

Gruß

24
Xpactor
Xpactor 17.10.2009 um 10:47:37 Uhr
Goto Top
Hallo aqui

Danke für den Hinweis mit dem Bild.

Die Netzwerkbrücke ist nicht dazu da 2 Netze zusammenzuführen, sonden die Netzwerkkarten zu "bündeln", also das ich 2 Netzwerkkarten habe, die auf eine IP hören. Weiss nicht ob dies der richtige Ansatz ist. Ich weiss aber zur Zeit keinen anderen, bzw. besseren.
aqui
aqui 17.10.2009, aktualisiert am 18.10.2012 um 18:39:42 Uhr
Goto Top
@Xpactor
Also ein NIC Teaming...richtig ??

Hast du dann alles berücksichtigt was hier steht:
Motherboard mit 2 Onboard LAN Anschlüssen
Traffic am Server auf 2 NICs verteilen
Kann man einen Server zur Performacesteigerung mit 2 Netzwerkkarten parallel an einem Switch betreiben? Wenn ja mit welcher Konfiguration ?
Bonding mit Broadcom - SLB
Link Aggregation - Frage zur Hash Configuration

Vermutlich machst du da einen groben Fehler was schon deine Beschreibung ganz schwer vermuten lässt !!
Eine Netzwerkbrücke ist kein Teaming oder eine Link Aggreagtion was du anstrebst !!
Wie gesagt eine Link Bündelung (Link Aggregation) heisst "Teaming" bei MS und muss zwingend auch auf der Switchseite konfiguriert werden !! Passiert das nicht, passiert das was in deinem Netz passiert, nämlich temporäre Loops und ein Ausfall des gesamten Netzwerks !
Lies dir die o.a. Threads genau durch und dann weisst du warum !! Das dort diskutierte sollten auch Laien verstehen !

Was du machst ist vollkommen falsch, vermutlich durch Unkenntniss der Verfahren und Protokolle, und führt bei dir im Netz zu temporären Loops die das Netz kollabieren lassen...
Ein typischer Fehler von Netzwerk Laien die nicht verstanndan haben was Bündelung, Teaming oder Link Aggregation ist, im Vergleich zu einer Netzwerkbrücke.
Das eine hat mit dem anderen rein gar nichts zu tun wie dir die o.a. Threads ja hoffentlich schnell klarmachen werden !!
Xpactor
Xpactor 19.10.2009 um 10:37:52 Uhr
Goto Top
Du hast recht, ich gehe da einen völlig falschen weg.

Ich wollte ein Teaming einrichten, eichfach mit dem Gedanken die Performance zu erhöhen. Dies habe ich wie @jadefalke (Traffic am Server auf 2 NICs verteilen) beschreibt, mit Markieren der NICs und "Verbindungen zusammenführen"...

Nun hatte ich am Samstag noch die Broadcom Treiber der NICs installiert. Damit ich im BACS (Broadcom Advanced Control Suit 3) ein Teaming einrichten kann, jedoch funktioniert danach im Netzwerk noch weniger als jetzt!

Ich hatte das folgende Problem:

Wenn ich auf einer VM den server anpingen wollte, sagte er mit die Adresse kann nicht gefunden werden, zeigt jedoch auf sich selbst! Beispiel:

ping 192.168.27.1
Antwort: 192.168.27.4 konnte nicht gefunden werden.

Ich habe nun wieder auf die MS "Netzwerkbrücke" umgestellt, da dies wenigstens einigermasen funktionier.

Da erhalte ich folgende IP Configuration.

C:\>ipconfig /all

Windows-IP-Konfiguration

   Hostname  . . . . . . . . . . . . : SERVER01
   Primäres DNS-Suffix . . . . . . . : Domain.local
   Knotentyp . . . . . . . . . . . . : Hybrid
   IP-Routing aktiviert  . . . . . . : Nein
   WINS-Proxy aktiviert  . . . . . . : Nein
   DNS-Suffixsuchliste . . . . . . . : Domain.local

Ethernet-Adapter Netzwerkbrücke:

   Verbindungsspezifisches DNS-Suffix:
   Beschreibung. . . . . . . . . . . : MAC Bridge Miniport
   Physikalische Adresse . . . . . . : 02-1E-C9-CD-05-F7
   DHCP aktiviert. . . . . . . . . . : Nein
   Autokonfiguration aktiviert . . . : Ja
   IPv4-Adresse  . . . . . . . . . . : 192.168.27.1(Bevorzugt)
   Subnetzmaske  . . . . . . . . . . : 255.255.255.0
   Standardgateway . . . . . . . . . : 192.168.27.2
   DNS-Server  . . . . . . . . . . . : 127.0.0.1
                                       81.221.250.10
   NetBIOS über TCP/IP . . . . . . . : Aktiviert

Tunneladapter Local Area Connection* 8:

   Medienstatus. . . . . . . . . . . : Medium getrennt
   Verbindungsspezifisches DNS-Suffix:
   Beschreibung. . . . . . . . . . . : Microsoft ISATAP Adapter
   Physikalische Adresse . . . . . . : 00-00-00-00-00-00-00-E0
   DHCP aktiviert. . . . . . . . . . : Nein
   Autokonfiguration aktiviert . . . : Ja

Tunneladapter Local Area Connection* 9:

   Medienstatus. . . . . . . . . . . : Medium getrennt
   Verbindungsspezifisches DNS-Suffix:
   Beschreibung. . . . . . . . . . . : Microsoft ISATAP Adapter #2
   Physikalische Adresse . . . . . . : 00-00-00-00-00-00-00-E0
   DHCP aktiviert. . . . . . . . . . : Nein
   Autokonfiguration aktiviert . . . : Ja

Tunneladapter Local Area Connection* 11:

   Medienstatus. . . . . . . . . . . : Medium getrennt
   Verbindungsspezifisches DNS-Suffix:
   Beschreibung. . . . . . . . . . . : Teredo Tunneling Pseudo-Interface
   Physikalische Adresse . . . . . . : 02-00-54-55-4E-01
   DHCP aktiviert. . . . . . . . . . : Nein
   Autokonfiguration aktiviert . . . : Ja

Habe ich das richtig verstanden, dass für ein Teaming ein managed Switch zwingend erforderlich ist?
Bzw. Sollte ich einfach über eine NIC gehen... sprich, die 2. deaktivieren?

Ausserdem habe ich am Samstag noch entdeckt das auf dem alten DC, welcher immer noch im eigenen Netz (192.168.1.x) steht der DNS noch aktiv ist. Diesen habe ich nun daektiviert.
aqui
aqui 19.10.2009 um 15:41:14 Uhr
Goto Top
Ja, eine Konfiguration des Switches auf dem die ge"Teamten" Links enden ist zwingend erforderlich damit es sauber funktioniert.
Das steht ja nun zuhauf auch in den o.a. Threads wenn du sie liest !
Die Funktion heisst 802.3ad, LACP oder wird oft auch "Trunking" genannt. Die ersten beiden Begriffe sind die technisch korrekten !
Ein managebarer Switch ist dafür zwingende Voraussetzung, denn du musst das ja auf den Switch Links konfigurieren !! (Wie sollte das bei einem doofen, ungemanagten Switch denn auch funktionieren der dieses Feature nicht supportet ?)
Mit doofen Switches vom Blödmarkt vom Grabbeltisch ist es definitiv NICHT zu machen.

Eine HP Konfiguration kannst du z.B. hier sehen:
Switch# conf t
Switch(config)# int eth 1-2, 5-6 lacp active
Switch(config)# wr m
Switch(config)# end

Das Kommando erzeugt einen 4fach gebündelten Link auf den Switchports 1 und 2 und 5 und 6 !
Bei anderen Herstellen geht das ähnlich oder über ein Web Konfig Interface mit Haken !

Deine o.a. Konfig hat immer noch die für dich tödliche Netzwerkbrücke aktiviert. Die muss definitiv raus, sonst werden deine Probleme nicht weniger !
Klar das auch ein richtiges Teaming auf Serverseite fehlschlägt wenn du den Switch nicht auf der anderen Seite konfigurierst !!
Auch das funktioniert definitiv NICHT !! Nur mit einem entsprechenden Switch der LACP / 802.3ad supportet !!
Xpactor
Xpactor 19.10.2009 um 16:27:24 Uhr
Goto Top
Sehr gut, oder eben nicht face-smile

Da wäre eine warnung von Windows noch schön! (aber eben)
Ich nehme die Brücke heute abend mal raus und werde die Lage weiterhin beobachten.
Ich hoffe, damit ist die Sache weg von Tisch!

Danke vielmals für die Hilfestellung!!! Wäre ohne euch nie darauf gekommen.
Xpactor
Xpactor 27.10.2009 um 09:02:56 Uhr
Goto Top
Das Netzwerk funktionier wieder einwandfrei.

Danke nochmals vielmals für die Hilfestellungen.

Gruss Mat