fairdv
Goto Top

Keine externe Netzwerkverbindung mehr SBS2011

Guten Tag,

ich habe ein sehr seltsames Problem mit unserem SBS2011 Server (HP Proliant ML350, 8-Kern CPU, 24GB Ram).
Vorab: Der Internetzugang wird über einen Lancom 1724 gewährleistet. Die Telekom hat nun mehrmals die Leitung durchgemessen und den Port gewechselt.

Das Problem: Am Tag kommt es seit 1 Monat plötzlich zu längeren Verbindungsproblemen ins Internet. Die Pingzeiten verändern sich von 56ms auf bis zu 3000ms und natürlich timeouts.
Das seltsame ist, wenn ich das Netzwerkkabel des SBS Servers vom Switch entferne, ändern sich die Antwortzeiten für die Clients wieder auf 56ms ins Internet. Dies ist völlig unabhängig vom DNS Dienst. Ich pinge beispielsweise von einem Client (WIN7) eine externe IP Adresse an(Direkt über den Lancom Router (Gateway)) und habe diese furchtbaren Antwortzeiten. Ziehe ich nun das Netzwerkkabel des Servers, habe ich nach ca. 10sek. wieder normale Antwortzeiten.
Die Netzwerkkarte und das Kabel des Servers, sowie den Switch und den Lancom-Router habe ich schon getauscht, dies brachte keine Veränderung. Der Server selber hat während der Störung höchstens 0,43% Netzwerkauslastung (Anbindung lediglich 100Mbit, die DSL Leitung hat 6 Mbit). Ein interner Ping wird sofort mit <1ms beantwortet und ist völlig unabhängig vom Auftreten des Fehlers.
Es ging gestern z.B. von 8:00 bis 9:20Uhr ab da bis 11:12 nicht mehr und dann wieder bis ca. 15:10Uhr.
Heute Morgen arbeite ich z.B. über Fernwartung einwandfrei auf dem Server von 6:50Uhr bis 7:28Uhr. Plötzlich werden die Eingaben immer langsamer und weg ist der Server.
Zusätzlich ist es immer möglich, den Lancom Router über seine externen IP Nummer anzupingen, es wird also nur der Downstream gestört.

So langsam bin ich ziemlich ratlos und hoffe auf den einen oder anderen Tipp.

Ratsuchende Grüße

Frank

Content-ID: 202590

Url: https://administrator.de/contentid/202590

Ausgedruckt am: 25.11.2024 um 14:11 Uhr

keine-ahnung
keine-ahnung 01.03.2013 aktualisiert um 08:21:18 Uhr
Goto Top
Zitat von @Fairdv:
Moin,
ich habe ein sehr seltsames Problem mit unserem SBS2010 Server (HP Proliant ML350, 8-Kern CPU, 24GB Ram).
logisch: der SBS 2010 war ein Schrottprodukt und ist daher von MS nicht in den Handel gestellt worden. Wahrscheinlich hast Du ein frühes alpha-release im Einsatz face-wink
Das Problem: Am Tag kommt es seit 1 Monat plötzlich zu längeren Verbindungsproblemen ins Internet.
Interessant wäre zu wissen, wie sich das LAN dann verhält ...
Das seltsame ist, wenn ich das Netzwerkkabel des SBS Servers vom Switch entferne, ändern sich die Antwortzeiten für die
Clients wieder auf 56ms ins Internet.
Das ist nicht seltsam, das ist interessant!
Dies ist völlig unabhängig vom DNS Dienst.
Woher weisst Du das?

So, jetzt das übliche:
Was sagen die event-logs im Server (Anwendung/System/DNS)?. Wie sind die DNS-/DHCP-Einstellungen im LAN? Wieviele NIC sind im Proliant verbaut (4+ILO?)? Wieviele stehen davon dem SBS zur Verfügung? Was setzt Du für einen Switch ein? Ist die Verkabelung strukturiert? Wer hat die LANCOM-Firewall konfiguriert? Läuft die Firewall auf dem SBS?

LG, Thomas
Fairdv
Fairdv 01.03.2013 um 08:53:56 Uhr
Goto Top
Hallo Thomas,

nach der langen Nacht habe ich mich etwas vertan. Esa ist ein SBS2011. Ich habe das oben auch gleich korrigiert.

Zuerst die Fragen, die ich aus dem stehgreif beantworten kann:
1. Lancom Router ist von mir konfiguriert worden. Es läuft auch seit über 1 Jahr reibungslos. Fehler ist erstmals im Januar aufgetreten, da aber nur sehr sporadisch. Im Moment ist es halt so schlimm, dass ein arbeiten gar nicht möglich ist.

2. Die Firewall auf dem SBSläuft, Virenschutz ist Kaspersky Antivirus 10. Enterprise.

3. Switch habe ich seit gestern einen HP Procurve, vorher einen Level one

4. DNS ist der SBS server. DHCP ebenfalls.

5. Ich habe auf einem Client einfach nur Gateway (Lancom) und externen DNS eingetragen, trozdem keine Kommunikat### mehr mit extern, wenn ich die Servernic anschließe. Geht mittlerweile innerhalb 2 sek.

6. Verkabelung ist einfach strukturiert, läuft schon seit über 3 Jahre.

7. Die Ereignissanzeigen sind bis auf Fehler des Sharepointdienstes und den typischen Fehlermeldungen, wenn ich das Netzwerkkabel abziehe, sauber.

8. Der Proliant hat standardmäßig 2 NICS. Ich ahbe einen neue Netzwerkkarte eingebaut und die alten beiden deaktiviert.

Gruß

Frank
keine-ahnung
keine-ahnung 01.03.2013 aktualisiert um 09:15:38 Uhr
Goto Top
Hi Frank,

soweit ok. Der SBS hat nur eine NIC zur Verfügung, alle anderen sind auf der Büchse deaktiviert. Warum bietest Du dem Client einen externen DNS-Server an? Was ist das für ein ProCurve? Was ist das für eine Netzwerkkarte? Lass auch mal im LAN-Monitor die Firewall des LANCOM ein paar Stunden mitschreiben, obwohl mir das tatsächlich eher nach einem Problem mit dem Server-NIC respektive der LAN-Konfiguration ausschaut. Treiber für den NIC sind zertifiziert und aktuell?

Lass mal den SBS BPA + dcdiag über die Kiste laufen, eventuell bekommen wir dort noch Hinweise ...

LG, Thomas

Tante Edith fragt noch: irgendwelche Schleifen zwischen switches im Netz hast Du aber nicht eingebaut?
Fairdv
Fairdv 01.03.2013 um 09:12:08 Uhr
Goto Top
Hallo Thomas.

lass die Analyse neu durchlaufen und danach dcdiag.
Den externen DNS habe ich nur genommen, da ich mir echt nicht erklären kann, wie der Server die Internetverbindung killt. Protokoll auf dem Lancom lass ich auchmitschneiden.
Außerdem läuft nun ein Rechner mit Whireshark.

Ich melde mich wieder.

Gruß

Frank
keine-ahnung
keine-ahnung 01.03.2013 um 09:18:37 Uhr
Goto Top
Ja, viel Spass und Glück face-wink.

Guck auch noch mal über das LAN, ob da nicht irgendwelche Switches miteinander Broadcast-Sturmspiele veranstalten können. ML350 mit zwei internen NIC klingt jetzt auch nicht nach dem allerfrischesten Modell, eventuell auch mal die Hardeware checken (RAM).

LG, Thomas
Fairdv
Fairdv 01.03.2013 um 09:35:04 Uhr
Goto Top
Hallo thomas,,
BPA ist alles ok.

Aber es gibt eine neue Erkenntnis.
Wenn ich den DNS Dienst beende, geht sofort der Ping nach extern wieder durch. Starte ich den DNS ist er nach 10sek. wieder weg.
Dumme Frage: Kann ich den DNS Dienst auf dem SBS Server einfach mal deinstallieren und neu installieren?? Auf einem Server2008R2 ohne den KlimBim hätte ich da wenig Skrupel.

Gruß

Frank
keine-ahnung
keine-ahnung 01.03.2013 um 09:55:30 Uhr
Goto Top
Na, da sind wir etwas näher am Problem dran. Und Du hast keine Einträge im DNS-log??

Ich würde ja als Laie jetzt zunächst mal gucken, was da im DNS unrund läuft? Mal mit nslookup anfangen, dcdiag, Zonen durchgucken ...

Die Idee, auf dem SBS den DNS mal eben in die Tonne zu treten, halte ich eher für nicht so gelungen ...

LG, Thomas
Fairdv
Fairdv 01.03.2013 um 13:42:36 Uhr
Goto Top
Ist verrückt.
Jetzt sitz ich hier schon 1 Stunde mit einem gestarteten Ubuntu um mal zu schauen ob es was mit der Kombination WIN7 - Server 2008R2 zu tun hat und der Fehler tritt im Moment einfach nicht auf. Jetzt ist bestimmt wieder bis 15:00 Uhr alles gut und dann von vorne.
DCDIAG = alles bestens!! BPA = Alles bestens. Eventlogs o.k. Lancom alles bestens (keine Fehler). Obwohl ich jetzt schon den Verdacht habe, dass der DNS eventuell zu viele offene Sitzungen zum Router produziert, der dann eventuell von einem DOS ausgeht ?? Ich werd sobald das Problem auftritt hier mal den DOS Schutz deaktivieren.

Ganz ehrlich, zur Not installier ich auch einen neuen SBS2011 und mach mir die Arbeit des Transfers, aber das geht mir gegen die Berufsehre. Jetzt hab ich es ja schon so gut eingegrenzt, natürlich drängelt der Kunde. Schnell muss es gehen und zur Not neu....

Gruß

Frank
Fairdv
Fairdv 01.03.2013 um 16:33:59 Uhr
Goto Top
Wie befürchtet, um 14:38 fing der Spuk wieder an und hält seit dem auch an. Warum immer so temporär? Es gibt keine mir bekannten Dienste, die zusätzlich gestartet werden und somit in Verbindung mit dem DNS das Problem verursachen außer eventuell der Exchange server mit seinen Querys?
Ich hab nun alles mögliche getestet, wenn ich den DNS Dienst stoppe hört kurze Zeit danach der Spu kauf. Jedoch im Leistungsprotokoll keine Übermäßigen Verbindungen, keine events im DNS log. Es könnte natürlich ein Dienst sein, der über den DNS Verbindungen öffnet, aber dass müsste ich doch im Leistungsprotokoll bei den DNS Anfragen oder zumindestens in IPv4 sehen. Da ist aber nix aufälliges.
Aktive sessions gibt es nur 2 interne (der Server selber).
Kaspersky aktualisiert und scanne lassen, auch nichts.
So langsam gehen mir die Möglichkeiten aus.
Wireshark zeigt auch nichts.
Brummel

Gruß

Frank
iDiddi
iDiddi 01.03.2013 aktualisiert um 23:46:24 Uhr
Goto Top
Ich hatte mal einen ähnlichen Fall. Da war es der WLAN-Router (Fritzbox), der noch zusätzlich im Netz hang. Sobald der aus war, ging es wieder.

Was hast Du noch alles für NW-Geräte im LAN?

Wie ist denn die Verbindung der Clients zum Server, wenn das Problem auftritt? Können die auf den Server weiterhin zugreifen?
Fairdv
Fairdv 02.03.2013 um 09:06:12 Uhr
Goto Top
Hallo,

alle anderen Netzwerkgeräte hab ich schon abgehängt.
Die Verbindung der Clients zum Server ist bestens. Netzwerklast des Servers geht auch nur auf maximal 1,9% bei 100Mbit full duplex wenn das Problem auftritt. Datentransfer intern auch kein Problem.
Da ich gestern Abend nicht mehr via Fernwartung zugreifen konnte, habe ich heute morgen (da geht es dann lustiger weise wieder) erst einmal den Wireshark neu angeschmissen und schreib nun bis Mittags mit.
Werde auf einer zweiten Maschine mal die Datensicherung einspielen und schauen, ob es eventuell doch an irgend einem Hardwareproblem liegt. Das seltsame ist , dass es mal sehr lange ausfällt, dann nur eine halbe Stunde, dann wieder ein paar Stunden nicht ....... Ich hoffe ich sehe wenigstens was im Capturefile.
Interessant ist im übrigen auch, dass das Problem im Grunde vor 3 Wochen schon aufgetreten ist, der Telekomtechniker die TAE Dose ausgetauscht hat und dann war eine Woche Ruhe!! Da bin ich auch noch von einem Leitungsproblem ausgegangen. Nur hat die TAE Dose nichts mit dem DNS zu tun face-wink

LG

Frank
keine-ahnung
keine-ahnung 02.03.2013 um 12:41:44 Uhr
Goto Top
Zitat von @Fairdv:
Hi,
das sieht schon paradox aus.
Nur hat die TAE Dose nichts mit dem DNS zu tun
Wer weiss face-wink?

Obgleich ich den Eindruck habe, das der ProLiant schon einige Jährchen auf dem Buckel hat, klingt mir das irgendwie eher doch nicht nach einem Hardewareproblem --> warum sollte das ausschliesslich den DNS-Dienst betreffen, die Kiste aber ansonsten weiterlaufen und nichts mitloggen ...?

Aber Versuch macht kluch face-wink

Was mir gerade noch einfällt ...: ist das IPv6 korrekt auf dem neuen NIC und im DNS korrekt konfiguriert? Und wer ist der ISP?

LG, Thomas
Fairdv
Fairdv 05.03.2013 um 08:21:02 Uhr
Goto Top
Hallo Thomas,

Problem ist nach einem langen Wochenende "gelöst".
Eine genaue Netzwerkanalyse ergab
1. Der Server hat unendlich viele bad Cheksum Pakete erzeugt. Da ich eine neue Netzwerkkarte verbaut hatte, habe ich vergessen die Prüfsummensteuerung für RX-TX zu deaktivieren. Dies brachte schon einmal eine Menge Lasteinsparung.
2.Gab es sehr viele Angriffsversuche von extern auf den Server (USA, China). Ich habe daraufhin die Firewall getauscht und die IDS Regeln verschärft. Dies brachte erneut Bandbreite und Ruhe auf der Leitung.

Nun läuft es seit Sonntag stabil.

danke für die Tipps.

Gruß

Frank