mexx
Goto Top

Datenverlust im Netzwerk richtig analysieren

Hallo,

wir registrieren seit geraumer Zeit einen Datenverlust in unseren Netzwerk und finden die Ursache nicht. Hier mal kurz ein paar Infos.

1x Windows2003 32Bit FS und Domäncontroller
4x Windows2003 32Bit Citrixserver
1x Windows2003 64Bit DB Server
diverse kleiner Server für weniger wichtige Aufgaben
1GBit/s Glasphaserverkabelung der Server und Switch über Backbone
zahlreiche Clients, Printserver, Printer und AP

Der Paketverlust tritt auf allen Servern auf und kann per Sniffer(Wireshark) erfasst werden. Hier einmal eine solche Meldung:

ms-wbt-server > 49183 [PSH, ACK] Seq=44831 Ack=1390 Win=64512 [TCP CHECKSUM INCORRECT] Len=796

Dieser Paketverlust führt zu Verbindungsabbrüchen der ICA-Sitzungen, zu mißglückten Laden von Richtlinien und und und.
Wie können wir diesen Datenverlust auf die Spur kommen?

Ich bin über jeden Tipp dankbar!

Content-Key: 88769

Url: https://administrator.de/contentid/88769

Printed on: April 23, 2024 at 19:04 o'clock

Member: predatorjaeger
predatorjaeger May 30, 2008 at 19:18:18 (UTC)
Goto Top
habt ihr euer netzwerk schon durchgemessen, um sischer zu gehen, dass keine leitung defekt ist? tritt der fehler bei allen servern auf? oder nur bei bestimmten clients , wenn sie mit bestimmten servern verbunden sind?
Member: aqui
aqui May 31, 2008 at 11:34:04 (UTC)
Goto Top
Was sagen denn die Interface Statistiken und die Buffer der Switches ???
Kommt es hier zu Packet Drops ggf. durch Ueberlast bei Broadcasts etc.

Leider schreibst du dazu rein gar nichts so das man nur wild raten kann was deine Infrastruktur anbetrifft.

Du solltest an den betroffenen Ports einmal eine Durchsatzmessung mit einem Tool wie NetIO oder IPerf machen um su checken ob es schon auf Infrastrukturbasis zu den Verlusten kommt also das Netz selber Schuld ist oder eben die Endgeraete !
Member: mexx
mexx Jun 02, 2008 at 08:25:04 (UTC)
Goto Top
Wir werden die Leitungen mal messen. Leider tritt der Fehler auf allen Servern auf.
Member: mexx
mexx Jun 02, 2008 at 08:37:08 (UTC)
Goto Top
Die Switche werden von einer anderen Firma verwaltet. Wir haben keinen Zugriff darauf. Aber die sind informiert und ich kann diese Daten mir mal schicken lassen.

Was interessant ist: Du solltest an den betroffenen Ports einmal eine Durchsatzmessung mit einem Tool wie NetIO oder IPerf machen um su checken ob es schon auf Infrastrukturbasis zu den Verlusten kommt also das Netz selber Schuld ist oder eben die Endgeraete !

Das werde ich mal ausprobieren? Wie geht das, was muss ich beachten?
Member: aqui
aqui Jun 03, 2008 at 09:16:16 (UTC)
Goto Top
Ganz einfach:

IPerf hier runterladen:
http://dast.nlanr.net/Projects/Iperf/ (Windows Binary)

Dann einen PC als IPerf Server starten mit iperf -s und einen anderen PC als IPerf Client starten mit iperf -c <server_ip>
Das zeigt dir dann die Performance zwischen diesen Switchports an. Durch entsprechend intelligente Wahl der Ports (ggf. auf unterschiedlichen Switches) kannst du so auch das Backbone des Netzes mit einbeziehen.

Analog funktioniert das mit dem NetIO Tool:

http://www.ars.de/ars/ars.nsf/docs/netio

Das Switches von einer externen Firma gewartet werden ist höchst bedenklich und eine fragwürdige Entscheidung. Abgesehen das das aus Datenschutzdingen ein Unding ist, habt ihr außerdem keinerlei Möglichkeit die korrekte Konfiguration und damit Funktion zu überprüfen, seit also blind und unwissend in dieser Beziehung.
Bei fast allen managebaren Switches gibt es die Möglichkeit wenigstens ein User/Passwort Paar einzurichten um Daten auf den Switches abzufragen ohne die Konfig zu beeinflussen.
Das wäre ein Minimum an Anforderung wozu ich den externen Dienstleister verdonnern würde das er das für euch einrichtet !!! Ein Wunder das eure IT Leitung sowas nicht zur Pflicht gemacht hat ??!!
Member: mexx
mexx Jun 03, 2008 at 13:18:28 (UTC)
Goto Top
Okay, jetzt mal unabhängig von allen Möglichkeiten, der Sache selber auf die Spur zu kommen, gibt es den extra Spezialisten, die einen da unterstützen können?

Bestes Beispiel:
Wir haben hier eine Citrixfarm mit LoadBalancing. Der DB-Server der Farm ist ein extra Server. Bis auf den Terminallizenzdienst hat der keine weiteren Aufgaben. Wenn ich den Sniffe, bekomme ich TCP CHECKSUM INCORRECT bei der Kommunikation mit den LoadBalancing Servern. Diese Server hängen alle an einen BackBone.

Es gibt ja nun viele Fehlerquellen.
Hardwaredefekt am BackBone, Glasphaserkabel, Netzwekkarten oder Server selbst oder
Softwaredefekt, besser gesagt eine unglückliche Konfiguration der Netzwerkkarte oder des Systems selbst.

Ich will jetzt nicht rumspielen. Konfigurationen ändern und rumbasteln. Da muss es doch Spezialisten geben, die damit Erfahrung haben?
Member: aqui
aqui Jun 04, 2008 at 11:07:16 (UTC)
Goto Top
Ja, klar. Jeder Systemtechniker eines guten Systemhauses das solche Geräte verkauft sollte das können. Die fehlerhaften Checksummen die einen gravierenden Fehler darstellen, deuten auf einen Fehler im betreffenden Endgerät hin nicht aber auf das Netz selber.
Die Infrastruktur des Netzes hat darauf keinen Einfluss, da sie an der Checksummenbildung nicht beteiligt ist und die auch für die Packetweiterleitung im Switch vollkommen irrelevant ist, da der Switch nur auf Layer 2 (Mac Adress Layer) arbeitet.

Lass also einen Citrix Techniker, der auch Ahnung von Netzwerken und Protokollen hat das prüfen und zeige ihm deine Sniffer Traces. Damit sollte der Fehler schnellstens behoben werden können !