alf008
Goto Top

Netzwerk Performance? - Teilweise hohe Ping Antwortzeiten

Hallo,

folgendes Problem:

Maschine 192.168.1.1 ist unsere Hauptarbeitsmaschine.
Wenn man diese von diversen Clients anpingt erhält man Ping Zeiten von <1ms und dann ab und zu dazwischen >1000ms. 1-2 Pakete später hat es sich wieder normalisiert. Dies stellt sich als kurze "Freezer" auf den Clients dar.
Problem besteht nicht in einem zweiten Netz (192.168.20.0), welches wir an eine weitere Netzwerkschnittstelle der Maschine angeschlossen haben.

Problem von dem ersten Netz tritt auch auf bei Zugriff von außen via VPN.

Netzwerk ist ein Gigabit Netzwerk, Switche sind nicht managebar, Clients sind zum Großteil Windows 7 SP1.

Was ich brauche sind Anreize zur Lösungsfindung, da wir nach diversen Switch tauschen, Virenscannen langsam nicht mehr wirklich weiter wissen.
Ich wäre euch sehr dankbar für jede Art von Hilfe!
Sollte ich etwas vergessen haben an Angaben, lasst es mich bitte wissen!

Danke schon mal face-smile

Content-ID: 240058

Url: https://administrator.de/contentid/240058

Ausgedruckt am: 23.11.2024 um 05:11 Uhr

108012
108012 04.06.2014 um 16:13:59 Uhr
Goto Top
Hallo,

Maschine 192.168.1.1 ist unsere Hauptarbeitsmaschine.
Ist das ein Server, ein Router, eine Firewall, oder was ist das?

Problem besteht nicht in einem zweiten Netz (192.168.20.0),
Ist da einfach nur weniger los?

Problem von dem ersten Netz tritt auch auf bei Zugriff von außen via VPN.
Ist die Firewall oder Router eventuell zu schwach oder unterdimensioniert?
Keine VPN Hardware Unterstützung?

Netzwerk ist ein Gigabit Netzwerk,
OK

Switche sind nicht managebar,
Kann man ja ändern in dem man neue kauft.

Clients sind zum Großteil Windows 7 SP1.
Und der andere teil ist bitte was?

Virenscannen langsam nicht mehr wirklich weiter wissen.
Wo ist der Virenscanner langsam?
Auf der Firewall oder den PCs?
Oder auf einem Proxy?

Gruß
Dobby
Alchimedes
Alchimedes 04.06.2014 um 16:24:59 Uhr
Goto Top
Hallo

Wie sieht es den unter den clients mit den Ping Zeiten aus ?

Gruss
Anton28
Anton28 04.06.2014 um 17:02:29 Uhr
Goto Top
Hallo,

mach erst mal eine Skizze, was ist wo angeschlossen.
Dann verrate uns, welche Anwendung auf dem Arbeitstier läuft.
Ist das eine strukturierte Verkabelung ?
Wie alt ?
Sind die Clients und der Server auf autoneg oder fix eingestellt?

Gruß

Anton
Lochkartenstanzer
Lochkartenstanzer 04.06.2014 aktualisiert um 19:57:40 Uhr
Goto Top
Zitat von @alf008:

Maschine 192.168.1.1 ist unsere Hauptarbeitsmaschine.

Die Kiste ist nicht zufällig ein Router?

Wenn man diese von diversen Clients anpingt erhält man Ping Zeiten von <1ms und dann ab und zu dazwischen >1000ms. 1-2
Pakete später hat es sich wieder normalisiert.

Dann soltest Ihr die Kiste mit der IP-Adresse 192.168.1.1 mal durchchecken, ob die zwischendurch erhöhte Last hat. denn wenn die switche spinnen würden, hätte man eher paketverluste (oder habt Ihr gar Paketverluste?)

Hänge mal eineen client direkt ohen switch an die "Hauptmasdchine" und schau mal wie sich dann die Pings verhalten.

Und lasse auf der "hauptmaschine eien sniffer mitlaufen, um zu sehen, wann welche pakete durchlaufen.

lks
alf008
alf008 05.06.2014 um 08:30:21 Uhr
Goto Top
Zitat von @108012:

Hallo,

> Maschine 192.168.1.1 ist unsere Hauptarbeitsmaschine.
Ist das ein Server, ein Router, eine Firewall, oder was ist das?

Ist ein Server, SunOS 5.10

> Problem besteht nicht in einem zweiten Netz (192.168.20.0),
Ist da einfach nur weniger los?

Ja, da ist weniger los weil wir nur erstellt haben um zu sehen wie es sich da verhält. (So konnten wir den Server ausschließen)

> Problem von dem ersten Netz tritt auch auf bei Zugriff von außen via VPN.
Ist die Firewall oder Router eventuell zu schwach oder unterdimensioniert?
Keine VPN Hardware Unterstützung?

Wenn ich mir die Statistik unserer Firewall anschaue hat die nicht wirklich viel zu tun - schließe ich also erstmal aus.

> Netzwerk ist ein Gigabit Netzwerk,
OK

> Switche sind nicht managebar,
Kann man ja ändern in dem man neue kauft.

> Clients sind zum Großteil Windows 7 SP1.
Und der andere teil ist bitte was?

Noch alte XP, welche aber Zeitnah ausgetauscht werden.

> Virenscannen langsam nicht mehr wirklich weiter wissen.
Wo ist der Virenscanner langsam?
Auf der Firewall oder den PCs?
Oder auf einem Proxy?

Meine Satzstellung war falsch/ verwirrend... ich meinte dass wir u.a. nach Virenscan nicht mehr weiter wissen wo wir anfangen sollen.

Gruß
Dobby

Lochkartenstanzer
Lochkartenstanzer 05.06.2014 aktualisiert um 08:43:03 Uhr
Goto Top
Zitat von @alf008:

> Zitat von @108012:
>
> Hallo,
>
> > Maschine 192.168.1.1 ist unsere Hauptarbeitsmaschine.
> Ist das ein Server, ein Router, eine Firewall, oder was ist das?
>
Ist ein Server, SunOS 5.10


Einfach mal mit mpstat, sdterfmeter, top, snoop, etc. "spielen" und schauen, was da passiert. ich vermute mal, daß da ein prozess kurzzeitig sich viele Ressourcen krallt und daher die Antwortzeit in den Keller geht.

Hast Du denn irgendwelche packet losses?

SunoS 5.10/Solaris 10 ist ja schon 9 Jahre alt. Wie alt ist denn die Kiste selbst? kann es sein, daß da gerade die Hardware einige Aussetzer hat?

lks
alf008
alf008 05.06.2014 um 09:25:03 Uhr
Goto Top
Zitat von @Lochkartenstanzer:

> Zitat von @alf008:
>
> > Zitat von @108012:
> >
> > Hallo,
> >
> > > Maschine 192.168.1.1 ist unsere Hauptarbeitsmaschine.
> > Ist das ein Server, ein Router, eine Firewall, oder was ist das?
> >
> Ist ein Server, SunOS 5.10
>

Einfach mal mit mpstat, sdterfmeter, top, snoop, etc. "spielen" und schauen, was da passiert. ich vermute mal, daß
da ein prozess kurzzeitig sich viele Ressourcen krallt und daher die Antwortzeit in den Keller geht.

Hast Du denn irgendwelche packet losses?

SunoS 5.10/Solaris 10 ist ja schon 9 Jahre alt.
Wie alt ist denn die Kiste selbst? kann es sein, daß da gerade die Hardware einige Aussetzer hat?

lks

Also Speicher hat die Maschine 32GB, in anderen Standorten wo das selbe System zum Einsatz kommt sind teilweise nur 4 oder 8 GB verbaut.
Mit top haben wir schon oft geschaut, also Idle ging noch nie unter 70%.
Wenn da mal ein Prozess viel CPU nutzt dann entspricht das vielleicht mal 5%...
Lochkartenstanzer
Lochkartenstanzer 05.06.2014 aktualisiert um 09:42:54 Uhr
Goto Top
Zitat von @alf008:

Also Speicher hat die Maschine 32GB, in anderen Standorten wo das selbe System zum Einsatz kommt sind teilweise nur 4 oder 8 GB
verbaut.
Mit top haben wir schon oft geschaut, also Idle ging noch nie unter 70%.
Wenn da mal ein Prozess viel CPU nutzt dann entspricht das vielleicht mal 5%...

Dann schau mal mit snoop, wie schnell auf die ICMP-Pakete geantwortet wird. wenn da tatsächlich 1000ms zustandekommen, müßte man das sogar "mit bloßem Auge" sehen können.

Außerdem könnte es immer noch die IO-Last sein und nicht dioe CPU-Last. Hier sind ein paar hints.

habt ihr mal evrscuht nur mit einer maschine/client und einer direktverbindung den fehler zu reproduzieren oder ist das eine Produktivmaschine die man nicht für 15 Minuten zum testen mal offline nehmen kann?

lks

PS: Auch bei Solaris tut ein reboot manchmal gut, selbst wenn es nur alle 10 Jahre sind. face-smile
alf008
alf008 05.06.2014 um 09:53:23 Uhr
Goto Top
Zitat von @Lochkartenstanzer:

> Zitat von @alf008:
>
> Also Speicher hat die Maschine 32GB, in anderen Standorten wo das selbe System zum Einsatz kommt sind teilweise nur 4 oder 8
GB
> verbaut.
> Mit top haben wir schon oft geschaut, also Idle ging noch nie unter 70%.
> Wenn da mal ein Prozess viel CPU nutzt dann entspricht das vielleicht mal 5%...

Dann schau mal mit snoop, wie schnell auf die ICMP-Pakete geantwortet wird. wenn da tatsächlich 1000ms zustandekommen,
müßte man das sogar "mit bloßem Auge" sehen können.

Außerdem könnte es immer noch die IO-Last sein und nicht dioe CPU-Last.
Hier sind ein paar hints.

habt ihr mal evrscuht nur mit einer maschine/client und einer direktverbindung den fehler zu reproduzieren oder ist das eine
Produktivmaschine die man nicht für 15 Minuten zum testen mal offline nehmen kann?

lks

PS: Auch bei Solaris tut ein reboot manchmal gut, selbst wenn es nur alle 10 Jahre sind. face-smile

Lese mich gerade ein bzgl "snoop". Dazu also später mehr...

Letzt Reboot ist glaube nen Monat oder so her ;) Ist also erst "frisch" durch gestartet face-smile