dr.zeto
Goto Top

Iperf - Unterschiedliche Werte als Administrator und als Benutzer ?!

Hallo liebe Admin-Kollegen !

Ich habe hier in der Arbeit ein interessantes Problem, dem ich einfach nicht auf die Schliche komme.

Wir haben unser Netzwerk mit unterschiedlichen VLANs segmentiert. Innerhalb eines bestimmten VLAN (14er VLAN) habe ich nun 4 Clients,
deren User sich über mangelnde Geschwindigkeit unseres ERP-Systems beschwert haben. Zunächst wurde vermutet es könnte an den "neuen" gebrauchten Fujitsu Q920 liegen und dass diese zu langsam seien, doch da wir diese Rechner im gesamten Unternehmen ausgerollt haben und sich sonst niemand beschwert bisher hat, konnten wir das ausschließen. Nichts desto trotz haben wir die Systeme in der IT (0er VLAN) geprüft und konnten keine Geschwindigkeitseinbußen feststellen.

Sodann haben wir das physikalische Netzwerk in Verdacht gehabt, da hier am Standort schon der eine oder andere Fehler diesbezüglich gefunden wurde. Doch Überprüfung mit Pockethernet zeigt, dass hier keine defekte Leitungen oder Belegungsfehler vorliegen.

Eine Performance-Überprüfung mit iperf zeigte, dass nur rd. 240 Mbit über das Netzwerk fließen... 800/900 Mbit sind hier im Haus aber "normal".
Wir vermuteten schon, dass die Firewall, die alle VLANs kontrolliert hier irgendwie Bandbreite klaut, doch auch innerhalb des VLAN sind die iperf-Werte mies.
Bisher konnten wir herausfinden, dass

1. Bei de-aktiviertem Trendmicro Apex One die Performance auf immerhin rund. 400 Mbit steigt (Warum???)(Das ist aber ein anderes Thema...)

2. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Administrator ausführen die Performance rd. 900 Mbit erreicht.

3. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Benutzer ausführen, die Performance nur rd. 240 Mbit bzw. 400 Mbit erreicht, je nach dem ob Trendmicro Apex One aktiv oder inaktiv ist.

Die Frage die wir uns nun stellen ist, warum die Performance so massiv unterschiedlich ist, abhängig davon ob ich die Messung als Admin oder User ausführe.
Hat jemand von euch eine Erklärung?

Content-Key: 1212867113

Url: https://administrator.de/contentid/1212867113

Printed on: April 28, 2024 at 13:04 o'clock

Member: Dani
Dani Aug 31, 2021 at 08:54:20 (UTC)
Goto Top
Moin,
doch auch innerhalb des VLAN sind die iperf-Werte mies.
welche Clients/Server mit welcher Ausstattung sind in dein Testversuch eingebunden?
Hängen beide Geräte an selben Switch oder an unterschiedlichen?
Könnte es sein, dass bei Punkt 2) bzw. 3) das Netzwerk zufällig ausgelastet war?


Gruß,
Dani
Member: NordicMike
NordicMike Aug 31, 2021 at 09:02:47 (UTC)
Goto Top
2. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Administrator ausführen die Performance rd. 900 Mbit erreicht.

3. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Benutzer ausführen, die Performance nur rd. 240 Mbit bzw. 400 Mbit erreicht, je nach dem ob Trendmicro Apex One aktiv oder inaktiv ist.

Ihr solltet ihr nicht "einen der Clients" verwenden, sondern den "selben" Client. Dann könnt ihr den Rest schon mal ausschließen.
Member: aqui
aqui Aug 31, 2021 updated at 09:21:07 (UTC)
Goto Top
Benutzt du das alte iPerf oder iPerf3 ?? Empfehlung ist immer iPerf3 zu verwenden !:
https://iperf.fr/iperf-download.php
Um Messfehler ausschliessen zu können man mit einem zweiten Tool messen was ähnlich arbeitet z.B. NetIO:
https://web.ars.de/netio/
http://www.nwlab.net/art/netio/netio.html
Und einmal den Output beider Tools vergleichen. Das müsste immer annähernd gleich sind.
Generell musst du erstmal klären ob das Geräte bedingt ist oder Infrastruktur bedingt (Switches).
Member: dr.zeto
dr.zeto Aug 31, 2021 at 09:26:05 (UTC)
Goto Top
Die Tests haben wir zunächst auf allen Clients ausgeführt, da über das selbe Verhalten festgestellt wurde, haben wir dann einen bestimmten Client benutzt um weitergehend zu analysieren...
Member: dr.zeto
dr.zeto Aug 31, 2021 at 09:28:29 (UTC)
Goto Top
Mittlerweile haben wir einen baugleichen Q920 am Netzwerk angeschlossen und dort iperf erneut bemüht.
Das Verhalten ist das gleiche.
Member: aqui
aqui Aug 31, 2021 updated at 09:33:05 (UTC)
Goto Top
Wie gesagt...besser iPerf3 und zum Quercheck ein anderes Tool verwenden !

Häufiger Grund für so ein Verhalten sind die NIC Treiber und ganz besonders wenn man die Microsoft embeddeten Treiber verwendet. Das sollte man nie machen sondern immer die NIC Chipsatz Treiber direkt vom Chipsatz Hersteller verwenden.
Ideal für einen weiteren Crosscheck ist immer ein Live Linux wie z.B. Ubuntu usw. auf den betroffenen Rechnern zu booten und dort dann unter iPerf3 und/oder NetIO zu messen !
Sieh auch: Netzwerk Management Server mit Raspberry Pi
Member: dr.zeto
dr.zeto Aug 31, 2021 at 09:45:21 (UTC)
Goto Top
Ja, den Vorschlag unter Linux zu messen, nehme ich gerne mit.
iperf-Version unter Windows ist 3.1.3.

Die Clients en Detail:
Fujitsu Q920
i5-4590t
8 GB RAM
256 GB SSD
1 GBit Intel Ethernet Connection I217-LM

Alle Clients hängen am selben Switch

Die LAN-Treiber habe ich mittlerweile ausgetauscht gegen die, die Fujitsu zum Download angeboten hat.
Dies brachte bisher jedoch nicht das gewünschte Erfolgserlebnis...
Member: DerWoWusste
DerWoWusste Aug 31, 2021 updated at 09:49:21 (UTC)
Goto Top
Häufiger Grund für so ein Verhalten sind die NIC Treiber und ganz besonders wenn man die Microsoft embeddeten Treiber verwendet
NIC-Treiber arbeiten anderes für Admins als für User? Ich glaube, das können wir ausschließen.
Member: NordicMike
NordicMike Aug 31, 2021 at 10:08:48 (UTC)
Goto Top
Ich denke das kann nur ein Defender sein oder ein anderer Dienst, der als Administrator nicht startet.
Member: aqui
aqui Aug 31, 2021 updated at 10:11:29 (UTC)
Goto Top
So war das natürlich nicht gemeint. 😉
Es bezog sich pauschal auf die generelle Grundperformance bzw. Parameter Settings dieser Treiber. Ein typischer Grund ist das die Autonegotiation nicht sauber klappt. Z.B. bei Realtek basierten Karten eine typische Krankheit. Da kommt es dann zu Mismatches z.B. im Duplex Mode was in hohen Kollisionen resultiert und dann solche mickrigen Werte liefert. Mit den originalen Treibern ist sowas meist Geschichte.
Das solche Autonegotiation oder Durchsatz Werte für Admin oder Nutzer unterschiedlich sein sollen ist natürlich Quatsch sind steht außer Frage, da hast du natürlich absolut Recht !
Member: commodity
commodity Aug 31, 2021 at 10:56:08 (UTC)
Goto Top
Zitat von @NordicMike:
Ich denke das kann nur ein Defender sein oder ein anderer Dienst, der als Administrator nicht startet.

so klingt das für mich auch. Es spricht ja schon Bände, dass das Abschalten des TrendMicro zu so deutlicher Steigerung führt.
HW-Problem ist hier unwahrscheinlich wenn die Messung stimmt, denn die HW unterscheidet ja nicht zwischen Admin und Benutzer.
Also: Messung mit Linux (oder einfach nem aktuellen Rechner und nicht so einer alten Möhre, das kann schon reichen) verifizieren und dann an die Software auf den Rechnern machen - insbesondere nach Unterschieden zu den anderen Abteilungen suchen. Dazu das TrendMicro auf dem Testrechner vielleicht mal probeweise ganz deinstallieren. Solche Brems-Software iVm einer betagten CPU passt vielleicht sowieso nicht wirklich. Andererseits läuft es ja in den anderen Abteilungen offenbar, das ist natürlich irritierend. Habt Ihr ein Monitoring? Vielleicht kann man da auch Auslastungsunterschiede feststellen.

Viele Grüße, commodity
Member: dr.zeto
dr.zeto Aug 31, 2021 at 12:46:08 (UTC)
Goto Top
Ich habe nun nochmal einen Q920 mit Ubuntu Linux in das VLAN gestellt und darauf iperf getestet: Das gleiche Verhalten. Allerdings ist hier die Richtung ausschlaggebend gewesen:

Von meiner WS aus (0er VLAN) zum Linux-System (14er-VLAN) kam iperf auf rd. 450 MBit.
2021-08-31 14_43_54-gesendete elemente - stefan kraus - outlook

Umgekehrt, also von dem Linux System hin zu meinem PC kam iperf nur auf rd. 180 Mbit.
2021-08-31 14_44_13-gesendete elemente - stefan kraus - outlook

Ich habe dann innerhalb meines VLAN (0er) den Test wiederholt und erhielt Raten um ca. 800 Mbit.
2021-08-31 14_45_29-gesendete elemente - stefan kraus - outlook

Das sagt mir irgendwie, dass das Problem entweder mit dem Switch und/oder mit der Firewall zu tun hat, die die VLANs überwacht... oder wie seht ihr das?
Member: commodity
commodity Aug 31, 2021 updated at 14:31:29 (UTC)
Goto Top
Ich hatte Dich oben so verstanden, dass die Geschwindigkeitsdifferenz im selben Netz auftritt und der Unterschied dann auftritt, wenn man wechselnd zwischen Admin und User testet.

Dein obiges Testzenario 1 und 2 ist ein anderes, da geht der Traffic ja durch die (wie Du jetzt schreibst: ) Firewall. Du musst bei der Analyse jedenfalls trennen zwischen Traffic im selbem Netz und Traffic über die Netzwerkgrenzen.

Test 3 und 4 ist innerhalb des Netzes, da erreichst Du ja offenbar Eure Normalwerte.
Test 1 und 2 gehen über die Firewall, die bremst oftmals erstmal den Verkehr, das allein wäre nicht ungewöhnlich. Die Firewall überwacht vermutlich nicht nur, sondern routet vor allem auch die Vlans, oder?

Sehe ich das richtig, dass Deine oben beschriebenen Werte (400/200) aus Richtung des 0er Netzes gemessen wurden? Dann entspricht das ja den Linux-Ergebnissen und Du hast zwei Bremsen gefunden:
1. Firewall
2. Apex One

Warum das auf dem Rückwärtsweg nochmal deutlich langsamer ist als auf dem Hinweg? Zunächst ist vielleicht Deine WS leistungsfähiger als der Q920? Ob das eine (solche) Rolle spielen kann, kann @aqui oder andere erfahrene Kollegen vielleicht einschätzen, ich leider nicht. Wenn nicht würde ich auf einen Fehler der Konfig der Firewall tippen. Vielleicht macht die Route von 14 nach 0 auch noch irgendwo einen fehlkonfigurierten Schlenker oder durchläuft noch einen zusätzlichen Check?

Angehen würde ich das nun mit einem Test aus einer anderen Abteilung (also eine Seite wieder das 0er Netz, andere Seite die andere Abteilung, alle vier Tests nochmal, Test 3 und 4 in der anderen Abteilung - und Test 3 und 4 vielleicht auch nochmal im 14er Netz wiederholen). Ist das in der anderen Abteilung (wider der Berichte der anderen User dort) bei gleicher HW genau so, musst Du nicht mehr in der 14er Abteilung suchen, sondern generell das System untersuchen. In diesem Fall bekommen dann die Mitarbeiter im 14er Netz hoffentlich einen Bonus, denn sie arbeiten offenbar schneller (bzw. wollen das) als die anderen face-wink

Good Luck!
Viele Grüße, commodity
Member: dr.zeto
dr.zeto Aug 31, 2021 at 14:45:22 (UTC)
Goto Top
Danke Commodity!
Ich werde das Thema morgen mit meinem Kollegen weiter untersuchen und so vorgehen wie Du es vorschlägst.

In der Tat ist das Problem erst durch die User im 14er VLAN aufgefallen, denn diese nutzen den gesamten Tag über das ERP System, wohin gegen die anderen User es nur zeitweise nutzen.

Ich bin gespannt was morgen dabei rauskommt. Ich werde berichten.

Bis hier erstmal vielen Dank an alle, die geantwortet haben...

Bis morgen.