Iperf - Unterschiedliche Werte als Administrator und als Benutzer ?!
Hallo liebe Admin-Kollegen !
Ich habe hier in der Arbeit ein interessantes Problem, dem ich einfach nicht auf die Schliche komme.
Wir haben unser Netzwerk mit unterschiedlichen VLANs segmentiert. Innerhalb eines bestimmten VLAN (14er VLAN) habe ich nun 4 Clients,
deren User sich über mangelnde Geschwindigkeit unseres ERP-Systems beschwert haben. Zunächst wurde vermutet es könnte an den "neuen" gebrauchten Fujitsu Q920 liegen und dass diese zu langsam seien, doch da wir diese Rechner im gesamten Unternehmen ausgerollt haben und sich sonst niemand beschwert bisher hat, konnten wir das ausschließen. Nichts desto trotz haben wir die Systeme in der IT (0er VLAN) geprüft und konnten keine Geschwindigkeitseinbußen feststellen.
Sodann haben wir das physikalische Netzwerk in Verdacht gehabt, da hier am Standort schon der eine oder andere Fehler diesbezüglich gefunden wurde. Doch Überprüfung mit Pockethernet zeigt, dass hier keine defekte Leitungen oder Belegungsfehler vorliegen.
Eine Performance-Überprüfung mit iperf zeigte, dass nur rd. 240 Mbit über das Netzwerk fließen... 800/900 Mbit sind hier im Haus aber "normal".
Wir vermuteten schon, dass die Firewall, die alle VLANs kontrolliert hier irgendwie Bandbreite klaut, doch auch innerhalb des VLAN sind die iperf-Werte mies.
Bisher konnten wir herausfinden, dass
1. Bei de-aktiviertem Trendmicro Apex One die Performance auf immerhin rund. 400 Mbit steigt (Warum???)(Das ist aber ein anderes Thema...)
2. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Administrator ausführen die Performance rd. 900 Mbit erreicht.
3. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Benutzer ausführen, die Performance nur rd. 240 Mbit bzw. 400 Mbit erreicht, je nach dem ob Trendmicro Apex One aktiv oder inaktiv ist.
Die Frage die wir uns nun stellen ist, warum die Performance so massiv unterschiedlich ist, abhängig davon ob ich die Messung als Admin oder User ausführe.
Hat jemand von euch eine Erklärung?
Ich habe hier in der Arbeit ein interessantes Problem, dem ich einfach nicht auf die Schliche komme.
Wir haben unser Netzwerk mit unterschiedlichen VLANs segmentiert. Innerhalb eines bestimmten VLAN (14er VLAN) habe ich nun 4 Clients,
deren User sich über mangelnde Geschwindigkeit unseres ERP-Systems beschwert haben. Zunächst wurde vermutet es könnte an den "neuen" gebrauchten Fujitsu Q920 liegen und dass diese zu langsam seien, doch da wir diese Rechner im gesamten Unternehmen ausgerollt haben und sich sonst niemand beschwert bisher hat, konnten wir das ausschließen. Nichts desto trotz haben wir die Systeme in der IT (0er VLAN) geprüft und konnten keine Geschwindigkeitseinbußen feststellen.
Sodann haben wir das physikalische Netzwerk in Verdacht gehabt, da hier am Standort schon der eine oder andere Fehler diesbezüglich gefunden wurde. Doch Überprüfung mit Pockethernet zeigt, dass hier keine defekte Leitungen oder Belegungsfehler vorliegen.
Eine Performance-Überprüfung mit iperf zeigte, dass nur rd. 240 Mbit über das Netzwerk fließen... 800/900 Mbit sind hier im Haus aber "normal".
Wir vermuteten schon, dass die Firewall, die alle VLANs kontrolliert hier irgendwie Bandbreite klaut, doch auch innerhalb des VLAN sind die iperf-Werte mies.
Bisher konnten wir herausfinden, dass
1. Bei de-aktiviertem Trendmicro Apex One die Performance auf immerhin rund. 400 Mbit steigt (Warum???)(Das ist aber ein anderes Thema...)
2. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Administrator ausführen die Performance rd. 900 Mbit erreicht.
3. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Benutzer ausführen, die Performance nur rd. 240 Mbit bzw. 400 Mbit erreicht, je nach dem ob Trendmicro Apex One aktiv oder inaktiv ist.
Die Frage die wir uns nun stellen ist, warum die Performance so massiv unterschiedlich ist, abhängig davon ob ich die Messung als Admin oder User ausführe.
Hat jemand von euch eine Erklärung?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 1212867113
Url: https://administrator.de/contentid/1212867113
Ausgedruckt am: 05.11.2024 um 16:11 Uhr
14 Kommentare
Neuester Kommentar
2. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Administrator ausführen die Performance rd. 900 Mbit erreicht.
3. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Benutzer ausführen, die Performance nur rd. 240 Mbit bzw. 400 Mbit erreicht, je nach dem ob Trendmicro Apex One aktiv oder inaktiv ist.
Ihr solltet ihr nicht "einen der Clients" verwenden, sondern den "selben" Client. Dann könnt ihr den Rest schon mal ausschließen.
3. wenn wir iperf auf einem der Clients als Server starten und dann eine Messung als Benutzer ausführen, die Performance nur rd. 240 Mbit bzw. 400 Mbit erreicht, je nach dem ob Trendmicro Apex One aktiv oder inaktiv ist.
Ihr solltet ihr nicht "einen der Clients" verwenden, sondern den "selben" Client. Dann könnt ihr den Rest schon mal ausschließen.
Benutzt du das alte iPerf oder iPerf3 ?? Empfehlung ist immer iPerf3 zu verwenden !:
https://iperf.fr/iperf-download.php
Um Messfehler ausschliessen zu können man mit einem zweiten Tool messen was ähnlich arbeitet z.B. NetIO:
https://web.ars.de/netio/
http://www.nwlab.net/art/netio/netio.html
Und einmal den Output beider Tools vergleichen. Das müsste immer annähernd gleich sind.
Generell musst du erstmal klären ob das Geräte bedingt ist oder Infrastruktur bedingt (Switches).
https://iperf.fr/iperf-download.php
Um Messfehler ausschliessen zu können man mit einem zweiten Tool messen was ähnlich arbeitet z.B. NetIO:
https://web.ars.de/netio/
http://www.nwlab.net/art/netio/netio.html
Und einmal den Output beider Tools vergleichen. Das müsste immer annähernd gleich sind.
Generell musst du erstmal klären ob das Geräte bedingt ist oder Infrastruktur bedingt (Switches).
Wie gesagt...besser iPerf3 und zum Quercheck ein anderes Tool verwenden !
Häufiger Grund für so ein Verhalten sind die NIC Treiber und ganz besonders wenn man die Microsoft embeddeten Treiber verwendet. Das sollte man nie machen sondern immer die NIC Chipsatz Treiber direkt vom Chipsatz Hersteller verwenden.
Ideal für einen weiteren Crosscheck ist immer ein Live Linux wie z.B. Ubuntu usw. auf den betroffenen Rechnern zu booten und dort dann unter iPerf3 und/oder NetIO zu messen !
Sieh auch: Netzwerk Management Server mit Raspberry Pi
Häufiger Grund für so ein Verhalten sind die NIC Treiber und ganz besonders wenn man die Microsoft embeddeten Treiber verwendet. Das sollte man nie machen sondern immer die NIC Chipsatz Treiber direkt vom Chipsatz Hersteller verwenden.
Ideal für einen weiteren Crosscheck ist immer ein Live Linux wie z.B. Ubuntu usw. auf den betroffenen Rechnern zu booten und dort dann unter iPerf3 und/oder NetIO zu messen !
Sieh auch: Netzwerk Management Server mit Raspberry Pi
So war das natürlich nicht gemeint. 😉
Es bezog sich pauschal auf die generelle Grundperformance bzw. Parameter Settings dieser Treiber. Ein typischer Grund ist das die Autonegotiation nicht sauber klappt. Z.B. bei Realtek basierten Karten eine typische Krankheit. Da kommt es dann zu Mismatches z.B. im Duplex Mode was in hohen Kollisionen resultiert und dann solche mickrigen Werte liefert. Mit den originalen Treibern ist sowas meist Geschichte.
Das solche Autonegotiation oder Durchsatz Werte für Admin oder Nutzer unterschiedlich sein sollen ist natürlich Quatsch sind steht außer Frage, da hast du natürlich absolut Recht !
Es bezog sich pauschal auf die generelle Grundperformance bzw. Parameter Settings dieser Treiber. Ein typischer Grund ist das die Autonegotiation nicht sauber klappt. Z.B. bei Realtek basierten Karten eine typische Krankheit. Da kommt es dann zu Mismatches z.B. im Duplex Mode was in hohen Kollisionen resultiert und dann solche mickrigen Werte liefert. Mit den originalen Treibern ist sowas meist Geschichte.
Das solche Autonegotiation oder Durchsatz Werte für Admin oder Nutzer unterschiedlich sein sollen ist natürlich Quatsch sind steht außer Frage, da hast du natürlich absolut Recht !
Zitat von @NordicMike:
Ich denke das kann nur ein Defender sein oder ein anderer Dienst, der als Administrator nicht startet.
Ich denke das kann nur ein Defender sein oder ein anderer Dienst, der als Administrator nicht startet.
so klingt das für mich auch. Es spricht ja schon Bände, dass das Abschalten des TrendMicro zu so deutlicher Steigerung führt.
HW-Problem ist hier unwahrscheinlich wenn die Messung stimmt, denn die HW unterscheidet ja nicht zwischen Admin und Benutzer.
Also: Messung mit Linux (oder einfach nem aktuellen Rechner und nicht so einer alten Möhre, das kann schon reichen) verifizieren und dann an die Software auf den Rechnern machen - insbesondere nach Unterschieden zu den anderen Abteilungen suchen. Dazu das TrendMicro auf dem Testrechner vielleicht mal probeweise ganz deinstallieren. Solche Brems-Software iVm einer betagten CPU passt vielleicht sowieso nicht wirklich. Andererseits läuft es ja in den anderen Abteilungen offenbar, das ist natürlich irritierend. Habt Ihr ein Monitoring? Vielleicht kann man da auch Auslastungsunterschiede feststellen.
Viele Grüße, commodity
Ich hatte Dich oben so verstanden, dass die Geschwindigkeitsdifferenz im selben Netz auftritt und der Unterschied dann auftritt, wenn man wechselnd zwischen Admin und User testet.
Dein obiges Testzenario 1 und 2 ist ein anderes, da geht der Traffic ja durch die (wie Du jetzt schreibst: ) Firewall. Du musst bei der Analyse jedenfalls trennen zwischen Traffic im selbem Netz und Traffic über die Netzwerkgrenzen.
Test 3 und 4 ist innerhalb des Netzes, da erreichst Du ja offenbar Eure Normalwerte.
Test 1 und 2 gehen über die Firewall, die bremst oftmals erstmal den Verkehr, das allein wäre nicht ungewöhnlich. Die Firewall überwacht vermutlich nicht nur, sondern routet vor allem auch die Vlans, oder?
Sehe ich das richtig, dass Deine oben beschriebenen Werte (400/200) aus Richtung des 0er Netzes gemessen wurden? Dann entspricht das ja den Linux-Ergebnissen und Du hast zwei Bremsen gefunden:
1. Firewall
2. Apex One
Warum das auf dem Rückwärtsweg nochmal deutlich langsamer ist als auf dem Hinweg? Zunächst ist vielleicht Deine WS leistungsfähiger als der Q920? Ob das eine (solche) Rolle spielen kann, kann @aqui oder andere erfahrene Kollegen vielleicht einschätzen, ich leider nicht. Wenn nicht würde ich auf einen Fehler der Konfig der Firewall tippen. Vielleicht macht die Route von 14 nach 0 auch noch irgendwo einen fehlkonfigurierten Schlenker oder durchläuft noch einen zusätzlichen Check?
Angehen würde ich das nun mit einem Test aus einer anderen Abteilung (also eine Seite wieder das 0er Netz, andere Seite die andere Abteilung, alle vier Tests nochmal, Test 3 und 4 in der anderen Abteilung - und Test 3 und 4 vielleicht auch nochmal im 14er Netz wiederholen). Ist das in der anderen Abteilung (wider der Berichte der anderen User dort) bei gleicher HW genau so, musst Du nicht mehr in der 14er Abteilung suchen, sondern generell das System untersuchen. In diesem Fall bekommen dann die Mitarbeiter im 14er Netz hoffentlich einen Bonus, denn sie arbeiten offenbar schneller (bzw. wollen das) als die anderen
Good Luck!
Viele Grüße, commodity
Dein obiges Testzenario 1 und 2 ist ein anderes, da geht der Traffic ja durch die (wie Du jetzt schreibst: ) Firewall. Du musst bei der Analyse jedenfalls trennen zwischen Traffic im selbem Netz und Traffic über die Netzwerkgrenzen.
Test 3 und 4 ist innerhalb des Netzes, da erreichst Du ja offenbar Eure Normalwerte.
Test 1 und 2 gehen über die Firewall, die bremst oftmals erstmal den Verkehr, das allein wäre nicht ungewöhnlich. Die Firewall überwacht vermutlich nicht nur, sondern routet vor allem auch die Vlans, oder?
Sehe ich das richtig, dass Deine oben beschriebenen Werte (400/200) aus Richtung des 0er Netzes gemessen wurden? Dann entspricht das ja den Linux-Ergebnissen und Du hast zwei Bremsen gefunden:
1. Firewall
2. Apex One
Warum das auf dem Rückwärtsweg nochmal deutlich langsamer ist als auf dem Hinweg? Zunächst ist vielleicht Deine WS leistungsfähiger als der Q920? Ob das eine (solche) Rolle spielen kann, kann @aqui oder andere erfahrene Kollegen vielleicht einschätzen, ich leider nicht. Wenn nicht würde ich auf einen Fehler der Konfig der Firewall tippen. Vielleicht macht die Route von 14 nach 0 auch noch irgendwo einen fehlkonfigurierten Schlenker oder durchläuft noch einen zusätzlichen Check?
Angehen würde ich das nun mit einem Test aus einer anderen Abteilung (also eine Seite wieder das 0er Netz, andere Seite die andere Abteilung, alle vier Tests nochmal, Test 3 und 4 in der anderen Abteilung - und Test 3 und 4 vielleicht auch nochmal im 14er Netz wiederholen). Ist das in der anderen Abteilung (wider der Berichte der anderen User dort) bei gleicher HW genau so, musst Du nicht mehr in der 14er Abteilung suchen, sondern generell das System untersuchen. In diesem Fall bekommen dann die Mitarbeiter im 14er Netz hoffentlich einen Bonus, denn sie arbeiten offenbar schneller (bzw. wollen das) als die anderen
Good Luck!
Viele Grüße, commodity