Bedeutung Packet Drops am Switch Port
Hallo,
wir haben einen 10G Netzwerk Backbone / Core Switch. An diesem hängen:
- die ESX Server mit 10G
- die Etagen Switche mit 1G
- die zentrale FW mit 1G
Die ESX Server hängen zudem noch per 1G zur Redundanz an den Etagenswitchen.
An dem Port der FW werden Packet Drops angezeigt.
Dies scheint dann zu passieren, wenn eine VM mit einer anderen VM aus einem anderen Netz/VLAN kommuniziert und per 10G über die 1G FW muss.
Kommunizieren Clients über den 1G Switch über die 1G FW, so sehen ich weder auf den Etagenswitchen noch auf dem Backbone Drops an den ganzen Ports.
Gleiches auch, wenn ich die VMs nur über die 1G Verbindung kommunizieren lasse. Keine Packet Drops.
Die Frage:
Sind die Packet Drops in dieser Konstellation an der FW erwartbar und das gehört so (weil Flaschenhals)?
Oder deutet dies auf ein Problem hin?
Danke und Gruß
wir haben einen 10G Netzwerk Backbone / Core Switch. An diesem hängen:
- die ESX Server mit 10G
- die Etagen Switche mit 1G
- die zentrale FW mit 1G
Die ESX Server hängen zudem noch per 1G zur Redundanz an den Etagenswitchen.
An dem Port der FW werden Packet Drops angezeigt.
Dies scheint dann zu passieren, wenn eine VM mit einer anderen VM aus einem anderen Netz/VLAN kommuniziert und per 10G über die 1G FW muss.
Kommunizieren Clients über den 1G Switch über die 1G FW, so sehen ich weder auf den Etagenswitchen noch auf dem Backbone Drops an den ganzen Ports.
Gleiches auch, wenn ich die VMs nur über die 1G Verbindung kommunizieren lasse. Keine Packet Drops.
Die Frage:
Sind die Packet Drops in dieser Konstellation an der FW erwartbar und das gehört so (weil Flaschenhals)?
Oder deutet dies auf ein Problem hin?
Danke und Gruß
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 44096249940
Url: https://administrator.de/contentid/44096249940
Ausgedruckt am: 22.11.2024 um 01:11 Uhr
15 Kommentare
Neuester Kommentar
Solche Drops können vielfältige Ursachen haben. Treten sie vermehrt an Trunks auf ist das oftmals ein Tagging Mismatch. Sprich Frames werden auf einer Seite mit einem Tag rausgesendet und die andere Seite kann mit dem Tag nichts anfangen (fehlendes VLAN etc.) und dropt den Frame dann. Passiert auch an einem (untagged) Access Port der Tagged Frames von der anderen Seite bekommt.
Congestion wäre auch möglich z.B. ein 10G Port der eingehende Daten mit 1G oder auch 1G LAGs weiterreicht. Aber dazu musste man wissen wie deine Auslastung an dem Port ist und ob die Switches Store and Forward oder Passthrough Teile sind wozu du ja leider nichts sagst.
Frame CRC Errors, Runt oder Giants, Collisions usw. zählen dazu auch. Bei 10G Base T oftmals durch schlechte Kabel und Verbindungen weshalb man dort für den Anschluß von Server HW ausschliesslich DAC/Twinax, AOC oder SFP+ Optiken verwenden sollte aber niemals RJ-45. Man kann aber ohne weitere Troubleshootingdaten auch nur Kristallkugeln.
Congestion wäre auch möglich z.B. ein 10G Port der eingehende Daten mit 1G oder auch 1G LAGs weiterreicht. Aber dazu musste man wissen wie deine Auslastung an dem Port ist und ob die Switches Store and Forward oder Passthrough Teile sind wozu du ja leider nichts sagst.
Frame CRC Errors, Runt oder Giants, Collisions usw. zählen dazu auch. Bei 10G Base T oftmals durch schlechte Kabel und Verbindungen weshalb man dort für den Anschluß von Server HW ausschliesslich DAC/Twinax, AOC oder SFP+ Optiken verwenden sollte aber niemals RJ-45. Man kann aber ohne weitere Troubleshootingdaten auch nur Kristallkugeln.
VLAN Tagging Probleme dürfte man ausschließen können, da keinerlei Paket Drops per 1G zu finden sind!?
Du redest hier ja aber vom 10G Port zum ESXi, oder? Dort spielt ja dann die "Dropping" Musik und ggf. dann auch der Tagging Mismatch zum ESXi Host. Der 1G Port ist ja ganz andere Baustelle...In der Juniper Knowledgebase gibts bestimmt einen Guide der dir sagt WAS alles Paket Drops triggert. Cisco u. Co. hat das auch.
Die Drops sind ausschließlich auf dem Port, wo die Firewall per 1G hängt, zu sehen.
Aaaahhsooo, sorry das war dann missverstanden. 🙈Kann das eine Überlast Situation (Congestion) sein??
https://www.juniper.net/documentation/us/en/software/junos/junos-overvie ...
Sind die Drops dann zu erwarten?
Bei TCP basiertem Traffic durch die Sliding Windows Flusskontrolle eher wenig aber alles was keinen Session Level hat schon wenn so eine Leitung 10:1 überbucht ist.An den Port Buffern des Switches zu tunen bringt nichts, denn das Problem besteht ja schon vorher und liegt an einem falschen Backbone Design.
Kannst du darauf näher eingehen?
Na ja einen 10G Link im Backend durch einen 1Gig Link mit 10zu1 Überbuchung zu zwängen endet immer so. Wenn der 10G Link mehr als 1 Gig Traffic hat muss es ja zum Dropping von Frames kommen, denn ein Interface Queue kann nicht mehrere Mbit an Daten zwischenpuffern. Bei Passthrough Switches ist sogar gar kein Zwischenpuffern möglich.Oder, dass die FW nur mit max 1G angebunden ist?
Wenn die nicht routen muss zw. den 10G Hosts und ins Internet nicht mehr als 1Gig weggehen dann ist die FW nicht die Ursache.
Moin @ElmerAcmeee,
das riecht meiner Ansicht nach zu > 99% danach, dass bei dir die Überlaststeuerung nicht korrekt greift.
Als erstes solltest du prüfen, ob auf der gesamten Strecke (vmNIC, vSwitch, NIC, Switch, FW) Flow Control aktiviert ist, wenn nicht dann bitte aktivieren. By the way, bei VMware sollte FC eigentlich per default an sein.
Wenn das nicht fruchtet, dann könnte auch das von @aqui angesprochene "TCP Congestion Control" zwischen Client/Server, respektive Sender/Empfänger nicht kompatibel zueinander konfiguriert sein.
Welche Betriebssysteme sind den auf den Clients/Server den überhaupt installiert?
Gruss Alex
Nehme ich die 1G Standby Adapter Aktiv, können die VMs ja max 1G. Und dann entstehen auch keine Drops.
das riecht meiner Ansicht nach zu > 99% danach, dass bei dir die Überlaststeuerung nicht korrekt greift.
Als erstes solltest du prüfen, ob auf der gesamten Strecke (vmNIC, vSwitch, NIC, Switch, FW) Flow Control aktiviert ist, wenn nicht dann bitte aktivieren. By the way, bei VMware sollte FC eigentlich per default an sein.
Wenn das nicht fruchtet, dann könnte auch das von @aqui angesprochene "TCP Congestion Control" zwischen Client/Server, respektive Sender/Empfänger nicht kompatibel zueinander konfiguriert sein.
Welche Betriebssysteme sind den auf den Clients/Server den überhaupt installiert?
Gruss Alex
Wenn es das denn war bitte nicht vergessen deinen Thread als erledigt zu schliessen!
Wie kann ich einen Beitrag als gelöst markieren?
Wie kann ich einen Beitrag als gelöst markieren?