miscmike
Goto Top

Proxmox Cluster Bond mit Netgear LAG - Hilfe

Guten Tag in die Runde,
ich benötige dringend das Schwarmwissen.


Ich möchte Folgendes tun :

Erstellung eines Proxmox Clusters mit dediziertem Clusternetzwerk.

Das sieht ungefähr so aus :

In jedem Host befinden sich 8 Netzwerkschnittstellen (10GB/s).
Jeweils 3 x 2 davon sollen als Bond (Proxmox) an ein LAG (Netgear-M4350 Switch) angebunden werden.
Das ganze mit möglichst größtmöglicher Performance.

Ich habe folgendes probiert :

Einstellungen am Switch :

Erstellung eines LAG mit 2 Ports :
Hash Mode 3 (src/dest MAC, VLAN, EType incoming port) und auch
Hash Mode 6 (src/dest IP and TCP/UDP Port Fields)

Einstellung an Proxmos Hosts :

Erstellung eines Bond mit LACP layer2, layer 2+3 und layer 3+4 mit 2 der Netzwerkanschlüsse
Erstellung einer Linux-Bridge mit dem bond und Vergabe einer IP-Adresse, die mit dem normalen Netzwerk nichts zu tun hat (in diesem Fall 10.10.1.1/24, beim nächsten Host 10.10.1.2/24 usw.)

Egal, wie ich die Bonds und Lags kombiniere, ich bekomme nur lokal einen Ping auf die eigene IP hin, auf die "gegnerische" nicht.

Ich bin am verzweifeln.
Hat das schon mal jemand gemacht und kann mir sagen, wo mein Fehler liegt ?

Als Gegentest habe ich Folgendes getan :

Am Switch LAG aufgelöst - also zwei eigenständige Ports.
Am Proxmos Host den Bond wie oben beschrieben erstellt, allerdings mit Hash-Mode balance-rr.

Damit habe ich zwischen den Hosts eine Verbindung.

Leider stellt dies aber nur eine Art Failover dar, ich möchte höchstmögliche Performance, weil in dem Cluster ca. 50 virtuelle Maschinen laufen werden.

Wer kann mir helfen ?


Viele Grüße

der gestresste Mike

Content-Key: 21169377353

Url: https://administrator.de/contentid/21169377353

Printed on: June 18, 2024 at 12:06 o'clock

Member: aqui
aqui Jun 11, 2024 updated at 09:25:13 (UTC)
Goto Top
Das LACP LAG Tutorial hast du gelesen zu der Thematik?!
Link Aggregation (LAG) im Netzwerk

Vermutlich hast du nicht beachtet das das LAG Verfahren an beiden Enden identisch sein muss!! 🤔
Auf der Switch Seite ist nur ein LACP LAG nach IEEE Standard 802.3ad bzw. IEEE 802.1ax standartisiert. Alles andere sind proprietäre Verfahren die dann auch immer beide Seiten supporten müssen, denn beide Seiten müssen identische Verfahren nutzen ansonsten kommt so ein LAG nicht zustande.
Du kannst also niemals "frei" unterschiedliche Verfahren an beiden Enden mischen. Schon deswegen nicht um nicht in die Gefahr eines Netzwerk Loops zu geraten oder einen Spanning Tree Blocking Event auszulösen. Nur das du das auf dem Radar hast...
Wie LACP LAGs auf Proxmox Seite laufen erklärt deren Knowledgebase:
https://forum.proxmox.com/tags/lacp/
Member: miscmike
miscmike Jun 11, 2024 at 09:33:48 (UTC)
Goto Top
Ja, soweit habe ich das schon verstanden. Nur leider scheitert es schon an den unterschiedlichen Bezeichnungen auf beiden Seiten (Netgear und Proxmox).
Meine Frage zielt darauf, herauszufinden, welche LAG Verfahren zwischen Proxmox und Netgear funktionieren.

Das Proxmox Forum hat mir da bisher nicht weitergeholfen.
Member: aqui
aqui Jun 11, 2024 updated at 09:44:20 (UTC)
Goto Top
Bei Switch Infrastrukturen in der Regel die nach dem LACP LAG Standard 802.3ad bzw. IEEE 802.1ax.
Es gibt auch statische wie es in Hypervisoren wie VmWare usw. üblich ist, die dann die VM Mac Adressen im Round Robin auf multiple, parallele Links verteilen aber dazu muss aus Hypervisor Sicht immer sichergestellt sein das diese entsprechende Loop Protection Mechanismen aktiv haben ansonsten kommt es auf Switchseite sofort zu einem Loop bzw. Spanning Tree Blocking sofern aktiv.
Member: miscmike
miscmike Jun 11, 2024 at 10:13:17 (UTC)
Goto Top
Da Du es allgemein ausdrückst, nehme ich an, Du hast das mit Proxmox noch nicht durchgespielt ?
Member: Kraemer
Kraemer Jun 11, 2024 at 11:36:20 (UTC)
Goto Top
Zitat von @miscmike:

Da Du es allgemein ausdrückst, nehme ich an, Du hast das mit Proxmox noch nicht durchgespielt ?

Proxmox nutzt den Begriff 802.3ad wie du hier sehen kannst: https://pve.proxmox.com/wiki/Network_Configuration#sysadmin_network_bond

Und hier kotzt Netgear sich aus. Die benutzen auch da auch die Bezeichnung: 802.3ad