harald21
Goto Top

Excessive CRC-Alignment error

Hallo,

ich habe hier ein "keines" Switch/Netzwerk-Problem und hoffe, hier kann mir jemand helfen.

Wir haben an unserem Hauptstandort einen HP ProCurve 5308xl (L3 Switch) mit mehreren VLAN's. In einem Nebengebäude (separates VLAN) steht dann ein HP ProCurve 2848 (L2). Beide sind über GBit-Glasfaser vebunden. Auf dem 5308xl ist der Uplink-Port untagged dem entsprechenden VLAN zugeordnet, auf dem 2848 ebenfalls untagged. Auf beiden Switchen ist die "Fault Detection" auf "medium" eingestellt.
Beide Switche haben die folgende Port Config:
- Port Type: 1000SX
- Config Mode: Auto
- Flow Control: Disable

Jetzt kommt es ab und zu vor, das auf dem 2848 Fehlermeldungen des Typs "Excessive CRC/Alignment error" für den Uplink-Port erscheinen. Gleichzeitig bricht die Netzwerkperformance ein. Auf dem 5308xl gibt es dagegen keine Fehlermeldungn. Die Glasfaserverbindung wurde ordnungsgemäß durchgemessen, so das ich hier einen Fehler der Verkabelung ausschließen möchte.

Vielleich hat ja jemand eine Idee, wie ich den Fehler weiter eingrenzen kann?

mfg
Harald

Content-ID: 154562

Url: https://administrator.de/contentid/154562

Ausgedruckt am: 21.11.2024 um 23:11 Uhr

aqui
aqui 08.11.2010 um 14:36:10 Uhr
Goto Top
Alignment Errors liegen vor wenn:
  • Die Menge der empfangenen Bits kein Vielfaches von 8 ist und zu einer ungeraden Byte Anzahl führt
  • Das Packet einen FCS Fehler hat
FCS Fehler liegt vor wenn die FCS keine glatte Zahl ergibt.
Switche markieren solchen Traffic meist als "excessive" wenn dessen Rate großer als 1% ist vom Gesamtvolumen sind. Normal sind Werte um 0,1% !
Ursache ist in der Regel immer eine defekte Netzwerk Karte an Endgeräten oder Kabel Probleme. Da du Glasfaser benutzt ist sehr häufig auch ein halbtoter GBIC ein Verursacher.
Diese 3 Dinge solltest du also mal genauer unter die Lupe nehmen !
Generell betreibt man Switch zu Switch Uplinks vom Layer 3 Core Switch immer im Tagged Mode, egal ob du nur 1 VLAN am Ziel hast ober nicht. (Das ist aber nicht Ursache deines Problems, nur ein Tip zum sauberen Design !)
Nagus
Nagus 08.11.2010 um 14:45:07 Uhr
Goto Top
Hi aqui,

Generell betreibt man Switch zu Switch Uplinks vom Layer 3 Core Switch immer im Tagged Mode, egal ob du nur 1 VLAN am Ziel
hast ober nicht. (Das ist aber nicht Ursache deines Problems, nur ein Tip zum sauberen Design !)

warum macht man das so? Nur interesse halber damit ich das verstehe face-smile
Gruß
Nagus
aqui
aqui 08.11.2010 um 14:50:25 Uhr
Goto Top
Wenn du mehr VLANs benötigst und diese auf die Access Switches ziehen musst geht das bei dir nicht an einem untagged Port.
Es hat also etwas mit der Flexibilität und der Skalierbarkeit in einem Netz zu tun. Rein funktionell funktioniert es aber auch mit so einer laienhaften Konfig wie bei dir...keine Frage.
Nagus
Nagus 08.11.2010 um 14:52:22 Uhr
Goto Top
Hey - ist nicht mein switch! face-smile

Ich wollte es bloß wissen, damit bei uns so was nicht passiert! Aber danke für die Erklärung!

Gruß
Nagus
harald21
harald21 08.11.2010 um 15:05:15 Uhr
Goto Top
Hallo aqui,

an anderen Stanorten ist das folgendermaßen konfiguriert:
1 VLAN (meistens default) untagged + andere VLAN's (tagged) auf der Uplink-Verbindung (an der Gegenstelle dann analog) - damit hatten wir eigentlich bisher keine Probleme.

Nun zum eigentlichen Problem zurück: Wie kann ich feststellen, ob der GBIC halbtot ist???
Können evtl. Clients mit defekter NIC das Problem verursachen? Müßten in diesem Fall an dem Port, an dem der Client angeschlossen ist, nicht ebenfalls diese Fehler auftauchen?

mfg
Harald
aqui
aqui 08.11.2010 um 18:12:53 Uhr
Goto Top
@harald21
OK, so ist die Uplink Konfig ja auch korrekt und es ist logisch das es damit keine Problem gibt !
Einen halbtoten GBIC kannst du nur durch Austauschen ermitteln. Es sei denn du hast GBICs mit Optical Monitoring aber sowas supportet Billigheimer HP vermutlich nicht auf den Modellen.
Ob am Endergäteport CRC oder Alignments auftauchen ist eine Frage wie der Switch Frames intern behandelt. Dazu müsstest du mal in ein Whitepaper von HP sehen bzw. euren HP Support mal dafür antriggern wie ein interner Paket Walkthrough aussieht. Vermutlich machen Ingress Ports bei billigen ProCurve Teilen keinen CRC Check und reichen nur durch.
Über ein Forum ist sowas ohne solche Info nicht zu klären.
Du solltest also erst bei den Uplink GBICs anfangen beidseitig und erst dann nach einem kaputten Kabel (Auch Glasfaser Patchkabel !) oder NIC suchen.
harald21
harald21 09.11.2010 um 08:25:49 Uhr
Goto Top
Hallo aqui,

danke für die Info. Eigentlich sind die Switche nicht aus den Billigserien von HP (es sein denn, du definierst HP generell als "billig") und haben "lebenslangen" Garantie.
Ich werde jetzt mal schauen, ob ich noch einen GBIC zum Tausch habe.
Ist es eigentlich sinnvoll auf den Uplinks "Flow Control" zu aktivieren oder bringt das eher wenig?

mfg
Harald
aqui
aqui 10.11.2010 um 08:42:30 Uhr
Goto Top
HP ProCurve ist generell eine Billigserie mit seinen sehr eingeschränkten Features und Performance oder wie willst du das sonst vergleichen zu Extreme, Cisco, Enterasys, Brocade, Juniper, Nortel ??
Wenn Flow Control per Default aktiviert ist kannst du das lassen. Bei vielen Billigheimern birgt es aber Gefahren, da diese Switches sehr schwache CPUs haben und noch viel schwächeres Puffermangement dur zu geringes DRAM. Wenn man viel Traffic mit Burst Charakter hat ist es bei solcherart Switches of besser man schaltet das ab auf Endgeräteports. Bei Uplinks kann man es in der Regel aktiv lassen.
Generell hilft da aber nur Ausprobieren bei schwachbrüstigen Switches da ihnen oft schlicht einfach die entspr. Diagnosemöglichkeiten fehlen dafür.
kossab
kossab 17.11.2015 um 22:20:55 Uhr
Goto Top
ich habe auch ein ähnliches Problem.
es sind einige 2530 die über Glas mit einem Core Switch A5500 verbunden sind.
Auf den 2530 tauchen bei vielen Ports (nicht allen) CRC Fehler.
Sind jetzt die Endgeräte, die daran hängen, schuld? irgendwo habe ich gelesen, man sollte den Uplink tauschen.. heißt; SFP Module, LWL Kabel.. wenn das so wäre, warum tauchen die CRC Fehler nicht bei allen Ports auf?
aqui
aqui 18.11.2015 um 08:27:48 Uhr
Goto Top
Nein ! Jeder Netzwerker weiss das Switches ein Signal Recovery machen. CRC Fehler können also nur auf einem Point to Point Link auftauchen, werden aber niemals vom Switch aktiv so weitergegeben sondern immer verworfen.
Das gilt solange der Switch ein sog. Store and Forward Switch ist und KEIN Cut Through Switch !
Bei HP gibt es im o.a. Billigsegement gar keine Cut Through Switches, da ist alles billiges Standard Store and Forward, so stellt sich die Frage hier gar nicht erst.
Höhere Protokollschichten (TCP) sind dann für eine Paket Retransmission bei den Endgeräten verantwortlich wenn CRC Errorfrmaes gedropt werden vom Switch.
CRC Fehler bedeutet das die Checksumme des Pakets ungültig ist was auf Bitfehler schliessen lässt.
Letzteres ist meist die Ursache defekter Optiken (Glasfaserlinks), schlechter Kabel oder schlechter Steckverbindungen. Möglich sind aber auch defekte Port Asics auf einem Switch usw. aber das müsste man sukzessive testen.
Der Tausch der Uplink Komponenten ist also ein guter erster Ansatz das zu Troubleshooten.