zola10
Goto Top

Netzwerkausfall, Redundanzverlust VM

Guten Tag liebe Administratoren,

seit geraumer Zeit haben wir auf unserem Host (ESXi5.5) wo ungf. 5 Clients (Win7) und 3 Server (Win2012R2) laufen bei einem Redudanten Server Netzwerkausfälle sporadisch und nicht nachvollziehbar weshalb dies geschiet. Als erstens wollte ich mir die Ereignislogs anschauen ob dort nach dem Netzwerkausfall/Redundanzverlust eingetragen wird - leider Nein, es ist nichts ersichtlich. Bei den Clients und den anderen Servern ist so ein Verhalten nicht erkennbar. Auf den Server laufen Siemens Simatic Programme wo der Netzwerkausfall über die Applikation erkennbar war in erster Linie, nur wussten wir nicht ob dies Applikationsseitig geschieht oder wirklich Netzwerkkarten seitig geschieht. Somit habe ich mich entschlossen Wireshark drüber laufen zu lassen und siehe da es werden Netzwerkausfälle aufgezeichnet auf beiden Netzwerkkarten (Terminal-Bus, Redundanz-bus). Wir wollten morgen mal die Patchkabel tauschen um auszuschließen ob es an denen liegt. Treibernachinstallation der Netzwerkkarten ? Neuinstallation ?

lg
unbenannt1
unbenannt

Content-ID: 616472

Url: https://administrator.de/contentid/616472

Ausgedruckt am: 24.11.2024 um 19:11 Uhr

SlainteMhath
SlainteMhath 27.10.2020 um 09:58:45 Uhr
Goto Top
Moin,

also ohne eure Infrastruktur/Serverkonfig zu kennen ist dei Frage nicht zu beantworten. pNIC, vSwitches und Uplinks etc.

Neuinstallation ?
Ich weis, das willst du jetzt nicht hören, aber evtl, machts Sinn euren Hypervisor und die Gäste mal auf noch supportete Versionen zu aktualisieren?

lg,
Slainte
aqui
aqui 27.10.2020 um 10:31:00 Uhr
Goto Top
und siehe da es werden Netzwerkausfälle
Das stimmt aber nur bedingt. So wie es aussieht wenn man sich den Wireshark Trace oben ansieht, sind es ja keine physischen Ausfälle, denn die Endgeräte mit den Absender IPs 192....11, .45, .47, .42 usw. senden aktiv ja noch aktiv ICMP Pakete an die .12 (was auch immer das ist ?!) mit dem Typ 3 und dort intern Code 2 was bedeutet das das Zielprotokoll nicht aktiv ist !
https://de.wikipedia.org/wiki/Internet_Control_Message_Protocol#Die_ICMP ...
Dadurch das diese Pakete aktiv gesendet werden und auch ankommen kann man eigentlich schliessen das die Infrastruktur selber, (Kabel, aktive Komponenten usw.) vermutlich keinen Fehler haben sondern die Geräte bzw. die dortige Applikation an sich.
Dort solltest du also mal suchen.
brammer
brammer 27.10.2020 um 12:49:53 Uhr
Goto Top
Hallo,

gerade bei Siemens Steuerungen gibt es immer wieder Probleme wenn die Antwortzeiten zu kurz bemessen sind.
Da werden oft Werte kleiner 100 ms eingestellt , die Antwort kommt aber erst nach 120 oder 150 ms und prompt hast du ein Kommunikationsproblem.

brammer