onichan
Goto Top

VMs verlieren zufällig Netzwerkverbindung

Servus zusammen,

wir haben das "lustige" Phänomen, dass auf mehreren ESX Hosts (nicht in einem Cluster, kein vMotion) zufällige VMs zufällig ihre Netzwerkverbindung verlieren.
Die VMs agieren, als wäre das Netzwerkkabel gezogen worden. Der Workaround, den wir beim eintreten des Problems praktizieren, ist die vNIC zu disconnecten und erneut zu connecten. Das Gast OS kann dann wieder normal über die NIC kommunizieren.
Das interessante an der ganzen Problematik ist, dass offensichtlich in keinem Log etwas zu dem Ereignis zu finden ist. Ich habe in die folgenden Logs geschaut:
Gast OS: Windows Eventlog
ESX: vmkernel.log, vmkwarning.log, vmksummary.log
VM Verzeichnis: vmware.log

Einige Fakts zu der Umgebung:
ESX Version: 6.0.0,5224934
Hardware NICs der Hosts: Broadcom Corporation Qlogic 57810 10G, Mellanox Technologies MT27520 Family
Generation der VMs: 8, 10
vNIC Typen: VMXNET3, E1000
Gast OS: Windows Server 2008 R2 Enterprise

Ja, ein Update könnte man mal machen, dessen bin ich mir bewusst, aber was könnte man darüber hinaus tun?
Ich hatte an einer VM die vNIC von VMXNET3 auf E1000 geändert und seitdem ist bei besagter VM das Phänomen nicht mehr aufgetreten. Da aber das Problem, wie gesagt, zufällig ist und ich andere VMs mit einem E1000 Adapter habe bei denen das Phänomen auftritt möchte ich nicht sagen, dass das Problem damit erledigt ist.
Ich habe die vergangenen Tage mal protokolliert, wann die VMs ihre Netzwerkverbindung verlieren und es ist auch Zeitlich gesehen kein Zusammenhang zu erkennen. Zwar passiert das ganze vorzugsweise Nachts, allerdings nicht zu bestimmten Uhrzeiten.
Auch hatte ich in der vmWare KB gelesen, dass die Ports der vSwitche ausgelastet sein könnten. Ist nicht der Fall. Jeder vSwitch hat 120 Ports von denen lediglich ~20 belegt sind.

Ich wäre über jede Idee sehr dankbar.

Viele Grüße
Oni

Content-ID: 345177

Url: https://administrator.de/contentid/345177

Ausgedruckt am: 25.11.2024 um 17:11 Uhr

sabines
sabines 02.08.2017 um 09:31:05 Uhr
Goto Top
Moin,

mal so ins Blaue:
Stelle bei einer betroffenen VM den Adapter auf E1000 um und nach einiger Zeit wieder zurück auf VMXNET3.
Bleibt die Verbindung dann stabil?

Sind auf allen Maschinen die VMware Tools aktuell?

Gruss
SaschaRD
SaschaRD 02.08.2017 aktualisiert um 09:37:21 Uhr
Goto Top
Hallo @OniChan,

wir hatten das gleiche Problem mit mehreren Windows Server 2012 auf einem ESXi 5.5.0-2068190. Die VMs verloren sporadisch nach einiger Zeit die Netzwerkverbindung mit der folgenden Meldung in den Ereignismeldungen des Systems:
Die IP-Adresse für die Isatap-Schnittstelle isatap.{FE3F4C55-1625-4D64-85A7-BF9AFAC0C5B5} wurde nicht aktualisiert. Updatetyp: 1. Fehlercode: 0x490.
Gelöst wurde es in dem der Netzwerkadapter der VMs entfernt und ein neuer Netzwerkadapter hinzugefügt wurde. Denn wir hatten die VMs mittels OVF-Import erstellt und der Adaptertyp hatte sich nicht aktualisiert.

Gruß, Sascha
OniChan
OniChan 04.08.2017 um 09:57:27 Uhr
Goto Top
Moin,

Zitat von @sabines:
Stelle bei einer betroffenen VM den Adapter auf E1000 um und nach einiger Zeit wieder zurück auf VMXNET3.
Bleibt die Verbindung dann stabil?

Sind auf allen Maschinen die VMware Tools aktuell?

habe ich gestern bei einer Maschine umgesetzt, heute war sie wieder nicht erreichbar.
vmWare Tools hab ich ebenfalls aktualisiert.
Hab nun der entsprechende Maschine einen E1000 verpasst - mal schauen was kommt.


Zitat von @SaschaRD:
wir hatten das gleiche Problem mit mehreren Windows Server 2012 auf einem ESXi 5.5.0-2068190. Die VMs verloren sporadisch nach einiger Zeit die Netzwerkverbindung mit der folgenden Meldung in den Ereignismeldungen des Systems:
Die IP-Adresse für die Isatap-Schnittstelle isatap.{FE3F4C55-1625-4D64-85A7-BF9AFAC0C5B5} wurde nicht aktualisiert. Updatetyp: 1. Fehlercode: 0x490.
Gelöst wurde es in dem der Netzwerkadapter der VMs entfernt und ein neuer Netzwerkadapter hinzugefügt wurde. Denn wir hatten die VMs mittels OVF-Import erstellt und der Adaptertyp hatte sich nicht aktualisiert.

Also wie gesagt, in keinem Logfile/Eventlog findet sich irgendwas zu dem Phänomen und die Maschinen sollten auch nicht aus einer OVF importiert sein. Ich hab die Idee trotzdem umgesetzt - mal schauen, ob es geholfen hat.

Danke euch zwei schon mal =)