bigwim
Goto Top

Abbruch beim Clonen mit Timeout - ESX Server 4.0

Hallo zusammen,

ich weiß nicht mehr, wo ich noch suchen soll und erhoffe mir ein paar hilfreiche Tipps.

Wir haben seit zwei Wochen ESX-Server (Nr.) 10 (produktiv) und 11 (backup) in Betrieb genommen.
Zwei Maschinen (Memberserver W2K3 SE), die auf dem ESX-Server 10 erstellt wurden, laufen produktiv, aber beim Clonen auf den Backup-Server halte ich eine "Zeitüberschreitung" (Konsolenfehler)

Auf ESX-Server 10 und 11 Clonen - kein Problem.
Die Clones auf andere ESX-Server clonen - kein Problem.
Den Testclone von 10 auf 11 clonen - auch kein Problem!
Die auf ESX-Server 10 erstellten Maschinen auf ESX-Server 11 clonen - Zeitüberschreitung!


Weiß jemand Rat, wo und wonach ich suchen kann?

Danke!
Markus


Aktuell probiere ich es noch einmal. Ich will die (relativ) genaue Uhrzeit ermitteln, falls ich Logdateien liefern soll.

Content-ID: 153785

Url: https://administrator.de/contentid/153785

Ausgedruckt am: 21.11.2024 um 22:11 Uhr

60730
60730 26.10.2010 um 13:23:41 Uhr
Goto Top
Moin,

4.0 ist aber schon was älter....
Du schreibst sehr wenig über dein Netz, SAN oder nicht SAN, Management-Netz oder nicht ..

Sind das identische Server und identische Gast Hardware Versionen?

Gruß
BigWim
BigWim 27.10.2010 um 09:00:34 Uhr
Goto Top
Moin Moin,

Zitat von @60730:
Moin,

4.0 ist aber schon was älter....
ja, die öffentlich-rechtlichen Mühlen malen langsam ....

Du schreibst sehr wenig über dein Netz, SAN oder nicht SAN, Management-Netz oder nicht ..
und recht "sparsam"

SAN oder nicht SAN
kein SAN

Management-Netz oder nicht ..
Hm, ehrlich gesagt, mir nicht bekannt. Was müßte ich denn da fragen? *schäm*

Netz
Nochmal Hm: Meinst Du vielleicht die Anbindung?
Cisco-Router / Switche (Modell (noch) unbekannt)
stehen im gleichen IP-Segment
zwei Netzwerkkarten
1. dediziert für Management: Anbindung 100MBit (Ethernet)
2. 1GBit für die virtuellen Server

Sind das identische Server und identische Gast Hardware Versionen?
Ja, halten wir gleich, um sicher zu gehen, dass Probleme nicht durch unterschiedliche Hardware / Versionen entstehen, d. h.


Hardware
2 x IBM System x3550 M3 Typ 7944 (zeitgleich gekauft, also aus einer Serie)
100 € - chip nachgerüstet, um ein Raid 5 einrichten zu können
Update-Express mittels "IBM ToolsCenter Bootable Media Creator" erstellt und Updates eingespielt (beide Maschinen)

Software
Host = ESX 4.0 Upd 1
Gast = Memberserver W2K3 SE SP3 (standardisiertes Installationsverfahren)

Ich kann jetzt nicht von uns behaupten, dass wir wirklich die IT-Profis sind, aber wir haben mittlerweile ca. 30 Server virtualisiert, klonen hin und her, üben Katastrophen, ....

Ich habe heute Nacht die Maschinen auf einen anderen ESX-Server erfolgreich (!) geklont. Jetzt versuche ich ein weiteres Klonen zurück auf die ESX 11. Wenn das funktioniert, habe ich erst einmal eine Sicherung und die Situation etwas entspannt.

Meine Hoffnung war ja, dass jemand sagt: Ja klar, guckmal da und da, aber ich fürchte, dass ich mir für dieses (sehr spezielle, wahrscheinlich vom "Admin" selbst verursachtes) Problem jemanden einkaufen muß, der Ahnung hat ....

Vielen Dank dafür, dass Du schon mal über mein Problem nachgedacht hast.

Markus
BigWim
BigWim 18.11.2010 um 08:36:03 Uhr
Goto Top
nur für's Protokoll:

Wir haben inzwischen die Consolen-Verbindung "auch" auf 1 GBit umgestellt. Gleiches Verhalten. Beide Server (200 GB & 60 GB) brechen im letzten 1/4 ab. Bei dem einen bedeutet das nach ca. 4 Stunden, bei dem anderen bei ca. 1 Stunde. Damit kann ich duch ein "echtes" Timinig-Problem ausschließen.

Auf den Techniker muß ich leider noch etwas warten.


Fortsetzung folgt ....
BigWim
BigWim 02.12.2010 um 10:22:58 Uhr
Goto Top
Moin,

wie soll es auch anders sein. Der Techniker ist da, klont dreimal (nacheinander natürlich) und dreimal erfolgreich. I werd narrisch!

Zumindest war anhand der Logdateien erkennbar, dass ich nicht spinne. Ich werde die Frage dennoch mal auf gelöst setzen.

Wir haben uns auf eine Erklärung geeinigt, die ich auch verstehen kann face-wink

Die beiden ESX-Server wurden (abweichend von den bisherigen Maschinen) mit einem RAID 5 installiert, dass ja mehr auf Sicherheit als auf Geschwindigkeit ausgelegt ist.
Bei den drei erfolgreichen Tests hat sich gezeigt, dass der "lesende" Server (ESX10) mit einer Geschwindigkeit von ca 30000 Bits / s liest, der "schreibende" Server (ESX 11) aber "nur" mit einer Geschwindigkeit von 15000 Bits /s arbeitet. Das ergab jeweils nahezu exakt eine Zeitdifferenz von 19 Minuten (lt. Festplatten-Diagramm).

Soweit die nachvollziehbaren Tatsachen. Die Annahme geht nun dahin, dass wenn diese Zeitdifferenz (warum auch immer) über 20 Minuten liegt, der ESX 10 Server die Geduld verliert und mit einem TimeOut den Klonvorgang beendet.

Wenn jemand noch etwas Gescheites dazu einfällt, wäre ich dennoch dankbar.

Markus