timelessvision
Goto Top

Ereignis 153, Disk

Guten Tag zusammen

Ich mal wieder. ;)

Ich habe hier ein etwas irritierendes Problem. Auf einer von zwei virtuellen Maschinen erhalte ich alle 12 bis 24 Stunden diesen Fehler im Systemlog:

"Der E/A-Vorgang an der logischen Blockadresse "0x62ca3f2" für den Datenträger "0" (PDO-Name: \Device\00000032) wurde wiederholt."

4x hintereinander, aus einem Pot von 10 Blockadressen.

Ich wende mich an euch, da ich im Prinzip alles geprüft habe und nun anstehe:

1. Raid auf dem Host läuft normal, alle Disks sauber.
2. Keine Events auf dem Host.
3. Keine Events auf der anderen VM.
4. Keine Probleme generell. Auch nicht auf der betroffenen Maschine.
5. chkdsk fehlerfrei, auf der "problematischen" Maschine.

Noch irgendwelche Ideen was da faul sein könnte? Theoretisch hat der Server Garantie, leider hat der Hersteller Konkurs gemacht - unschön, aber nicht änderbar.

Backups sind natürlich in allen Formen vorhanden. Diese laufen übrigens auch ohne Probleme durch.


Gruss
Christof

Content-Key: 12616242844

Url: https://administrator.de/contentid/12616242844

Printed on: February 29, 2024 at 21:02 o'clock

Member: Nebellicht
Nebellicht Nov 30, 2023 at 13:27:05 (UTC)
Goto Top
Hi. SMART Werte auslsesen und mal drüber schauen. Gruß nbll
Member: TimelessVision
TimelessVision Nov 30, 2023 at 13:33:08 (UTC)
Goto Top
Zitat von @Nebellicht:

Hi. SMART Werte auslsesen und mal drüber schauen. Gruß nbll

Hi Nebellicht

Zum einen müsste der Intel Storage Manager schreien wenn da was ist, zum anderen habe ich eben per CrystalDiskInfo geprüft: Alles in Ordnung. Gesamtzustand zwischen 99 % und 100 % der Disks. Nichts auffälliges.
Member: Nebellicht
Nebellicht Nov 30, 2023 at 13:44:25 (UTC)
Goto Top
klingt gut.

das sagt übrigens die KI dazu:
Diese Art von Fehlermeldung tritt oft in Zusammenhang mit Problemen auf, die auf Festplatten, Speichergeräte oder Dateisysteme hindeuten können. Hier sind einige mögliche Schritte, die Sie unternehmen können, um das Problem zu diagnostizieren und zu beheben:

Überprüfen Sie die physische Hardware:
Stellen Sie sicher, dass alle Kabel und Verbindungen zwischen dem Datenträger und dem Computer ordnungsgemäß angeschlossen sind.
Wenn möglich, verwenden Sie ein anderes Datenkabel oder einen anderen Anschluss.

Festplattenstatus überprüfen:
Nutzen Sie Diagnosetools, um den Zustand der Festplatte zu überprüfen. Viele Hersteller bieten entsprechende Tools an.

Dateisystemprüfung:
Führen Sie eine Überprüfung des Dateisystems auf dem betroffenen Laufwerk durch. Sie können dazu die integrierten Windows-Tools wie CHKDSK verwenden.

Treiberaktualisierung:
Stellen Sie sicher, dass Ihre Festplatten- und Controller-Treiber auf dem neuesten Stand sind.

Ereignisprotokolle überprüfen:
Untersuchen Sie die Ereignisprotokolle in Windows, insbesondere das Ereignisprotokoll für Systemereignisse, um weitere Informationen über den Fehler zu erhalten.

Sicherung und Wiederherstellung:
Sichern Sie wichtige Daten auf dem betroffenen Laufwerk und erwägen Sie dann eine Wiederherstellung des Systems.

Hardwaretests:
Überprüfen Sie die Hardware mithilfe von Diagnosetools, um mögliche Defekte auszuschließen.

Wenn diese Schritte nicht zur Lösung des Problems führen, könnte es hilfreich sein, weitere Details über Ihr System, Betriebssystem und die genaue Fehlermeldung bereitzustellen. Falls möglich, könnten Sie auch die Ereignis-ID und Quelle der Fehlermeldung angeben, um eine genauere Analyse zu ermöglichen.
Mitglied: 8030021182
8030021182 Nov 30, 2023 updated at 14:05:26 (UTC)
Goto Top
Zitat von @TimelessVision:
Zum einen müsste der Intel Storage Manager schreien wenn da was ist,
Nein muss er nicht, der meldet sich meist erst wenn es eh fast zu spät oder schon zu spät ist.

zum anderen habe ich eben per CrystalDiskInfo geprüft: Alles in Ordnung. Gesamtzustand zwischen 99 % und 100 % der Disks. Nichts auffälliges.
Das heißt nicht das alle Teile des Dateisystems oder der Platte(n) in Ordnung sind.
Wenn es Sektoren auf dem Hostsystem gibt die mehrfache Wiederholungen benötigen wird das nicht gleich als Fehler gewertet.

"Der E/A-Vorgang an der logischen Blockadresse "0x62ca3f2" für den Datenträger "0" (PDO-Name: \Device\00000032) wurde wiederholt."

Deutet darauf hin, dass der Sektor auf dem Host mehrfachen Auslesens bedarf und die Stelle auf dem Datenträger möglicherweise physisch beschädigt ist.
Finde also erst mal heraus welcher Datenträger mit ": \Device\00000032" gemeint ist.

chkdsk fehlerfrei, auf der "problematischen" Maschine.
Und auf dem Host selbst auf dem die virtuellen Platten liegen?

Gruß Katrin
Member: TimelessVision
TimelessVision Nov 30, 2023 at 15:40:22 (UTC)
Goto Top
Hallo Katrin

chkdsk ist genauso unauffällig auf dem Host wie auf der VM. Die Device die er meint ist Datenträger 0 der VM, also quasi die VHDX.

Kann mir da echt keinen Reim darauf machen.
Member: manuel-r
manuel-r Nov 30, 2023 at 17:51:00 (UTC)
Goto Top
Zitat von @Nebellicht:

klingt gut.

das sagt übrigens die KI dazu:
Diese Art von Fehlermeldung tritt oft in Zusammenhang mit Problemen auf, die auf [...]

Ja die KI.
Ganz viel Geblubber. Zusammengestellt aus unzähligen Foreneinträgen und (Pseudo-) Hilfeseiten. Aber halt ohne echte Lösungsansätze.

Manuel
Member: Dani
Dani Nov 30, 2023 at 20:43:00 (UTC)
Goto Top
Moin,
Noch irgendwelche Ideen was da faul sein könnte?
Bist du über diesen Artikel und diesen schon gestolpert?

1. Raid auf dem Host läuft normal, alle Disks sauber.
Ansonsten ist bei dem RAID Controller evtl. WRITE Cache aktiviert?

Auf einer von zwei virtuellen Maschinen erhalte ich alle 12 bis 24 Stunden diesen Fehler im Systemlog:
Was sind die Unterschiede bei den beiden VMs?


Gruß,
Dani
Member: TimelessVision
TimelessVision Dec 01, 2023 at 09:28:39 (UTC)
Goto Top
Zitat von @Dani:

Moin,
Noch irgendwelche Ideen was da faul sein könnte?
Bist du über diesen Artikel und diesen schon gestolpert?

1. Raid auf dem Host läuft normal, alle Disks sauber.
Ansonsten ist bei dem RAID Controller evtl. WRITE Cache aktiviert?

Auf einer von zwei virtuellen Maschinen erhalte ich alle 12 bis 24 Stunden diesen Fehler im Systemlog:
Was sind die Unterschiede bei den beiden VMs?


Gruß,
Dani

Sali Dani

Die Artikel habe ich schon gelesen, brachten mich nicht weiter. Cache ist deaktiviert.

VM ohne Problem ist AD, DNS und DHCP, VM mit "Problemen" ist Fileserver, DB2 und SQL Express. Der SQL Express ist neu.


Gruss
Christof
Mitglied: 8030021182
8030021182 Dec 01, 2023 updated at 11:08:48 (UTC)
Goto Top
Was für ein RAID? Ich tippe immer noch auf Verzögerungen durch die unterliegende Hardware. Hatte ich hier auch schon mal mit zwei SSDs, da kam es beim Zugriff auf einen bestimmten Sektor immer wieder zu Verzögerungen beim Zugriff. Da die Disks ansonsten i.O. waren habe den Sektor kurzerhand ausgeblendet (für die SSD als defekt markiert).
Du kannst die vhdx ja mal testweise auf ein anderes Storage auslagern und beobachten.
Member: YotYot
YotYot Dec 04, 2023 at 10:44:47 (UTC)
Goto Top
Moin!

Ich verfolge seit heute Morgen die gleiche Situation, die es seit drei Tagen auf einem unserer virtuellen Server gibt (VMware). Von der Idee mit der defekten Festplatte bin ich weg, ich kann sehr genau feststellen, wann es passiert ist: die VM wurde auf einen anderen Host migriert und dann ging es los.

Die Hardware auf dem Host sei in Ordnung, sagt mein VMware-Admin. Zumindest nach erster Prüfung.
Ich werde die VM später mal auf den Host schieben, wo sie vorher war und schauen, ob die Meldungen dann weg sind oder weiterhin bleiben. Die Idee dahinter: wenn sie dann weg sind, ist es doch die Hardware, wenn sie bleiben, ist beim Verschieben ein Bit gekippt und der virtuelle Controller in der VM kaputt.

Grüße

Y.