RAID1- Datenverlust beim Schreiben (EventID-51) - Festplatten und RAID - i.O.
HP Proliant Server
- 2 GB RAM
- 2x500GB SATA-HDDs
- (RAID1 über embedded Controller)
- Small-Business Server 2003
- Läuft seit 2008 ohne größere Probleme
Datenverlust beim Schreiben der Datei X - EventID 51
Hallo alle zusammen,
HP Proliant ML310 (G4) - Server
- 2 GB RAM
- 2x500GB SATA-HDDs
- (RAID1 über embedded Controller)
- Small-Business Server 2003
- Läuft seit 2008 ohne größere Probleme
Seit ca. einer Woche schreibt der Server nun auf die Serverkonsole, dass er gewisse Speichevorgänge nicht durchführen kann (von GDATA-Administrator Updates). Auch der eingebaute IIS schreibt, dass er Datenverlust beim Schreiben einiger Dateien hätte, man sollte die Hardware oder Netzwerkberbindung prüfen.
Der Eventlog dokumentiert die Fehler brav als Anwendungsfehler von GData und IIS in "Anwendung".
Unter "System" im Protokoll befinden sich unzählige Ereignisse mit der ID 51 Source Disk.
Die Beschreibung der Meldung ist: "Fehler bei der Auslagerung einer Datei".
Acronis True Image 9.1 kann seinen Sicherungstask nicht mehr durchführen: Lesefehler in der Quellfestplatte an Sektoren XXX.XX.XXX
Durchgeführte Troubleshooting Maßnahmen bisher.
Mit HP-Tools das Array und die Platten geprüft: SMART und Array-Check mit HP-Diagnostics sind einwandfrei.
- Booten des Systems mit nur einer Festplatte und anpassung der MBR und Startparameter - OK
- Fehlermeldungen tauchen nicht mehr auf
--> Ist jedoch keine Lösung - da Redundanz im Plattenbereich gewünscht.
- Erneutes Build des RAID1 - OK
- Boot und erneutes Anpassen des MBR - OK
- Event-ID 51 und oben beschriebene Fehlermeldungen tauchen erneut auf.
- Windows Update durchgeführt - Keine Änderung: Die Meldungen tauchen erneut auf.
- Gerade führen wir die aktuellsten Firmware-Updates von HP durch. (noch keine Rückmeldung)
Nach exzessiver Recherche:
- Viele schreiben dass das Problem auf fehlerhaften RAM zurückzuführen ist: HP-Diagnostics Tool schreibt dass RAM in Ordnung ist
- Andere weisen auf defekten IDE/SATA Port hin: IDE Kabel abgezogen, reboot - gleiches Problem
- Embedded SATA Controller ist ebenfalls in Ordnung
- Auslagerungsdatei mit festen Werten auf C: wurde umgestellt auf "Von System verwaltet"
An dieser Stelle gehen uns einfach die Ideen aus. Die Hardware ist in Ordnung und das System bootet - ist aber extrem langsam und viele Funktionen (wie z.B. Virenschutz, Companyweb(IIS) und Exchange funktionieren einfach nicht. SMB/CIFS Shares und Druckserver funktionieren, AD/DNS/DHCP funktionieren ebenfalls. Jedoch gibt der Server alle X Minuten ein aktustisches Signal via. PC-Speaker das eine Datei nicht geschrieben werden kann - oder dass ein Schreibprozess abgebrochen wurde.
- Hat jemand eine ähnliche Problematik schon einmal erlebt und oder behoben?
- Was könnten die nächsten Schritte im Troubleshooting sein - da es wohl ein Softwareproblem ist und nicht Hardware?
Zusatzinformationen:
- Es sind keine weiteren Festplatten an oder im Server verbaut oder angeschlossen (nur das RAID1 mit 500GB)
- Datensicherung des Servers und der Clients läuft über Acronis auf ein QNAP NAS mit 1TB Datenvolumen
- Ein 10/100er Switch und Breitband-Router (Speedport) mit 16.000er DSL von T-Com ist vorhanden
- Clients alle XP-SP3
Beste Grüße
anaxagoras83
- 2 GB RAM
- 2x500GB SATA-HDDs
- (RAID1 über embedded Controller)
- Small-Business Server 2003
- Läuft seit 2008 ohne größere Probleme
Datenverlust beim Schreiben der Datei X - EventID 51
Hallo alle zusammen,
HP Proliant ML310 (G4) - Server
- 2 GB RAM
- 2x500GB SATA-HDDs
- (RAID1 über embedded Controller)
- Small-Business Server 2003
- Läuft seit 2008 ohne größere Probleme
Seit ca. einer Woche schreibt der Server nun auf die Serverkonsole, dass er gewisse Speichevorgänge nicht durchführen kann (von GDATA-Administrator Updates). Auch der eingebaute IIS schreibt, dass er Datenverlust beim Schreiben einiger Dateien hätte, man sollte die Hardware oder Netzwerkberbindung prüfen.
Der Eventlog dokumentiert die Fehler brav als Anwendungsfehler von GData und IIS in "Anwendung".
Unter "System" im Protokoll befinden sich unzählige Ereignisse mit der ID 51 Source Disk.
Die Beschreibung der Meldung ist: "Fehler bei der Auslagerung einer Datei".
Acronis True Image 9.1 kann seinen Sicherungstask nicht mehr durchführen: Lesefehler in der Quellfestplatte an Sektoren XXX.XX.XXX
Durchgeführte Troubleshooting Maßnahmen bisher.
Mit HP-Tools das Array und die Platten geprüft: SMART und Array-Check mit HP-Diagnostics sind einwandfrei.
- Booten des Systems mit nur einer Festplatte und anpassung der MBR und Startparameter - OK
- Fehlermeldungen tauchen nicht mehr auf
--> Ist jedoch keine Lösung - da Redundanz im Plattenbereich gewünscht.
- Erneutes Build des RAID1 - OK
- Boot und erneutes Anpassen des MBR - OK
- Event-ID 51 und oben beschriebene Fehlermeldungen tauchen erneut auf.
- Windows Update durchgeführt - Keine Änderung: Die Meldungen tauchen erneut auf.
- Gerade führen wir die aktuellsten Firmware-Updates von HP durch. (noch keine Rückmeldung)
Nach exzessiver Recherche:
- Viele schreiben dass das Problem auf fehlerhaften RAM zurückzuführen ist: HP-Diagnostics Tool schreibt dass RAM in Ordnung ist
- Andere weisen auf defekten IDE/SATA Port hin: IDE Kabel abgezogen, reboot - gleiches Problem
- Embedded SATA Controller ist ebenfalls in Ordnung
- Auslagerungsdatei mit festen Werten auf C: wurde umgestellt auf "Von System verwaltet"
An dieser Stelle gehen uns einfach die Ideen aus. Die Hardware ist in Ordnung und das System bootet - ist aber extrem langsam und viele Funktionen (wie z.B. Virenschutz, Companyweb(IIS) und Exchange funktionieren einfach nicht. SMB/CIFS Shares und Druckserver funktionieren, AD/DNS/DHCP funktionieren ebenfalls. Jedoch gibt der Server alle X Minuten ein aktustisches Signal via. PC-Speaker das eine Datei nicht geschrieben werden kann - oder dass ein Schreibprozess abgebrochen wurde.
- Hat jemand eine ähnliche Problematik schon einmal erlebt und oder behoben?
- Was könnten die nächsten Schritte im Troubleshooting sein - da es wohl ein Softwareproblem ist und nicht Hardware?
Zusatzinformationen:
- Es sind keine weiteren Festplatten an oder im Server verbaut oder angeschlossen (nur das RAID1 mit 500GB)
- Datensicherung des Servers und der Clients läuft über Acronis auf ein QNAP NAS mit 1TB Datenvolumen
- Ein 10/100er Switch und Breitband-Router (Speedport) mit 16.000er DSL von T-Com ist vorhanden
- Clients alle XP-SP3
Beste Grüße
anaxagoras83
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 173548
Url: https://administrator.de/contentid/173548
Ausgedruckt am: 22.11.2024 um 13:11 Uhr
10 Kommentare
Neuester Kommentar
Hi !
Also wenn es die ganze Zeit, wie Du schreibst, bis vor ca. einer Woche funktioniert hat, dann muss eine Veränderung eingetreten sein. Um mir ein Bild machen zu können, bräuchte (zumindest) ich noch mehr Informationen. Wie hast Du z.B. die Platten getestet? Hast Du den RAM nur mit dem Tool von HP getestet oder auch mal (z.B. über Nacht) memtest darauf angesetzt? Auf die meisten Diagnosetools für RAID-Controller kann man sich übrigens nicht wirklich verlassen.
Also wenn ich bisher solche Meldungen an einem Server hatte, handelte es sich fast immer um einen Hardwaredefekt. Und gerade weil Du schreibst, mit nur einer Platte kommen keine Meldungen mehr, würde ich auf ein Problem mit dem Raid-Controller, dem Speicher oder einer Platte tippen. Hat der RAID Controller einen eigenen (Schreib-) Cache und kannst Du den mal disablen?
mrtux
Also wenn es die ganze Zeit, wie Du schreibst, bis vor ca. einer Woche funktioniert hat, dann muss eine Veränderung eingetreten sein. Um mir ein Bild machen zu können, bräuchte (zumindest) ich noch mehr Informationen. Wie hast Du z.B. die Platten getestet? Hast Du den RAM nur mit dem Tool von HP getestet oder auch mal (z.B. über Nacht) memtest darauf angesetzt? Auf die meisten Diagnosetools für RAID-Controller kann man sich übrigens nicht wirklich verlassen.
Also wenn ich bisher solche Meldungen an einem Server hatte, handelte es sich fast immer um einen Hardwaredefekt. Und gerade weil Du schreibst, mit nur einer Platte kommen keine Meldungen mehr, würde ich auf ein Problem mit dem Raid-Controller, dem Speicher oder einer Platte tippen. Hat der RAID Controller einen eigenen (Schreib-) Cache und kannst Du den mal disablen?
mrtux
moin,
Im Anschluß an die Fragen und die vielleichttrotz aus Erfahrung voreilige Schlussfolgerung von MrTux, der ich mich eigentlich anschliesse...
3 Jahre alte Platten... raus damit, sparst dir zu 99.9% einiges an bezahlter Zeit und unbezahltem Ärger.
und besser schlafen ist unbezahlbar
Gruß
Im Anschluß an die Fragen und die vielleicht
Durchgeführte Troubleshooting Maßnahmen bisher.
Booten des Systems mit nur einer Festplatte und anpassung der MBR und Startparameter - OK
Booten des Systems mit nur einer Festplatte und anpassung der MBR und Startparameter - OK
- Meinst du
- zweimaliges booten mit je einer Festplatte mit dem identischen Ergebnis?
anpassung der MBR und Startparameter - OK
- sagt mir, du hast nur ein Weiches Raid und wenn das fliegen geht, ist dein beschriebenes Verhalten nachvollziehbar.
3 Jahre alte Platten... raus damit, sparst dir zu 99.9% einiges an bezahlter Zeit und unbezahltem Ärger.
und besser schlafen ist unbezahlbar
Gruß
Hallo anaxagoras83
Aha
mit neuer Platte ? - sonst hast du den Fehler schon gefunden
Nach 3 Jahren sollten Serverplatten eh getauscht werden - also lieber beide tauschen, dann erst weitersuchen
chkdsk
USV
gruss p
Acronis True Image 9.1 kann seinen Sicherungstask nicht mehr durchführen: Lesefehler in der Quellfestplatte an Sektoren
Aha
--> Ist jedoch keine Lösung - da Redundanz im Plattenbereich gewünscht.
- Erneutes Build des RAID1 - OK
- Erneutes Build des RAID1 - OK
mit neuer Platte ? - sonst hast du den Fehler schon gefunden
Nach 3 Jahren sollten Serverplatten eh getauscht werden - also lieber beide tauschen, dann erst weitersuchen
chkdsk
USV
gruss p