bounee
Goto Top

SBS2011 - A disk read error occurred - 3ware RAID fehler oder Dateisystem defekt?

Server stürzt unregelmässig ab und bootet Windows SBS 2011 nicht von allein.

Hallo Allerseits,

ich stehe vor einem mega Problem. Ein Server mit Windows Small Business 2011 stürzt in unregelmässigen Abständen einfach ab. Mal am Wochenende, wenn gar nichts auf dem System passiert - mal in der Woche, beim Arbeiten.

Der Server startet plätzlich von allein neu und spuckt beim Bootvorgang schließlich diese Meldung aus:

"A Disk read error occurred. Press CTRL ALT DEL to continue."

Führt man die Aktion durch, startet das System wieder "normal" (natürlich mit dem Hinweis, dass das System nicht ordnungsgemäß herruntergefahren wurde.

Vor einigen, vielen Wochen, blieb mir nichts anderes übrig, als den 3ware Controller und die Festplatten komplette auszustauschen (Gewährleistung). Bis lang lief das System anschließend wieder 1a. Nur jetzt taucht dieser Fehler erneut auf.

RAID-Konfiguration (RAID 10) ist laut 3ware-Console in Ordnung.
CHKDSK spuckt auch keine Fehler aus.
Backup mit SBS-Sicherung läuft durch.
Acronis (zur Zeit deaktiv) läuft unzuverlässig.
Windows Eventlog gibt nicht viel her.
Stromversorgung durch USV ist gegeben.

Eine BBU ist nicht vorhanden - könnte damit abhilfe geschaffen werden? Kennt jemand diese Problem oder musste sich damit auseinandersetzen? Mir fehlt leider der Ansatz um das Problem in den Griff zu bekommen. Die Google-Suche konnte mir leider auch nicht weiterhelfen.

Achja, vielleicht ein Hinweis: Damals, als der Server diese Problem schon ein mal hatte, versuchte ich ein Backup mit Acronis B&R 11 für SBS (UR) mit Windows PE durchzuführen - bei 98% ist das System auch abgeschmiert...

Beste Grüße
Olli

Content-ID: 197352

Url: https://administrator.de/contentid/197352

Ausgedruckt am: 25.11.2024 um 09:11 Uhr

Pjordorf
Pjordorf 21.01.2013 um 11:22:40 Uhr
Goto Top
Hallo,

Zitat von @bounee:
"A Disk read error occurred. Press CTRL ALT DEL to continue."
Wer sagt dir dies? Das Mainboard? Der RAID Kontroller und sein BIOS? Windows beim starten vor dem GUI? Wndows beim Starten schon im GUI?

CHKDSK spuckt auch keine Fehler aus.
CHKDSK /F (Offline gehen dazu - SBS neustarten und dann läuft das)

Eine BBU ist nicht vorhanden - könnte damit abhilfe geschaffen werden?
Wenn es dadurch kommt, ja.

Damals, als der Server diese Problem schon ein mal hatte,
Was wurde damals gemacht?

Das RAID10 Volume ist OK und die HDDs (alle) sind auch OK? Ansonsten ist dein NTFS irgendwo defekt (MFTI oder MFTII)

bei 98% ist das System auch abgeschmiert...

Deutet auf defekte Sektoren einer / mehrerer Festplatten hin. Oder nur ein SATA (?) SAS Kabel ist nicht mehr OK bzw. die Kontakte....

Gruß,
Peter
bounee
bounee 21.01.2013 um 11:38:46 Uhr
Goto Top
Viele Dank für die schnelle Rückmeldung.

ERROR: Die Meldung kommt vor dem Windows-Booten. Mainboard- und RAID-Controller-BIOS laufen durch.

Checkdisk: CHKDSK /F probiere ich als nächstes.

BBU: Vielleicht gibt es irgendwie Probleme bei der Stromversorgung der PCI-Schnittstelle oder so? Daher dachte ich an BBU. Ist halt schwer zu sagen, da keine Fehler diesbezüglich protokolliert werden.

Damals: gleiches Phänomen - Fehler konnte nicht lokalisiert werden. Folgendes wurde gemacht: 1. Backup via SBS, 2. RAID-Controller und Festplatten raus, 3. Neue Komponenten rein und RAID erstellt, 4. Backup eingespielt.

Defekte Sektoren: war auch damals schon eine Vermutung, daher wurde alles ausgetauscht > bis auf....

SATA-Kabel: ...die werde ich wohl rasch austauschen!
Ravers
Ravers 21.01.2013 um 12:22:08 Uhr
Goto Top
Moin,

kann man im Protokoll vom RAID-Controller nix erkennen??
Meist kann man hier schon Ansätze finden.

greetz
ravers
keine-ahnung
keine-ahnung 21.01.2013 um 13:45:18 Uhr
Goto Top
Zitat von @bounee:
Acronis (zur Zeit deaktiv) läuft unzuverlässig.
Ja mei, dass ist eher normal ... face-wink

Hast Du die Maschine selbst zusammengebastelt (oder zusammenbasteln lassen)? Gibt es da keinen health-check? Ansonsten, wenn die empfohlenen Massnahmen nichts bringen, auch mal den RAM prüfen ... obwohl das doch alles in Richtung Platten zeigt.

LG, Thomas
bounee
bounee 24.01.2013 aktualisiert um 14:59:47 Uhr
Goto Top
So....

ich habe nun das System weiter durchleuchtet. So wie es aussieht, ist ein RAM-Riegel defekt. Entsprechend der Protokolle und Health-Meldung sowie dem Zeitraum des letzten Absturzes passt das.

Viele Dank für die vielen hilfreichen Rückmeldungen. Weiter so face-wink

Gruß Olli

PS: ...berichte nach dem Austausch nochmal kurz...