einfachroland
Goto Top

Festplatten auf Hardware-Fehler überprüfen nach RAID-Fehlern

Ich kenn mich mit Hareware nicht soo gut aus, aber mit Software bin ich fit, also verwendet ruhig Fachbegriffe ;)

Hallo Leute!

Ich habe ein RAID0 (jaja, unsicher, ich weiß) und hatte vor gut einer Woche einen RAID-Fehler wegen nem Stromausfall. Daraufhin hatte ich noch die Änderungen in mein Backup gespeichert und dann das RAID neu aufgesetzt und alle Daten zurückgespielt. Jetzt habe ich jedoch wieder einen RAID-Fehler bekommen und innerhalb von Minute waren alle drei Festplatten als fehlerhaft markiert. Und starten lasst er sich jetzt auch schon nicht mehr.

Zwei Fehler in so kurzer Zeit kommen mir irgendwie verdächtig vor. Gibts ne Möglichkeit die Festplatten zu überprüfen ob das ganze ein Hardwarefehler ist? Oder habt Ihr andere Tipps was ich machen soll?

danke
Roland

Content-ID: 148042

Url: https://administrator.de/contentid/148042

Ausgedruckt am: 19.11.2024 um 22:11 Uhr

trancefer
trancefer 31.07.2010 um 13:38:33 Uhr
Goto Top
Zitat von @EinfachRoland:
Gibts ne Möglichkeit die Festplatten zu
überprüfen ob das ganze ein Hardwarefehler ist?

Moin,
zum Überprüfen der Festplatten bieten die Hersteller jeweils kostenlose tools als Download an. Ich nutze immer recht gerne (zusätzlich) den Drive Fitness Test von Hitachi:

http://www.hitachigst.com/support/downloads/

Bist Du Dir sicher, dass ein RAID 0 mit 3 Disks auf Deinem Board/Controller supported wird? Viele Hersteller schreiben immer dazu, dass es eine gerade Anzahl an Festplatten sein soll/muss. Teste es doch ggf. mal mit nur 2 HDs. Sind die Festplatten alle vom gleichen Typ?


Gruß
EinfachRoland
EinfachRoland 31.07.2010 um 21:10:08 Uhr
Goto Top
Wenn der Controller keine 3 Festplatten unterstützen würde dann hätte es vorher nicht 3 Monate problemlos laufen können, also ja

Ich werd den Test mal drüber laufen lassen. Danke!

lg
Roland
SamvanRatt
SamvanRatt 31.07.2010 um 21:24:40 Uhr
Goto Top
Hi
R0 ist halt sehr anfällig vor allem mit mehr als zwei HDs (Ausfallswahrscheinlichkeit ist 2^n gegenüber einer einzelnen); selbst ein defekter Block kann schon zu einem Komplettversagen führen; je nachdem welche Algos der Kontroller benutzt, bzw wie Fehlerfrei die RAID Funktion geschrieben wurde (da vinum, LVM und ZFS Opensource themen sind bieten sie viele Infos zu dem Thema).
Grundsätzlich würde ich wie trancefer schreibt die Herstellertools benutzen (sofern es keine WD ist; da sagt das tool auch bei einer offensichtlich kranken das alles OK ist). Schön aufgesammelt ist das bei der UBCD. Dein Fehler kann evtl ein simpler Timeout sein oder ein TermCal Befehl, welcher die HD dann für ein paar hundert ms offline gehen läßt.
Einfachste Version: zweiter Rechner, die UBCD rein und jede HD jeweils offline testen, dann wieder einbauen und nächste. Es kam aber schon oft genug vor das die HDs den Test (DFT ist da mustergültig beim aussortieren) überstehen und dann wieder im Betrieb streiken; da bei einem R0 (du bootest vermutlich auch noch davon) dann auch noch die Intelligenz mit abschmiert, wirst du keine Logbücher nutzen können... schlechter Start. Bei HW RAIDs ist wenigstens der Controller dazwischen und fängt viel ab und protokolliert brav mit; sprtich Log ansehen und reagieren.
Ich vermute du hast deine HDs nicht nach 24/7 oder RAID Funktionalität ausgesucht, aber dein Effekt ist so einer der "wieso machen es Profis anders" Effekte. Ich habe zwar auch R0 im Einsatz (sonst komme ich nicht auf die Übertragungsgeschwindigkeiten die ich zum arbeiten brauche), aber seit dem ich von vier auf acht HDs umsteigen konnte läuft eben ein R1e (=ein RAID0 auf erweiterbarer Basis, baugleich zu einem R1+0) um nicht bei einem Versagen das gestrige Backup wieder zurück zu holen; selbst in vier Stunden Datenverlust Und den Backupzeiten (da ist auch mal schnell eine Stunde weg) bin ich einfach zu teuer und meine Privatzeit dann erst Recht.
Gruß
Sam
EinfachRoland
EinfachRoland 01.08.2010 um 22:36:24 Uhr
Goto Top
Hallo Sam!

Danke für die ausführliche Antwort!

Als ich mich fürs RAID0 entschieden habe wusste ich nicht dass es so ne Plage wird face-confused

Ich hab ein HW Raid, also einen Intel Controller der das RAID erstellt und boote davon. Aber keine Ahnung wie ich da in Logs reinschaun kann.

Warum muss ich bei der Überprüfung mit UBCD immer nur eine Festplatte drinnen haben?

24/7 Platte hab ich mir nicht gekauft da ichs ja auch ned 24/7 verwende, aber ich hab mir schon bessere gekauft, die WD Cavier Black. Ich hab auch schon überlegt mir eine 4. Festpaltte zu kaufen und 2 Festpaltten zum spiegeln zu verwenden, aber dann meckert das Windows sicher wieder und ich muss das ganze wieder neu aufsetzen, auch sehr zach...

lg
Dumas
Connor1980
Connor1980 02.08.2010 um 10:06:03 Uhr
Goto Top
Hallo,

Warum muss ich bei der Überprüfung mit UBCD immer nur eine Festplatte drinnen haben?
Damit as Ergebnis eindeutig zuzuordnen ist.

Du kannst mit 4 Festplatten entweder ein RAID 10 einrichten oder ein RAID5 mit/ohne Hotspare. Infos zu den Unterschieden findest du z.B. bei Wikipedia.
Egal wie, du solltest vor der Umstellung auf ein anderes RAID natürlich ein backup ziehen. Wie (mit oder ohne Datenverlust) dein Controller das Verändern von RAID 0 ind 10 behandelt wird dir das Handbuch verraten.

Grüße
SamvanRatt
SamvanRatt 02.08.2010 um 17:02:50 Uhr
Goto Top
Hi
bei den WD'S habe ich leider durch die hunderte hier im Einsatz nur schlechte Berichte von der Zuverlässigkeit (inkl den Volic Serien); leider ist das WDdiag keinen Cent wert wenn es offensichtlich defekte durchläßt; DFT ist da noch die Beste Lösung. Neu aufsetzen ist nicht notwendig; wir haben im Board genug Anleitungen wie das ohne geht, inkl Board und Bootcontrollerwechsel.
Gruß
Sam
EinfachRoland
EinfachRoland 03.08.2010 um 17:31:49 Uhr
Goto Top
Was muss ich denn beim DFT auswählen?
Er fragt mich "for Adaptec", "for LSI 320 Controller", "for Tekram & Symbios Controller" oder "for ATTO 320 Controller". Ich hab keine Ahnung was das bedeutet und im User Guide steht auch nix dazu. Was soll ich da nehmen wenn ich ne SATA Western Digital Cavier Black hab?
Danke
Connor1980
Connor1980 03.08.2010 um 18:10:07 Uhr
Goto Top
Hallo,

das ist die Frage nach dem SCSI Controller, da hierfür Treiber nachgeladen werden. Kannst du geflissentlich ignorieren. Es gibt einen Schritt vorher auch immer eine Auswahl "only IDE", sollte genügen.

Grüße
EinfachRoland
EinfachRoland 03.08.2010 um 18:19:00 Uhr
Goto Top
Der Schritt vorher is "ATA support only".
Ich hatte die erste Auswahl genommen und da hat er die Festpaltte nicht gefunden, obwohl ich das RAID schon gelöscht habe und nur mehr eine Festplatte anegsteckt hab.

lg
Dumas
Connor1980
Connor1980 03.08.2010 um 18:31:19 Uhr
Goto Top
Hallo,

dann stöpsel die Festplatte direkt an den Onboard Controller deines Mainboards. Falls es dann noch nicht funktioniert, diesen Controller im BIOS auf Enhanced/Compatible stellen, nicht SATA/AHCI/RAID.

Grüße
EinfachRoland
EinfachRoland 07.08.2010 um 17:16:12 Uhr
Goto Top
Danke, das umstellen im BIOS wars face-smile

Ich hab alle Festplatten jetzt sowohl mit dem DFT als auch mit dem WD Diag getestet, sie laufen alle fehlerfrei.
Ist es möglich das ein fehlerhaftes Windows einen RAID-Fehler verursacht? (sollte aus meinem Verständnis heraus nicht sein, Windows sieht es ja als eine Platte)

Oder geht da beim Wiederherstellen irgendwas schief?

danke
Dumas
SamvanRatt
SamvanRatt 07.08.2010 um 18:54:22 Uhr
Goto Top
Hi
nein (RAID abstrahiert jedes HD Problem vor deinem OS; umgekehrt sieht deine HD nichts von deinen OS Problemen da es nur dumm Addressen empfängt und Daten verarbeitet, auch ein RAID0); die WD Diags brachten bei mir auch bei einer defekten HD (sehr laut und klackern und defekte Sektoren wo's nur ging) als Alles OK; DFT kann wiederum nicht in die Elektronik hineinsehen und kann damit bei deiner HD nur als Lesetester fungieren. RAID Systeme sind aber sehr empfindlich was timeouts betreffen, in etwa mit einem asynchronen Verhalten in der RAID Membern vergleichen. Da WD Diag da recht eingeschränkt informiert und Testet. Mein Test wäre jetzt Image ziehen , HDs als R0 an einen richtigen Controller und weiter dort testen; da echte HW RAID Controller einen eigenen Logspeicher haben und einen eigenen Proz, welcher unabhängig von deinem OS kontrolliert läßt sich damit wenigstens eine richtige Meldung kommt, auch wenn dein OS längst den Löffel gereicht hat. Ansonsten leg dir RAID1+0 zu dann hast du wenigstens die schwache Funktion deines Onboard Controllers wenn er am Leben ist. Denk dran das die RAID Funktion auf dem Board keine ist, also nicht über Fehler (auch wenn es hier nur um die Auswertung geht) beklagen. Da betrifft bsi dato alle Fakeraids, egal ob das Promise, adaptec, Silicon Image, Intel, Via, AMD, SiS, NVidia ist; habe noch keinen einzig guten davon gesehen. Kaum kosten sie aber rund 100EUR je Portanschluß, bekommst du das wofür du bezahlst...
Kannst du dir evtl von einem Freund/Kollegen/IT Shop einen echten mal für ein paar Tage ausleihen?
Gruß
Sam