Festplatten auf Hardware-Fehler überprüfen nach RAID-Fehlern
Ich kenn mich mit Hareware nicht soo gut aus, aber mit Software bin ich fit, also verwendet ruhig Fachbegriffe ;)
Hallo Leute!
Ich habe ein RAID0 (jaja, unsicher, ich weiß) und hatte vor gut einer Woche einen RAID-Fehler wegen nem Stromausfall. Daraufhin hatte ich noch die Änderungen in mein Backup gespeichert und dann das RAID neu aufgesetzt und alle Daten zurückgespielt. Jetzt habe ich jedoch wieder einen RAID-Fehler bekommen und innerhalb von Minute waren alle drei Festplatten als fehlerhaft markiert. Und starten lasst er sich jetzt auch schon nicht mehr.
Zwei Fehler in so kurzer Zeit kommen mir irgendwie verdächtig vor. Gibts ne Möglichkeit die Festplatten zu überprüfen ob das ganze ein Hardwarefehler ist? Oder habt Ihr andere Tipps was ich machen soll?
danke
Roland
Hallo Leute!
Ich habe ein RAID0 (jaja, unsicher, ich weiß) und hatte vor gut einer Woche einen RAID-Fehler wegen nem Stromausfall. Daraufhin hatte ich noch die Änderungen in mein Backup gespeichert und dann das RAID neu aufgesetzt und alle Daten zurückgespielt. Jetzt habe ich jedoch wieder einen RAID-Fehler bekommen und innerhalb von Minute waren alle drei Festplatten als fehlerhaft markiert. Und starten lasst er sich jetzt auch schon nicht mehr.
Zwei Fehler in so kurzer Zeit kommen mir irgendwie verdächtig vor. Gibts ne Möglichkeit die Festplatten zu überprüfen ob das ganze ein Hardwarefehler ist? Oder habt Ihr andere Tipps was ich machen soll?
danke
Roland
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 148042
Url: https://administrator.de/contentid/148042
Ausgedruckt am: 19.11.2024 um 22:11 Uhr
12 Kommentare
Neuester Kommentar
Zitat von @EinfachRoland:
Gibts ne Möglichkeit die Festplatten zu
überprüfen ob das ganze ein Hardwarefehler ist?
Gibts ne Möglichkeit die Festplatten zu
überprüfen ob das ganze ein Hardwarefehler ist?
Moin,
zum Überprüfen der Festplatten bieten die Hersteller jeweils kostenlose tools als Download an. Ich nutze immer recht gerne (zusätzlich) den Drive Fitness Test von Hitachi:
http://www.hitachigst.com/support/downloads/
Bist Du Dir sicher, dass ein RAID 0 mit 3 Disks auf Deinem Board/Controller supported wird? Viele Hersteller schreiben immer dazu, dass es eine gerade Anzahl an Festplatten sein soll/muss. Teste es doch ggf. mal mit nur 2 HDs. Sind die Festplatten alle vom gleichen Typ?
Gruß
Hi
R0 ist halt sehr anfällig vor allem mit mehr als zwei HDs (Ausfallswahrscheinlichkeit ist 2^n gegenüber einer einzelnen); selbst ein defekter Block kann schon zu einem Komplettversagen führen; je nachdem welche Algos der Kontroller benutzt, bzw wie Fehlerfrei die RAID Funktion geschrieben wurde (da vinum, LVM und ZFS Opensource themen sind bieten sie viele Infos zu dem Thema).
Grundsätzlich würde ich wie trancefer schreibt die Herstellertools benutzen (sofern es keine WD ist; da sagt das tool auch bei einer offensichtlich kranken das alles OK ist). Schön aufgesammelt ist das bei der UBCD. Dein Fehler kann evtl ein simpler Timeout sein oder ein TermCal Befehl, welcher die HD dann für ein paar hundert ms offline gehen läßt.
Einfachste Version: zweiter Rechner, die UBCD rein und jede HD jeweils offline testen, dann wieder einbauen und nächste. Es kam aber schon oft genug vor das die HDs den Test (DFT ist da mustergültig beim aussortieren) überstehen und dann wieder im Betrieb streiken; da bei einem R0 (du bootest vermutlich auch noch davon) dann auch noch die Intelligenz mit abschmiert, wirst du keine Logbücher nutzen können... schlechter Start. Bei HW RAIDs ist wenigstens der Controller dazwischen und fängt viel ab und protokolliert brav mit; sprtich Log ansehen und reagieren.
Ich vermute du hast deine HDs nicht nach 24/7 oder RAID Funktionalität ausgesucht, aber dein Effekt ist so einer der "wieso machen es Profis anders" Effekte. Ich habe zwar auch R0 im Einsatz (sonst komme ich nicht auf die Übertragungsgeschwindigkeiten die ich zum arbeiten brauche), aber seit dem ich von vier auf acht HDs umsteigen konnte läuft eben ein R1e (=ein RAID0 auf erweiterbarer Basis, baugleich zu einem R1+0) um nicht bei einem Versagen das gestrige Backup wieder zurück zu holen; selbst in vier Stunden Datenverlust Und den Backupzeiten (da ist auch mal schnell eine Stunde weg) bin ich einfach zu teuer und meine Privatzeit dann erst Recht.
Gruß
Sam
R0 ist halt sehr anfällig vor allem mit mehr als zwei HDs (Ausfallswahrscheinlichkeit ist 2^n gegenüber einer einzelnen); selbst ein defekter Block kann schon zu einem Komplettversagen führen; je nachdem welche Algos der Kontroller benutzt, bzw wie Fehlerfrei die RAID Funktion geschrieben wurde (da vinum, LVM und ZFS Opensource themen sind bieten sie viele Infos zu dem Thema).
Grundsätzlich würde ich wie trancefer schreibt die Herstellertools benutzen (sofern es keine WD ist; da sagt das tool auch bei einer offensichtlich kranken das alles OK ist). Schön aufgesammelt ist das bei der UBCD. Dein Fehler kann evtl ein simpler Timeout sein oder ein TermCal Befehl, welcher die HD dann für ein paar hundert ms offline gehen läßt.
Einfachste Version: zweiter Rechner, die UBCD rein und jede HD jeweils offline testen, dann wieder einbauen und nächste. Es kam aber schon oft genug vor das die HDs den Test (DFT ist da mustergültig beim aussortieren) überstehen und dann wieder im Betrieb streiken; da bei einem R0 (du bootest vermutlich auch noch davon) dann auch noch die Intelligenz mit abschmiert, wirst du keine Logbücher nutzen können... schlechter Start. Bei HW RAIDs ist wenigstens der Controller dazwischen und fängt viel ab und protokolliert brav mit; sprtich Log ansehen und reagieren.
Ich vermute du hast deine HDs nicht nach 24/7 oder RAID Funktionalität ausgesucht, aber dein Effekt ist so einer der "wieso machen es Profis anders" Effekte. Ich habe zwar auch R0 im Einsatz (sonst komme ich nicht auf die Übertragungsgeschwindigkeiten die ich zum arbeiten brauche), aber seit dem ich von vier auf acht HDs umsteigen konnte läuft eben ein R1e (=ein RAID0 auf erweiterbarer Basis, baugleich zu einem R1+0) um nicht bei einem Versagen das gestrige Backup wieder zurück zu holen; selbst in vier Stunden Datenverlust Und den Backupzeiten (da ist auch mal schnell eine Stunde weg) bin ich einfach zu teuer und meine Privatzeit dann erst Recht.
Gruß
Sam
Hallo,
Du kannst mit 4 Festplatten entweder ein RAID 10 einrichten oder ein RAID5 mit/ohne Hotspare. Infos zu den Unterschieden findest du z.B. bei Wikipedia.
Egal wie, du solltest vor der Umstellung auf ein anderes RAID natürlich ein backup ziehen. Wie (mit oder ohne Datenverlust) dein Controller das Verändern von RAID 0 ind 10 behandelt wird dir das Handbuch verraten.
Grüße
Warum muss ich bei der Überprüfung mit UBCD immer nur eine Festplatte drinnen haben?
Damit as Ergebnis eindeutig zuzuordnen ist.Du kannst mit 4 Festplatten entweder ein RAID 10 einrichten oder ein RAID5 mit/ohne Hotspare. Infos zu den Unterschieden findest du z.B. bei Wikipedia.
Egal wie, du solltest vor der Umstellung auf ein anderes RAID natürlich ein backup ziehen. Wie (mit oder ohne Datenverlust) dein Controller das Verändern von RAID 0 ind 10 behandelt wird dir das Handbuch verraten.
Grüße
Hi
bei den WD'S habe ich leider durch die hunderte hier im Einsatz nur schlechte Berichte von der Zuverlässigkeit (inkl den Volic Serien); leider ist das WDdiag keinen Cent wert wenn es offensichtlich defekte durchläßt; DFT ist da noch die Beste Lösung. Neu aufsetzen ist nicht notwendig; wir haben im Board genug Anleitungen wie das ohne geht, inkl Board und Bootcontrollerwechsel.
Gruß
Sam
bei den WD'S habe ich leider durch die hunderte hier im Einsatz nur schlechte Berichte von der Zuverlässigkeit (inkl den Volic Serien); leider ist das WDdiag keinen Cent wert wenn es offensichtlich defekte durchläßt; DFT ist da noch die Beste Lösung. Neu aufsetzen ist nicht notwendig; wir haben im Board genug Anleitungen wie das ohne geht, inkl Board und Bootcontrollerwechsel.
Gruß
Sam
Hi
nein (RAID abstrahiert jedes HD Problem vor deinem OS; umgekehrt sieht deine HD nichts von deinen OS Problemen da es nur dumm Addressen empfängt und Daten verarbeitet, auch ein RAID0); die WD Diags brachten bei mir auch bei einer defekten HD (sehr laut und klackern und defekte Sektoren wo's nur ging) als Alles OK; DFT kann wiederum nicht in die Elektronik hineinsehen und kann damit bei deiner HD nur als Lesetester fungieren. RAID Systeme sind aber sehr empfindlich was timeouts betreffen, in etwa mit einem asynchronen Verhalten in der RAID Membern vergleichen. Da WD Diag da recht eingeschränkt informiert und Testet. Mein Test wäre jetzt Image ziehen , HDs als R0 an einen richtigen Controller und weiter dort testen; da echte HW RAID Controller einen eigenen Logspeicher haben und einen eigenen Proz, welcher unabhängig von deinem OS kontrolliert läßt sich damit wenigstens eine richtige Meldung kommt, auch wenn dein OS längst den Löffel gereicht hat. Ansonsten leg dir RAID1+0 zu dann hast du wenigstens die schwache Funktion deines Onboard Controllers wenn er am Leben ist. Denk dran das die RAID Funktion auf dem Board keine ist, also nicht über Fehler (auch wenn es hier nur um die Auswertung geht) beklagen. Da betrifft bsi dato alle Fakeraids, egal ob das Promise, adaptec, Silicon Image, Intel, Via, AMD, SiS, NVidia ist; habe noch keinen einzig guten davon gesehen. Kaum kosten sie aber rund 100EUR je Portanschluß, bekommst du das wofür du bezahlst...
Kannst du dir evtl von einem Freund/Kollegen/IT Shop einen echten mal für ein paar Tage ausleihen?
Gruß
Sam
nein (RAID abstrahiert jedes HD Problem vor deinem OS; umgekehrt sieht deine HD nichts von deinen OS Problemen da es nur dumm Addressen empfängt und Daten verarbeitet, auch ein RAID0); die WD Diags brachten bei mir auch bei einer defekten HD (sehr laut und klackern und defekte Sektoren wo's nur ging) als Alles OK; DFT kann wiederum nicht in die Elektronik hineinsehen und kann damit bei deiner HD nur als Lesetester fungieren. RAID Systeme sind aber sehr empfindlich was timeouts betreffen, in etwa mit einem asynchronen Verhalten in der RAID Membern vergleichen. Da WD Diag da recht eingeschränkt informiert und Testet. Mein Test wäre jetzt Image ziehen , HDs als R0 an einen richtigen Controller und weiter dort testen; da echte HW RAID Controller einen eigenen Logspeicher haben und einen eigenen Proz, welcher unabhängig von deinem OS kontrolliert läßt sich damit wenigstens eine richtige Meldung kommt, auch wenn dein OS längst den Löffel gereicht hat. Ansonsten leg dir RAID1+0 zu dann hast du wenigstens die schwache Funktion deines Onboard Controllers wenn er am Leben ist. Denk dran das die RAID Funktion auf dem Board keine ist, also nicht über Fehler (auch wenn es hier nur um die Auswertung geht) beklagen. Da betrifft bsi dato alle Fakeraids, egal ob das Promise, adaptec, Silicon Image, Intel, Via, AMD, SiS, NVidia ist; habe noch keinen einzig guten davon gesehen. Kaum kosten sie aber rund 100EUR je Portanschluß, bekommst du das wofür du bezahlst...
Kannst du dir evtl von einem Freund/Kollegen/IT Shop einen echten mal für ein paar Tage ausleihen?
Gruß
Sam