franz-josef-ii
Goto Top

RAID 5 - Verständnisfrage

Guten Morgen

Ich hatte ja ein Problem mit meinem virtuellen Server, eine Datei wollte nicht. Keine Änderung, kein Kopieren, kein Verschieben etc. Sogar ein chkdsk (ja, für die ganz genauen face-wink chkdsk /f /r face-wink ) gab keine Fehler aus. Ende letzter Woche sprang dann die Status-LED eines Laufwerks von grün auf gelb und siehe da chkdsk fand auf einmal bad clusters, genau in der Datei. Ich drückte daraufhin eine neue HD hinein, aber auch nach der Wiederherstellung war es dasselbe. Die Datei dürfte inklusive ihrer verteilten Sicherungen defekt sein.

Bis jetzt dachte ich eigentlich, daß ein RAID 5 genau solche Fehler verhindern würde. Wenn ich in die Datei eine Sch...e hineinschreibe, klar, das erkennt das RAID nicht und speichert diese eben ab. Nur Hardwaredefekte?

Ich habe dann die "guten" VHDs kopiert (alles auf einem anderen Server), statt der defekten VHD eine neue erstellt und die Daten draufkopiert und die defekte Datei aus einem Backup ersetzt. Beim ersten Start hat die neue VM viele Fehler (beschädigte Attribute) auf (virtuell) C: gefunden und läuft jetzt ohne offensichtlichen Fehler. Auch hier werden in der "alten VM" keine Fehler gefunden.


Frage:
Wo ist mein Gedankenfehler bezüglich RAID 5?


Folgerung:
Welche Überwachungssoftware könnt Ihr da empfehlen? Es sind beide Server von Dell, der neuere ein 620T und der Backupserver ein 1900er.

Content-Key: 325420

Url: https://administrator.de/contentid/325420

Ausgedruckt am: 19.03.2024 um 11:03 Uhr

Mitglied: Chonta
Chonta 04.01.2017 um 08:26:43 Uhr
Goto Top
Hallo,

Bis jetzt dachte ich eigentlich, daß ein RAID 5 genau solche Fehler verhindern würde.
Ein RAID verhindert das bei einem totalausfall einer HDD gleich alles weg ist, nicht mehr und nicht weniger.

Ich hatte ja ein Problem mit meinem virtuellen Server
chkdsk /f /r gab keine Fehler aus
Wurde das auf dem Host der die VM bereitstellt gemacht oder in der VM?

Wo ist mein Gedankenfehler bezüglich RAID 5?
Ein RAID verhindert in keinsterweise Fehler im Dateisystem! Die werden im Prinzip sogar übernommen.
Sobald eine Serverplatte defekte Sektoren aufweißt, sollte man die Platte baldigst tauschen.
Also immer die SMART-Werte im Auge behalten.

Welche Überwachungssoftware könnt Ihr da empfehlen?
Smartmontools
HDSentinel

Gruß

Chonta
Mitglied: Franz-Josef-II
Franz-Josef-II 04.01.2017 aktualisiert um 08:39:24 Uhr
Goto Top
Zitat von @Chonta:
Ein RAID verhindert das bei einem totalausfall einer HDD gleich alles weg ist, nicht mehr und nicht weniger.

Also "nur" Totalausfall. Bei einem "Teilausfall" werden die Fehler auch verteilt? Dann wäre ja ein RAID sinnlos.

Zitat von @Chonta:
Wurde das auf dem Host der die VM bereitstellt gemacht oder in der VM?

Beide

Zitat von @Chonta:
Sobald eine Serverplatte defekte Sektoren aufweißt, sollte man die Platte baldigst tauschen.

Dann müßte es aber schon zu spät sein, außer der Fehler ist dort, wo (noch) nichts gespeichert ist.

Zitat von @Chonta:
Smartmontools
HDSentinel

Danke
Mitglied: Chonta
Chonta 04.01.2017 um 08:50:36 Uhr
Goto Top
Also "nur" Totalausfall. Bei einem "Teilausfall" werden die Fehler auch verteilt? Dann wäre ja ein RAID sinnlos.
Ein RAID ist NICHT Sinlos! Und ein RAID sichert nur auf Hardwareebene ab.
Du hast ein RAID 5 gehabt und es ist eine Datei futsch gegangen, ohne RAID wäre ALLES weg gewesen als de Patte auf einmal nicht mehr ansprechbar war.

Dann müßte es aber schon zu spät sein, außer der Fehler ist dort, wo (noch) nichts gespeichert ist.
Nein.
Weil die anderen Platten, wenn diese in Ordnung sind haben ja den unbeschädigten Datenbestand.
Wenn die anderen Platten aber auch nen Schuss weg haben....
Wenn ein Dateisystem Fehler hat, können dadurch Dateien beschädigt werden. Und ein Dateisystem kann auch Fehler bekommen ohne das ein RAID/Hardwareproblem vorliegt.

Gruß

Chonta
Mitglied: StefanKittel
StefanKittel 04.01.2017 um 08:54:46 Uhr
Goto Top
Zitat von @Franz-Josef-II:
Zitat von @Chonta:
Ein RAID verhindert das bei einem totalausfall einer HDD gleich alles weg ist, nicht mehr und nicht weniger.
Also "nur" Totalausfall. Bei einem "Teilausfall" werden die Fehler auch verteilt? Dann wäre ja ein RAID sinnlos.
Moin,
ne, das ist quatsch so.

Beispiel anhand eines RAID1

Schreiben
- Der Controller bekommt die zu schreiben Daten
- er schreibt diese auf beide Festplatten gleichzeitig
- Dafür bekommt er ein, mehr oder weniger, zuverlässiges Feedback ob das Schreiben erfolgreich war.
Dies wird durch Caches vom Controller und der Festplatten (wenn aktiviert) verschleiert.
Es könnte hier also durchaus sein, dass fehlerhafte Daten auf einer Festplatte landen. Es findet aus Performancegründen in der Regel kein Read-After-Write (Verify) statt.
- Sollte der Controller hier einen Schreibfehler gemeldet bekommen, deaktiviert er diese Festplatte und arbeitet nur noch mit der anderen weiter.

Lesen
- Der Controller liest die Daten von beiden HDDs gleichzeitig
- Sollte der Controller hier einen Lesefehler gemeldet bekommen, deaktiviert er diese Festplatte und arbeitet nur noch mit der anderen weiter.
- Er vergleich die Daten ob diese identisch sind. Sollte der Controller hier einen unterschied feststellen, deaktiviert er die Festplatte wo die Daten eine CRC-Prüfung nicht standhalten und arbeitet nur noch mit der anderen weiter.
Dies ist auf einigen Controller aus Performancegründen deaktiviert. Er liest dann von beiden Festplatten abwechselnd und ein vergleich findet nicht statt. Hier greift dann nur noch die CRC-Prüfung.

Besonders bei den billigen Controllern oder Soft-Controllern ist diese Logic häufig nicht zuverlässig.
Das System arbeitet dann mit einer defekten Festplatte weiter und es kommt zu korupten Daten.

Also Backups nie vergessen.

Stefan
Mitglied: MiSt
MiSt 04.01.2017 um 09:00:14 Uhr
Goto Top
Zitat von @Franz-Josef-II:

Zitat von @Chonta:
Smartmontools
HDSentinel

Danke
GSmartControl wäre auch noch die Alternative für Smartmontools mit GUI
Mitglied: Lochkartenstanzer
Lochkartenstanzer 04.01.2017 um 09:03:29 Uhr
Goto Top
Zitat von @Franz-Josef-II:

Sogar ein chkdsk (ja, für die ganz genauen face-wink chkdsk /f /r face-wink ) gab keine Fehler aus.

Auf einem RAID5 ist das sinnfrei. Entweder ist nur maximal eine Platte kaputt, dann gibt es keine "defekten Sektoren" oder es sind mindestens zwei kaputt, da ist dann "alles weg".

Nur der check des des Dateisystems selbst ist sinnvoll.

lks
Mitglied: Franz-Josef-II
Franz-Josef-II 04.01.2017 um 10:44:43 Uhr
Goto Top
Zitat von @Lochkartenstanzer:
Nur der check des des Dateisystems selbst ist sinnvoll.

T'schuldigung, den Satz verstehe ich jetzt nicht. Ich habe es auf beiden, sowohl Host als auch Guest gemacht.


Zitat von @Chonta:
Und ein RAID sichert nur auf Hardwareebene ab.

Ok und Dateisystem ist nicht Hardware. Nachdem bei mir ein Dateisystemfehler vorlag ..... (egal jetzt aus welchen Gründen auch immer)

Zitat von @Chonta:
... ohne RAID wäre ALLES weg gewesen ...

Wieso? Wenn die Platte einen "Totalschaden" hätte, ja, Dateisystemfehler, ja die eine Datei.

Zitat von @Chonta:
... Weil die anderen Platten, wenn diese in Ordnung sind haben ja den unbeschädigten Datenbestand.

Genau das war ja bei mir NICHT der Fall. OK, die anderen Platten sind (angeblich) ok.

Zitat von @StefanKittel:
... deaktiviert er diese Festplatte und arbeitet ...

Also lt Dell ist dem nicht so face-wink geht / geht vielleicht / geht nicht

Zitat von @StefanKittel:
Also Backups nie vergessen.
Nonaned face-wink
Mitglied: Lochkartenstanzer
Lochkartenstanzer 04.01.2017 um 10:48:17 Uhr
Goto Top
Zitat von @Franz-Josef-II:

Zitat von @Lochkartenstanzer:
Nur der check des des Dateisystems selbst ist sinnvoll.

T'schuldigung, den Satz verstehe ich jetzt nicht. Ich habe es auf beiden, sowohl Host als auch Guest gemacht.

Ein chkdsk /f reicht i.d.R. ein chkdsk /r/f ist auf RAID 1, 5 oder 6 sinnfrei.

Und es gibt Fehler, die durch ein chkdsk nicht behoben werden können, geschweige denn erkannt werden.
Mitglied: Chonta
Chonta 04.01.2017 um 11:02:44 Uhr
Goto Top
die anderen Platten sind (angeblich) ok.
Du kommst zu dieser Aussage, weil? Die SMART-Werte der Platten würden Anhaltspunkte liefern.
HDSentinel hat auch eine Testversion.

Wieso? Wenn die Platte einen "Totalschaden" hätte, ja, Dateisystemfehler, ja die eine Datei.
Du hattest geschrieben das auf einmal die ganze Platte ausgefallen war, ohne deinen RAID5 wäre dan nicht nur eine Datei futsch sondern ales was auf der Platte ist weg.

Weil die anderen Platten, wenn diese in Ordnung sind haben ja den unbeschädigten Datenbestand.
Genau das war ja bei mir NICHT der Fall.
Die Frage ist, wie die Datei beschädigt wurde. Wenn die Beschädigung durch ein Dateisystemfehler oder einen Anwendungsfehler verursacht wurde, kann der RAID das nicht kompensieren, da die Beschädigung nicht auf Hardwareebene passiert ist.
Stefan hatt die RAID-Funktionsweise sehr gut beschrieben.

Gruß

Chonta
Mitglied: Franz-Josef-II
Franz-Josef-II 04.01.2017 um 11:05:08 Uhr
Goto Top
Zitat von @Lochkartenstanzer:
Und es gibt Fehler, die durch ein chkdsk nicht behoben werden können, geschweige denn erkannt werden.

Das ist mir schon klar face-wink
Mitglied: Franz-Josef-II
Franz-Josef-II 04.01.2017 um 11:36:05 Uhr
Goto Top
Zitat von @Chonta:
Du kommst zu dieser Aussage, weil? Die SMART-Werte der Platten würden Anhaltspunkte liefern.

Weil es der Server sagt.


Zitat von @Chonta:
Du hattest geschrieben das auf einmal die ganze Platte ausgefallen war, ....

Nein, ich sagte, daß eine Datei nicht "wollte".
Zitat von @Franz-Josef-II:
Ich hatte ja ein Problem mit meinem virtuellen Server, eine Datei wollte nicht. Keine Änderung, kein Kopieren, kein Verschieben etc. .... fand auf einmal bad clusters, genau in der Datei. ....
Ich sagte nie, daß eine Platte plötzlich im Ar... sei face-wink
Mitglied: Chonta
Chonta 04.01.2017 um 11:52:51 Uhr
Goto Top
. Ende letzter Woche sprang dann die Status-LED eines Laufwerks von grün auf gelb
Und das bedeutet Platte ausgefallen oder nicht?

Weil es der Server sagt.
Darauf würde ich aber nix geben, denn das Zeigt nicht die Smartwerte der Platte an.
Teilweise laufen die Platten solange weiter bis die auf einmal ausfallen ohne das da irgendwelche LED blinken bis die Platte ausgefallen ist.
Von daher die Werte selber checken.

Gruß

Chonta
Mitglied: Franz-Josef-II
Franz-Josef-II 04.01.2017 um 13:29:32 Uhr
Goto Top
Zitat von @Chonta:
Und das bedeutet Platte ausgefallen oder nicht?


Knapp davor:
Vorausgesagter Laufwerksausfall