kuttkutt
Goto Top

Adaptec 5405 plus Raid 5 plus Festplatte defekt macht EA Fehler beim Zugriff auf eine Partition

Ich dachte mir so:

"Beim nächsten Rechner kaufst du ein Raid5 damit die Daten sicherer sind"

Also: Richtig Geld ausgegeben für einen Adaptec 5405 SAS/SATA Raid Controller, sowie 4 640GB Samsung SATA Platten.

Resultat: "Pustekuchen" ! - Meine derzeitige Meinung von Raids ist jetzt, daß diese Form der Datenspeicherung noch viel unsicherer ist als mit Einzelplatten.

Aber mal von vorn:

Ich habe mir vor ca 3 Monaten einen Adaptec 5405 Raid Controller mit 4 Samsung 640GB SATA Platten gekauft. Als Partitionen habe ich eine 100GB System- und ein ~1,4TB Datenpartion erstellt. Auf das erstellte Raid 5 ein Windows draufzubekommen grenzte schon an eine IT technische Meisterleistung, da WinXP nichts von meiner Boot Diskette mit den Raid Treibern wissen wollte.

Aber dann war das System drauf und ich fing an das ganze zu nutzen.

Letzten Donnerstag war der Rechner an und fing an wie wild zu pfeifen. Nach einer Weile hatte ich raus, daß wohl eine Platte vom Raid gestorben war (machte eigenartige Geräusche und beim Booten sagte mir der Adaptec, daß ein SMART Error übergeben wurde)

Daraufhin habe ich die Platte entfernt und versucht den Rechner zu starten.
Resultat: Windows brauchte etwas um hoch zu fahren und brachte dann einen Anmeldebildschirm. Nach dem Anmelden dauerte es ca 2 Mintuen und ein leeres Fehlerfenster mit einem "OK" Knopf erschien. Bein Druck drauf wurde ich sofort wieder Abgemeldet. Herunterfahren konnte ich den PC auch nicht mehr.

Ich dachte mir da schon so: "Hmm eigenartig - es wird doch immer so großartig behauptet, daß ein Raid 5 auch mit einer Platte weniger läuft"

Ich habe dann die Platte als Garantiefall eingeschickt und mir eine Baugleiche (Selber Hersteller - selbes Modell) gekauft, da die Reparatur ca 4 Wochen dauern sollte.

Diese Platte habe ich zu Hause eingebaut und der Rechner hat begonnen das Raid neu zu bauen. Aus irgend einem (vermutlich beim Zugriff auf das Raid) Grund frohr der Rebuild Prozeß immer mal wieder ein. Also Rechner stand still (bis auf die Maus) und auch am Controller war keine Aktivität mehr zu sehen.

Irgendwann sagte mir der Controller "Optimal". Windows startet aber immer noch genau so gut, wie mit 3 Platten.

Also: Griff in's Regal und eine alte gute IDE Platte rausgeholt, auf der ich dann ein XP mit der Adaptec Software installiert habe.
Diese sagte mir dann, daß das Array "Bad Stripes" hat (woher auch immer). Adaptec sagt dazu, daß diese nicht zu entfernen gehen, außer man mach ein neues Array - am besten mit einem LOW Level Format aller Platten.

Seit dem kann ich zwar auf die 100GB Systempartition zugreifen - und auch auf deren Daten, aber beim Zugriff auf die 1,4TB Partition kommt:

"Auf das Gerät kann aufgrund eines E/A Fehlers nicht zugeriffen werden"

Ich habe dann noch versucht die Array noch mal neu zu bauen - aber das ändert so ziemlich gar nichts...

Jetzt stellen sich mir 3 wichtige Fragen:

1: Warum kaufe ich mir ein Raid 5 mit einem hundeteuren Adaptec Controller (Gesamtkosten ca 600 Euro), um im Falle des Ausfalls einer Festplatte die Daten nicht zu verlieren, um dann festzustellen, daß genau das passiert, wenn wirklich nur eine (!!) Festplatte ausfällt? Würde man die 4 Platten einzeln betreiben wären dann wenigesten nur 25% der Daten weg...

2: Ich hoffe daß "nur" was in den Partitionsinfos kaputt ist. Kann man die Partition wieder zugänglich machen?

3: wenn 2. = ja. Wie?

PS: Sorry für meinem etwas drastischen Schreibstil, aber ich bin im Moment echt sauer. Am liebsten würde ich den Adaptec mitsamt der Platten aus dem Fenster werfen und wieder auf IDE Platten gehen...

Content-ID: 116491

Url: https://administrator.de/contentid/116491

Ausgedruckt am: 22.11.2024 um 16:11 Uhr

mrtux
mrtux 20.05.2009 um 16:59:05 Uhr
Goto Top
Hi !

also werde ich mal wieder anfangen Dir die Leviten zu lesen und mich damit wieder mal unbeliebt machen.

1.
Du solltest nicht irgendwelchen Geräten oder Herstellern die Schuld an deinem Unwissen oder deiner Unerfahrenheit zuschieben.
2.
Hat ein RAID nix aber auch gar nix mit Datensicherheit zu tun, sondern was mit Ausfallsicherheit. Das ist Grundwissen!
3.
KEIN erfahrener Admin betreibt ein RAID ohne Datensicherung! Schon gar nicht in einer Produktivumgebung!
4.
Solltest Du dir den Begriff Datensicherung/ Backup mal genauer ansehen, denn da hast Du eine Wissenslücke!
5.
Mit Halbwissen oder nur mit minimaler praktischer Erfahrung als Netzwerkadmin zu arbeiten ist fahrlässig und was dabei herauskommt war hier schon zigmal zu lesen.
6.
Wenn Du mit Deiner Erfahrung an den Platten herumbastelst sind die Daten endgültig weg ! Also, vorher sichern !

Man kanns langsam nicht mehr mit anhören, trotzdem nix für ungut. face-smile

mrtux
chips1
chips1 20.05.2009 um 17:03:15 Uhr
Goto Top
Tach
Erst mal grundsätzliches zum RAID: Alle Platten sollten/müssen die gleiche Firmware haben. Ein immer wieder gern wiederholter Fehler.
Zweitens hast Du offensichtlich kein lowlevel Format gemacht, was man meiner Meinung nach auch tun sollte.
So, klug dahergeredet jetzt zur Lösung:
Wenn Dir die Daten wirklich wichtig sind dann lies Dir in den Foren von Adaptec die genaue Vorgehensweise durch. Alle RAID Firmen haben andere Tools und Features. Experimentiere nicht an Deinem RAID. Schalte den Rechner nicht ein um irgenwelche neuen RAID zu erstellen. Der Weg über eine eigene Systemplatte könnte Dir zumindest grosse Teile der Daten retten. Danach wirst Du mit obigen Tipps neuinstallieren.
Und noch was: RAID ersetzt kein BACKUP wichtiger Dateien.
RAID 5 fürs System ist auch unglücklich, lieber RAID 1 fürs System und RAID 5 für die Daten.
Sorry nicht viel Hilfe aber Belehrung, ich weiss

Chips
kuttkutt
kuttkutt 20.05.2009 um 17:22:27 Uhr
Goto Top
Hi mrtux
zu deinen Punkten

1: Das mache ich ja gar nicht - Ich habe nirgends geschrieben, daß Adaptec schuld ist, daß das Raid den bach runter gegangen ist, obwohl es nicht hätte passieren dürfen.

2: Diese beiden Begriffe schlißen sich meiner Meinung nach nicht aus - Wenn eine Platte kaputt gehen darf, und die Daten dann angeblich noch da sein sollen ist das schon "Datensicherheit"

3: Ich betreibe seit ca 8 Jahren einen Debian Server - die letzten 3 Jahre mit Raid 1 - Ich hatte auch mal einen Ausfall. Ich würde daher schon behaupten, daß ich mich mit sowas auskenne.

4: Habe ich nicht. Auf meinem Linux System werden täglich Backups von kritischen Dingen gemacht. Von unwichtigern monatlich. Auch einen großteil der Daten, die auf der 1,4TB Partition sind hätte ich sicher noch da. Aber halt nicht auf dem letzten Stand.

5: Davon ist doch gar keine Rede?

6: Ich habe an den Platten nicht "herumgebastelt", sonder bin genau so vorgegangen, wie man es beim Ausfall einer Platte in einem Raid 5 tun sollte. (Also am Degraded Raid nix rumgebaut - so schnell wie möglich Ersatz besorgt usw.)

Behauptungen kannst du ja ganz gut anstellen - Hast du auch Lösungsvorschläge?
kuttkutt
kuttkutt 20.05.2009 um 17:31:03 Uhr
Goto Top
Hi chips1 ob die Platten genau die selbe Firmware haben weis ich nicht. Ich habe primär darauf geachtet, daß es sich um genau den selben Herstelle, sowie Modell handelt. Wenn man nicht würde, welche getauscht wurde, würde man es im Raid Bios nicht herausfinden

Zum Low Level: Nein - zu Begin habe ich keins gemacht. Das lese ich aber auch zum ersten mal. Bei uns auf Arbeit haben wir verschiedene Rechner mit Raid Systeme. Unser Admin macht eigentlich nie ein LOW level Format der Platten. Wenn das Raid neu wir mach ich das aber.

Bei Adaptec habe ich auch schon einiges dazu gelesen - ich habe auch eine Anfrage gestellt, da ich dieses Problem nicht in den FAQ finden konnte.

An der Raid Config an sich habe ich bis jetzt auch nichts geändert. Am Raid selber nur mit den Adaptec eigenen Tools (z.b. Verify). Ich habe auch kein chkdsk gemacht (den Fehler macht zwar jeder einmal haber halt dann nie wieder :D )

Im Moment habe ich auch eine eigene Systemplatte - das Raid ist zum Start von Windows nicht mehr nötig.
mrtux
mrtux 20.05.2009 um 17:44:16 Uhr
Goto Top
Hi !

Behauptungen kannst du ja ganz gut anstellen - Hast du auch
Lösungsvorschläge?

Ja, die Rücksicherung eines richtigen und professionell eingerichteten Backups face-smile

Aber gut, ich halt ja schon meine Klappe, hast ja schon genug Ärger am Hals. Ein zweites Mal passiert Dir das bestimmt nicht mehr, wie mir das auch nur einmal passiert ist RAID und Backup zu verwechseln face-smile Eine Erfahrung mehr, wenns auch bitter ist face-sad

mrtux
kuttkutt
kuttkutt 20.05.2009 um 18:37:10 Uhr
Goto Top
heh - kein Problem.

Wie gesagt - auf meinen Linux Rechnern ist mir bisher 2 mal eine Platte abgeraucht

einmal ohne Raid (das war trotz Backups eine Heidenarbeit den ganzen Mist wieder zu installieren)

und einmal mit Raid 1 - aber auch da gabs Probleme.

Die wichtigsten Daten müsste ich ja noch auf meinen IDE Palatten haben - und die sind ca 3 Monate alt.

Das Problem, was ich hab, ist das selbst wenn ich das Raid wieder neu mache, ich wahrscheinlich kein Vertrauen mehr in die Sache habe. Bei einer Platte ist es halt so, wenn die kaputt geht sind die Daten weg. Hat man 4 Stück im Raid - sind, nach meiner bisherigen Erfahrung, die Daten aller 4 Paltten weg - und da muß auch nur eine kaputt gehen.

Ich überlege daher ernsthaft, ob ich die 4 SATA Platten als einzelne Devices weiterbetreibe ....

Aber erst mal werd ich mal kuken, ob ich die Daten von dem verhunzten Raid 5 bekomme....
mrtux
mrtux 20.05.2009 um 19:38:17 Uhr
Goto Top
Hi !

Zitat von @kuttkutt:
Wie gesagt - auf meinen Linux Rechnern ist mir bisher 2 mal eine
Platte abgeraucht

Wem ist das nicht schon passiert face-sad

einmal ohne Raid (das war trotz Backups eine Heidenarbeit den ganzen
Mist wieder zu installieren)

Genau, da geht Zeit ohne Ende rein.

Das Problem, was ich hab, ist das selbst wenn ich das Raid wieder neu
mache, ich wahrscheinlich kein Vertrauen mehr in die Sache habe. Bei

Ja und ein RAID solltest Du auch nicht überbewerten, der Controller kann sich ja auch mal verabschieden. Im Prospekt der Hersteller hört sich das alles immer wunderbar an face-smile

die Daten aller 4 Paltten weg - und da muß auch nur eine kaputt
gehen.

Gut, ich mache es eigentlich auch so wie Chips das beschreibt, ich habe meist nur ein RAID1 Array fürs System, damit bin ich bisher gut gefahren aber zusätzlich habe ich immer noch ein echtes Backup laufen und wenn es nur eine poplige USB Platte ist, es ist besser als mit der Datenrettung zu kämpfen.

Weiterer Vorteil: Man braucht weniger Herztropfen und schläft besser, vor allem in meinem Alter face-smile

Ich überlege daher ernsthaft, ob ich die 4 SATA Platten als
einzelne Devices weiterbetreibe ....

Gut bei Deinem eigenen Server, ist das dann auch Deine Entscheidung aber ich hab da schon so schlechte Erfahrungen gemacht, vor allem rechtlicher Natur! Wenn mal der Kunde mit dem Wisch vom Anwalt vor Deiner Türe steht, dann bewertest Du das Thema Netzwerksicherheit und Datensicherung total anders. Daher überregiere ich vielleicht manchmal hier aber das sind wirklich keine Sprüche, leider schon erlebt face-sad

Klar ist, wenn es mal richtig knallt, ist immer der Admin schuld, nie der Einkäufer ! Der Standardspruch: "Sie sind der Fachmann, Sie hätten das wissen müssen, ich bin nur Kaufmann!" und der Anwalt übersetzt das dann noch ganz toll ins Juristische, liest sich dann ganz prima face-smile

Und natürlich, wünsche ich Dir auch viel Glück bei der Datenrettung !

mrtux
chips1
chips1 20.05.2009 um 20:52:35 Uhr
Goto Top
OK, das mit der gleichen Firmware ist für normale Leute auch nicht unbedingt bekannt. Das wissen Leute mit "negativer" Raid-Erfahrung, weil man im Falle eines Desasters immer wissen will (man sollte es wollen) warum das RAID schiefgelaufen ist. Das mit lowlevel eigentlich auch, dass Euer Admin das nicht macht spricht für seinen Mut. Meines Wissens empfehlen das alle renommierten Hersteller wie Mylex, LSI oder auch adaptec, obwohl die nicht so renommiert sind. Aber ich kann Dir nur Tipps geben, damit sowas nicht mehr passiert.
Hoffe halt mal, dass Deine Anfrage bei Adaptec was bringt.

Ich sehe gerade, mrtux war ein bisschen deutlicher als ich, aber er hat im Ansatz leider recht, sorry.

Trotzdem good luck
dog
dog 21.05.2009 um 01:22:22 Uhr
Goto Top
bei älteren Festplatten war es möglich die Low-Level-Formatierung selbst durchzuführen, heutige Festplatten fangen aus Sicherheitsgründen den Befehl zum LL-Format ab und führen stattdessen eine Neuinitialisierung der Platte durch. Dabei werden nur die Datenbereiche überschrieben und ev. (je nach Programm) die "bad sector map" aktualisiert, d.h. Sektoren werden überprüft und defekte Sektoren werden als defekt markiert und stehen nicht mehr zur Verfügung
(werden vom System nicht angezeigt, auch nicht als defekt). Die Markierung der Sektoren erfolgt jetzt in der G-Liste (im Gegensatz zur P-Liste des Herstellers).

Low Level kann also deine Festplatte nicht wirklich reparieren, es überschreibt alle Daten und blendet bestenfalls defekte Sektoren aus (zusätzlich zu den vielleicht ohnehin durch den Hersteller schon ausgeblendeten defekten Sektoren).

Q: http://www.libe.net/themen/LOW_LEVEL_FORMAT__HDD_formatieren.php

Das Lowlevel-Format sollte man also nicht überbewerten.
Ich habe das einmal gemacht und das hat mich einen halben Tag gekostet, was wohl auch der Grund ist, weshalb sich die Meisten das sparen.

Was aber die Frage nach der Partitionstabelle angeht:

TestDisk macht recht gute Arbeit beim Finden von Partitionen:

http://www.cgsecurity.org/wiki/TestDisk
http://www.cgsecurity.org/wiki/TestDisk_Step_By_Step

Bei Änderungen an einem ohnehin defekten RAID ist natürlich Vorsicht geboten!

Grüße

Max
kuttkutt
kuttkutt 22.05.2009 um 19:52:39 Uhr
Goto Top
hmm

Testdisk hat mir heute gesagt, daß die Partitionstabelle OK sei.

Bei List Files kommt:

"Can't read Directory - Filesystem might be damaged"
chips1
chips1 22.05.2009 um 19:59:33 Uhr
Goto Top
Dann such mal im Google,
der findet nämlich nichts. Und wenn der Herr Google nichts findet, gibts die meldung auch nicht face-smile
Nee im ernst, Ich fürchte Du hast am Anfang beim RAID erstellen einen Fehler gemacht und evt war's das mit den Daten.

Gruss
kuttkutt
kuttkutt 23.05.2009 um 09:51:08 Uhr
Goto Top
ja-nein. Ich weis nicht, ob die Meldung nun genau so dagestanden hat.

Das war also eher sinngemäß wiedergegeben. Aber es beantwortet meine Frage.

Es scheint nicht die Partitionstabelle hin zu sein, sondern irgend was anderes.

Erstellt habe ich es direkt über den Controller + Handbuch - Es ging ja auch.

Ich glaub ich mach die Festplatten platt und überleg mir was neues. Ob ich noch mal ein Raid 5 mache weis ich nicht so recht. Wenn jedes mal, wenn nur eine Platte ausfällt die Daten der anderen 3 mit den Bach runtergehen kann ich eigentlich auch gleich ein Raid 0 machen .... das ist auch beim lesen und schreiben schneller als ein Raid 5...
chips1
chips1 23.05.2009 um 11:25:22 Uhr
Goto Top
Hi
Mit schneller hast Du schon recht, aber ich als typischer Techniker würde den Fehler wissen wollen und beheben wollen. Wenn Du eh platt machen willst, hast Du ja Zeit, zum experimentieren. Erstelle mit dem Controller ein sauberes Raid 5 (achtung dauert ne ziemliche Weile) dann kopier ein paar Testdaten drauf und steck eine ab. Dann kannst Du den Extremfall hervorragend üben. Wenn Du schon einen einigermassen vernünftigen Controller hast, würde mich das reizen. Wenn man das RAID 5 sauber einrichtet, ist das schon eine gesund Portion Sicherheit.

Gruss Chips
kuttkutt
kuttkutt 23.05.2009 um 18:26:49 Uhr
Goto Top
Das werd ich auf jeden Fall tun - nicht, daß der Controller einen weg hat.

Der Adaptec 5405 soll nach den Tests gar nicht so schlecht sein.

Es gibt auch noch für nen hunterder ein Batterie Backup. Kann sein, daß der Controller nur damit vernünftig läuft.

Ich hab schon mal etwas gesucht, aber noch nichts richtiges gefunden, ob sich so etwas lohnt.
the15
the15 18.06.2009 um 12:59:43 Uhr
Goto Top
Toll,

habe den selben Fehler in unserer Debian-Installation.

Controller Adaptec SAS 5405 mit 4 SAS Seagate Cheata 15k.4 mit 450GB

Eine Platte ausgefallen piepsen hotswap fährt nicht an.
nach Reboot Partion kaputt.

Installation ist auch ca. 3 Monate alt.
Backup liegen zwar vor aber das ist ja wohl nicht Sinn und Zweck der Sache.

Da es sich um ein Produktiv - System handelt fehlen natürlich einige Stunden Arbeit....
... vom Restore mal ganz abgesehen.

Unsere anderen Systeme mit 3ware machen bei weiten nicht so einen Stress.

Never Adaptec again....

mfg
--the--
mrtux
mrtux 18.06.2009 um 14:40:56 Uhr
Goto Top
Hi !

Zitat von @the15:
Unsere anderen Systeme mit 3ware machen bei weiten nicht so einen
Stress.

Ich verwende unter Linux ausschliesslich nur noch diese Controller, die werden vom Kernel (auch bei selbstgebauten Kernels) sofort erkannt und laufen meiner Erfahrung nach problemlos.

Von daher kann ich die Aussage von --the-- nur bestätigen, ich weiss ich wiederhole mich aber natürlich fahre ich noch zusätzlich ein tägliches Backup, da RAID eben keine Datensicherung ist.

mrtux