hcjansen
Goto Top

Software RAID 5 neu synchronisieren unter Windows 2003 Server

Hallo!

Es ist zum Mäuse melken! Seit nunmehr einer Woche experimentiere ich damit rum, ein Software-RAID unter Windows 2003 Server wieder zum Laufen zu bekommen.

Vorab ein paar Informationen zum System:
Motherboard: ASUS A7N8X-E Deluxe (nForce2-Chipsatz)
Prozessor: AMD Athlon XP 2800+
RAM: 2 GB DDR-RAM
Festplatten: 1x Systemfestplatte (IDE, parallel)
6x SATAII-Festplatten (Maxtor 250 GB)
1x DVD-ROM (IDE, parallel)
Controller: 2x Promise SATA300 TX4

Die 6 SATA-Festplatten habe ich unter Windows zu einem Software-RAID zusammengeführt. Dieses hat also etwas über einen TB. Dies lief auch wunderbar. Nach ca. einer Woche konnte auf das RAID jedoch nicht mehr zugegriffen werden. In der Ereignisanzeige stand sinngemäß etwas von einem Controllerfehler. Die konkrete Fehlermeldung habe ich leider nicht mehr. Das Synchronisieren der Festplatten schlug immer fehl.
Demnach habe ich beide Controller ausgetauscht. Die Festplatten kann ich aber weiterhin nicht synchronisieren. Bei 67% ("Die Synchronisation wird wiederholt") tut sich nichts mehr. Der Zustand bleibt über Stunden dort stehen und die Festplatten werden mit der Zeit extrem heiß.

Alle Festplatten habe ich mit dem Diagnose-Tool von Maxtor getestet. Alle Festplatten seien in Ordnung. Die Fehlermeldung, welche Festplatte defekt sei, ändert sich nach jeder Synchronisation. Auf dem Screenshot war es z. B. die Festplatte 5. Jetzt ist es inzwischen die Festplatte 2.

Unter http://www.hjansen.de/etc/festplatten.jpg habe ich einen Screenshot der Computerverwaltung hinterlegt. Im Anhang füge ich Ausschnitte der Ereignisanzeige bei.

Wie kann ich das Problem lösen? Für Hilfe bin ich super dankbar!

Grüße aus Münster,

Hans Christian

Ereignistyp: Fehler
Ereignisquelle: dmboot
Ereigniskategorie: Keine
Ereigniskennung: 3
Datum: 23.04.2006
Zeit: 21:55:45
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
dmboot: Volume Raid1 (Dface-smile konnte nicht gestartet werden.

Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 00 00 00 00 03 00 4e 00 ......N.
0008: 00 00 00 00 03 00 50 c0 ......PÀ
0010: 00 00 00 00 00 00 00 00 ........
0018: 01 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
Ereignistyp: Fehler
Ereignisquelle: ulsata2
Ereigniskategorie: Keine
Ereigniskennung: 9
Datum: 23.04.2006
Zeit: 16:55:00
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
Das Gerät \Device\Scsi\ulsata22 hat innerhalb der Fehlerwartezeit nicht geantwortet.

Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 0f 00 10 00 01 00 68 00 ......h.
0008: 00 00 00 00 09 00 04 c0 .......À
0010: 01 01 00 50 00 00 00 00 ...P....
0018: a7 05 01 00 00 00 00 00 §.......
0020: 00 00 00 00 00 00 00 00 ........
0028: 00 00 00 00 08 00 00 00 ........
0030: 00 00 00 00 07 00 00 00 ........
Ereignistyp: Informationen
Ereignisquelle: dmio
Ereigniskategorie: Keine
Ereigniskennung: 29
Datum: 23.04.2006
Zeit: 16:51:48
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
dmio: Harddisk5 Lesefehler bei Block 329123647: Status 0xc0000185

Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 00 00 00 00 04 00 4a 00 ......J.
0008: 00 00 00 00 1d 00 05 40 .......@
0010: 00 00 00 00 00 00 00 00 ........
0018: 01 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
Ereignistyp: Warnung
Ereignisquelle: Promise Disk Controller Message Agent
Ereigniskategorie: Keine
Ereigniskennung: 258
Datum: 23.04.2006
Zeit: 16:43:14
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
A media error occurred on disk1 LBA 0x0 at device path \card2\port3 .

Content-Key: 31015

Url: https://administrator.de/contentid/31015

Ausgedruckt am: 28.03.2024 um 23:03 Uhr

Mitglied: pinguin79
pinguin79 24.04.2006 um 11:12:53 Uhr
Goto Top
Hallo,
zum einen scheint nach deiner Meldung die Harddisk5 defekt zu sein
Und warum willst du das Raid über Windows machen? Hat der Controller nicht die Möglichkeit, ein Raid über den Controller zu definieren?
Mitglied: pinguin79
pinguin79 24.04.2006 um 11:15:26 Uhr
Goto Top
was ich gerade vergessen habe:
Hast du noch Daten auf dem Raid?
Falls nein, löse es komplett auf und erstelle es neu. Evtl. wird der Fehler einer Platte auf die anderen repliziert...
Mitglied: hcjansen
hcjansen 24.04.2006 um 11:17:47 Uhr
Goto Top
Ja, auf dem RAID sind leider Daten, die ich aber runterkopieren kann.
Der Controller unterstützt leider kein RAID 5, weshalb ich ein Software-RAID benötige.
Ich werde nun versuchen, die Daten zu sichern und dann das RAID aufzulösen, um es danach neu zu erstellen.
Mitglied: pinguin79
pinguin79 24.04.2006 um 11:45:37 Uhr
Goto Top
Hi,
hast du evtl. dein Raid auseinander gebaut und die HDDs nicht in der richtigen Reihenfolge wieder zusammengesetzt?
Mitglied: NaCkHaYeD
NaCkHaYeD 24.04.2006 um 12:59:17 Uhr
Goto Top
Hi,

unabhängig von Können oder nicht Können. Ich muss dir leider sagen, dass ich persönlich kein Software Raid 5 machen würde. Erstens bist du von Windows oder Linux, was auch immer abhängig und zweitens die Performance ist schlecht. Raid 5 ist von der Schreibperformance nicht gut, lediglich vom Kosten/Sicherheitsfaktor.
Ein Hardware Raid ist immer besser.

mfg
Thomas
Mitglied: NaCkHaYeD
NaCkHaYeD 24.04.2006 um 12:59:20 Uhr
Goto Top
  • sorry for Doppelpost* rrrr, i hate ISA Proxy Server

mfg
Thomas
Mitglied: Supaman
Supaman 26.04.2006 um 16:22:09 Uhr
Goto Top
wer ein ein raid-5 als software-raid unter windows aufsetzt ist schon eine echte spielernatur .)

also mal im ernst: sei froh das du die daten noch lesen kannst, sicher die daten und kauf die einen gescheiten hardware raid controller und schliess auch eine hot-spare platte als ersatz an, falls mal eine ausfällt.

ob nun raid 5 oder 1-2 400er platten als spiegelung musst du wissen, spiegelung hat den vorteil das die daten auch bei argen plattenproblemen imemr noch zzumindest teilweise lesbar sind und mit üblichen recover tools gerettet werden können.

gruß,

supa
Mitglied: hcjansen
hcjansen 23.05.2006 um 19:41:49 Uhr
Goto Top
Hallo!

Das Problem gilt als gelöst: Defekt war eine Festplatte UND der Controller. Nach langem hin und her läuft das System nun absolut stabil... und alle Daten sind noch da face-smile

Danke für Eure Hilfe!

Grüße aus Münster,
Hans Christian
Mitglied: JoeWied
JoeWied 15.11.2006 um 22:11:21 Uhr
Goto Top
So wie es aussieht ist die Raid-Struktur defekt und die lässt sich nicht
mehr reparieren, wenn es die Synchronisation nicht macht.
Wenn man schon soviel investiert, dann sollte man auch gleich einen
Hardware-Raidkontroller kaufen.
1.) weil man damit den Vorteil von echtem Hardware-Raid-Sicherheit bekommt
2.) weil der Batterie-Pack und der CacheSpeicher der Kontrollereinheit auf den neuen
Adapter mitgezügelt werden kann und somit auch die Cachedaten nicht verloren
gehen
3.) weil der Kontroller in der Regel WriteCache-Funktionen bietet

Die MS-Windows-Raid sind sehr heikel auf Strutur-Defekte, weshalb sich das Problem
von Disk zu Disk verlegen kann. Ich hab das auch schon beobachtet. Teilweise konnte
ich einen Teil der Daten nach einiger Nachtarbeit noch retten, aber sehr viele Dateien waren einfach korrupt. Finger weg von Software-Raid und bei solchen Datenmengen
ohnehin.

Grundsätzlich funktionieren Software-Raids, aber wenn es zu Troubles kommt, dann sind
die Daten einfach gefährdet und gerade für diesen Fall hatte man ja ein RAID aufgebaut...
Mitglied: Authorist
Authorist 24.04.2007 um 10:57:54 Uhr
Goto Top
Hallo,

ich halte das hier geschriebene in Bezug auf die Vorteile für Hardware Controller, für sehr fragwürdig.
Ein HW-Controller entlastet die CPU, richtig, aber ist das heute noch relevant? Ein Server in einem Unternehmen mit 10-20 Rechnern z.B. dürfte selten CPU technisch auch nur annähernd ausgelastet sein, wenn dieser in erster Linie als File-Server dient.

Der Vorteil eines Software Raid mit Windows Server 2003 in Puncto Sicherheit hat sich doch hier ganz klar gezeigt: Der Controller war kaputt, eine Platte war kaputt und trotzdem sind alle Daten noch da. Da es sich um ein Software Raid handelt, kann nämlich auch der Controller hops gehen. Hätter der User ein Controller-basiertes Raid gehabt, wäre jetzt alles weg.

Das Hauptrisiko beim Raid 5 liegt nämlich ganz klar beim Controller, und das merzt man mit softwarebasiertem Raid bestens aus.

A.
Mitglied: JoeWied
JoeWied 24.04.2007 um 11:14:42 Uhr
Goto Top
-> Ein HW-Controller entlastet die CPU, richtig, aber ist das heute noch relevant? Ein Server in
-> einem Unternehmen mit 10-20 Rechnern z.B. dürfte selten CPU technisch auch nur
-> annähernd ausgelastet sein, wenn dieser in erster Linie als File-Server dient.
Warum die CPU belasten, wenn ich das auf eine dedizierter Einheit zu verträglichen Kosten realisieren kann. Abgesehen davon, läuft ein Wintel-Server besser, wenn man einen CPU-Load
tief hält. Alleine das unplanbare Loadverhalten von Windows-Rechnern verlangt doch danach.

-> Der Vorteil eines Software Raid mit Windows Server 2003 in Puncto Sicherheit hat sich doch
-> hier ganz klar gezeigt: Der Controller war kaputt, eine Platte war kaputt und trotzdem sind
-> alle Daten noch da. Da es sich um ein Software Raid handelt, kann nämlich auch der
-> Controller hops gehen. Hätter der User ein Controller-basiertes Raid gehabt, wäre jetzt
-> alles weg.
Das stimmt doch einfach gar nicht ! Vielleicht bei Aldi-Controllern mag das so sein, aber bei einem vernünftigen RAID-Controller geht überhaupt nichts verloren, da die Raid-Konfigurationen sowohl auf dem batteriegestützten Controller-Cache-Modul wie auch auf den Platten gespeichert werden. Software-Raids sind wesentlich heikler und instabiler als Hardware-Raids, glaubs mir bitte. Mal abgesehen von den vielen Features, die ein Software-Raid nicht hat. (Automatische Blockumlagerung etc etc.)

-> Das Hauptrisiko beim Raid 5 liegt nämlich ganz klar beim Controller, und das merzt man mit
-> softwarebasiertem Raid bestens aus.
Das stimmt nur bei billigen Controllern, sonst überhaupt nicht; Bei OS-Wechseln oder sogar teilweise bei Upgrades, kann es vorkommen, dass dein Software-Raid fehlerhaft läuft oder sogar überhaupt nicht migrierbar mehr ist...

Ich sag dies alles nicht, weil ich schon EMC und Netapp-Systeme installiert und supported habe, sondern weil mich privat schon manches Software-Raid über die letzten 15 Jahre hängenliess. Und ob du's glaubst oder nicht, es waren mehr Software-Raids, die Probleme machten, als Hardware-Raids.
Mitglied: Authorist
Authorist 24.04.2007 um 11:30:44 Uhr
Goto Top
Was sind den Aldi Controller und was nicht? Woran erkenne ich, dass ein Controller nach seinem eigenen Austausch das Raid wieder findet? Theoretisch muss ich dann gleich zwei Controller des gleichen Typs kaufen, richtig? Oder gibt es einen definierten Standard für diese Funktionalität?

Ich bin auch grad dabei, einen neuen Server zu bauen und befasse mich ernsthaft mit dem Gedanken, das Raid von Windows Server 2003 managen zu lassen, eben wegen der Argumentation oben. Die Chance, dass ich das Betriebssystem auf Unix oder keine Ahnung was umstelle, ist gleich Null.

Mein Controller im jetzigen Server, an welchem 8 Platten hängen, 2x5 Raid läuft, funktioniert zwar seit 2 Jahren tadellos, aber ich frage mich immer: Was ist wenn der Controller ausfällt? Von meinem Betriebssystem mache ich eine 1:1 Spiegelung der Partition und habe damit ein Backup des "Controllers", aber bei einem Hardware-Controller? Wie gesagt, ich müsste zwei identische und noch dazu teure Controller kaufen um den gleichen Effekt zu haben. Vermutlich reden wir hier nicht über 100-200 EUR , sondern über wesentlich mehr.

Korrigier mich bitte wenn ich falsch liege. Ich möchte auch für mich die richtige Entscheidung treffen können, daher bin ich froh für alle Erfahrungswerte.

Danke.

A.