Software RAID 5 neu synchronisieren unter Windows 2003 Server
Hallo!
Es ist zum Mäuse melken! Seit nunmehr einer Woche experimentiere ich damit rum, ein Software-RAID unter Windows 2003 Server wieder zum Laufen zu bekommen.
Vorab ein paar Informationen zum System:
Motherboard: ASUS A7N8X-E Deluxe (nForce2-Chipsatz)
Prozessor: AMD Athlon XP 2800+
RAM: 2 GB DDR-RAM
Festplatten: 1x Systemfestplatte (IDE, parallel)
6x SATAII-Festplatten (Maxtor 250 GB)
1x DVD-ROM (IDE, parallel)
Controller: 2x Promise SATA300 TX4
Die 6 SATA-Festplatten habe ich unter Windows zu einem Software-RAID zusammengeführt. Dieses hat also etwas über einen TB. Dies lief auch wunderbar. Nach ca. einer Woche konnte auf das RAID jedoch nicht mehr zugegriffen werden. In der Ereignisanzeige stand sinngemäß etwas von einem Controllerfehler. Die konkrete Fehlermeldung habe ich leider nicht mehr. Das Synchronisieren der Festplatten schlug immer fehl.
Demnach habe ich beide Controller ausgetauscht. Die Festplatten kann ich aber weiterhin nicht synchronisieren. Bei 67% ("Die Synchronisation wird wiederholt") tut sich nichts mehr. Der Zustand bleibt über Stunden dort stehen und die Festplatten werden mit der Zeit extrem heiß.
Alle Festplatten habe ich mit dem Diagnose-Tool von Maxtor getestet. Alle Festplatten seien in Ordnung. Die Fehlermeldung, welche Festplatte defekt sei, ändert sich nach jeder Synchronisation. Auf dem Screenshot war es z. B. die Festplatte 5. Jetzt ist es inzwischen die Festplatte 2.
Unter http://www.hjansen.de/etc/festplatten.jpg habe ich einen Screenshot der Computerverwaltung hinterlegt. Im Anhang füge ich Ausschnitte der Ereignisanzeige bei.
Wie kann ich das Problem lösen? Für Hilfe bin ich super dankbar!
Grüße aus Münster,
Hans Christian
Ereignistyp: Fehler
Ereignisquelle: dmboot
Ereigniskategorie: Keine
Ereigniskennung: 3
Datum: 23.04.2006
Zeit: 21:55:45
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
dmboot: Volume Raid1 (D konnte nicht gestartet werden.
Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 00 00 00 00 03 00 4e 00 ......N.
0008: 00 00 00 00 03 00 50 c0 ......PÀ
0010: 00 00 00 00 00 00 00 00 ........
0018: 01 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
Ereignistyp: Fehler
Ereignisquelle: ulsata2
Ereigniskategorie: Keine
Ereigniskennung: 9
Datum: 23.04.2006
Zeit: 16:55:00
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
Das Gerät \Device\Scsi\ulsata22 hat innerhalb der Fehlerwartezeit nicht geantwortet.
Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 0f 00 10 00 01 00 68 00 ......h.
0008: 00 00 00 00 09 00 04 c0 .......À
0010: 01 01 00 50 00 00 00 00 ...P....
0018: a7 05 01 00 00 00 00 00 §.......
0020: 00 00 00 00 00 00 00 00 ........
0028: 00 00 00 00 08 00 00 00 ........
0030: 00 00 00 00 07 00 00 00 ........
Ereignistyp: Informationen
Ereignisquelle: dmio
Ereigniskategorie: Keine
Ereigniskennung: 29
Datum: 23.04.2006
Zeit: 16:51:48
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
dmio: Harddisk5 Lesefehler bei Block 329123647: Status 0xc0000185
Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 00 00 00 00 04 00 4a 00 ......J.
0008: 00 00 00 00 1d 00 05 40 .......@
0010: 00 00 00 00 00 00 00 00 ........
0018: 01 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
Ereignistyp: Warnung
Ereignisquelle: Promise Disk Controller Message Agent
Ereigniskategorie: Keine
Ereigniskennung: 258
Datum: 23.04.2006
Zeit: 16:43:14
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
A media error occurred on disk1 LBA 0x0 at device path \card2\port3 .
Es ist zum Mäuse melken! Seit nunmehr einer Woche experimentiere ich damit rum, ein Software-RAID unter Windows 2003 Server wieder zum Laufen zu bekommen.
Vorab ein paar Informationen zum System:
Motherboard: ASUS A7N8X-E Deluxe (nForce2-Chipsatz)
Prozessor: AMD Athlon XP 2800+
RAM: 2 GB DDR-RAM
Festplatten: 1x Systemfestplatte (IDE, parallel)
6x SATAII-Festplatten (Maxtor 250 GB)
1x DVD-ROM (IDE, parallel)
Controller: 2x Promise SATA300 TX4
Die 6 SATA-Festplatten habe ich unter Windows zu einem Software-RAID zusammengeführt. Dieses hat also etwas über einen TB. Dies lief auch wunderbar. Nach ca. einer Woche konnte auf das RAID jedoch nicht mehr zugegriffen werden. In der Ereignisanzeige stand sinngemäß etwas von einem Controllerfehler. Die konkrete Fehlermeldung habe ich leider nicht mehr. Das Synchronisieren der Festplatten schlug immer fehl.
Demnach habe ich beide Controller ausgetauscht. Die Festplatten kann ich aber weiterhin nicht synchronisieren. Bei 67% ("Die Synchronisation wird wiederholt") tut sich nichts mehr. Der Zustand bleibt über Stunden dort stehen und die Festplatten werden mit der Zeit extrem heiß.
Alle Festplatten habe ich mit dem Diagnose-Tool von Maxtor getestet. Alle Festplatten seien in Ordnung. Die Fehlermeldung, welche Festplatte defekt sei, ändert sich nach jeder Synchronisation. Auf dem Screenshot war es z. B. die Festplatte 5. Jetzt ist es inzwischen die Festplatte 2.
Unter http://www.hjansen.de/etc/festplatten.jpg habe ich einen Screenshot der Computerverwaltung hinterlegt. Im Anhang füge ich Ausschnitte der Ereignisanzeige bei.
Wie kann ich das Problem lösen? Für Hilfe bin ich super dankbar!
Grüße aus Münster,
Hans Christian
Ereignistyp: Fehler
Ereignisquelle: dmboot
Ereigniskategorie: Keine
Ereigniskennung: 3
Datum: 23.04.2006
Zeit: 21:55:45
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
dmboot: Volume Raid1 (D konnte nicht gestartet werden.
Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 00 00 00 00 03 00 4e 00 ......N.
0008: 00 00 00 00 03 00 50 c0 ......PÀ
0010: 00 00 00 00 00 00 00 00 ........
0018: 01 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
Ereignistyp: Fehler
Ereignisquelle: ulsata2
Ereigniskategorie: Keine
Ereigniskennung: 9
Datum: 23.04.2006
Zeit: 16:55:00
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
Das Gerät \Device\Scsi\ulsata22 hat innerhalb der Fehlerwartezeit nicht geantwortet.
Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 0f 00 10 00 01 00 68 00 ......h.
0008: 00 00 00 00 09 00 04 c0 .......À
0010: 01 01 00 50 00 00 00 00 ...P....
0018: a7 05 01 00 00 00 00 00 §.......
0020: 00 00 00 00 00 00 00 00 ........
0028: 00 00 00 00 08 00 00 00 ........
0030: 00 00 00 00 07 00 00 00 ........
Ereignistyp: Informationen
Ereignisquelle: dmio
Ereigniskategorie: Keine
Ereigniskennung: 29
Datum: 23.04.2006
Zeit: 16:51:48
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
dmio: Harddisk5 Lesefehler bei Block 329123647: Status 0xc0000185
Weitere Informationen über die Hilfe- und Supportdienste erhalten Sie unter http://go.microsoft.com/fwlink/events.asp.
Daten:
0000: 00 00 00 00 04 00 4a 00 ......J.
0008: 00 00 00 00 1d 00 05 40 .......@
0010: 00 00 00 00 00 00 00 00 ........
0018: 01 00 00 00 00 00 00 00 ........
0020: 00 00 00 00 00 00 00 00 ........
Ereignistyp: Warnung
Ereignisquelle: Promise Disk Controller Message Agent
Ereigniskategorie: Keine
Ereigniskennung: 258
Datum: 23.04.2006
Zeit: 16:43:14
Benutzer: Nicht zutreffend
Computer: SRV01
Beschreibung:
A media error occurred on disk1 LBA 0x0 at device path \card2\port3 .
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 31015
Url: https://administrator.de/contentid/31015
Ausgedruckt am: 22.11.2024 um 15:11 Uhr
12 Kommentare
Neuester Kommentar
Hi,
unabhängig von Können oder nicht Können. Ich muss dir leider sagen, dass ich persönlich kein Software Raid 5 machen würde. Erstens bist du von Windows oder Linux, was auch immer abhängig und zweitens die Performance ist schlecht. Raid 5 ist von der Schreibperformance nicht gut, lediglich vom Kosten/Sicherheitsfaktor.
Ein Hardware Raid ist immer besser.
mfg
Thomas
unabhängig von Können oder nicht Können. Ich muss dir leider sagen, dass ich persönlich kein Software Raid 5 machen würde. Erstens bist du von Windows oder Linux, was auch immer abhängig und zweitens die Performance ist schlecht. Raid 5 ist von der Schreibperformance nicht gut, lediglich vom Kosten/Sicherheitsfaktor.
Ein Hardware Raid ist immer besser.
mfg
Thomas
wer ein ein raid-5 als software-raid unter windows aufsetzt ist schon eine echte spielernatur .)
also mal im ernst: sei froh das du die daten noch lesen kannst, sicher die daten und kauf die einen gescheiten hardware raid controller und schliess auch eine hot-spare platte als ersatz an, falls mal eine ausfällt.
ob nun raid 5 oder 1-2 400er platten als spiegelung musst du wissen, spiegelung hat den vorteil das die daten auch bei argen plattenproblemen imemr noch zzumindest teilweise lesbar sind und mit üblichen recover tools gerettet werden können.
gruß,
supa
also mal im ernst: sei froh das du die daten noch lesen kannst, sicher die daten und kauf die einen gescheiten hardware raid controller und schliess auch eine hot-spare platte als ersatz an, falls mal eine ausfällt.
ob nun raid 5 oder 1-2 400er platten als spiegelung musst du wissen, spiegelung hat den vorteil das die daten auch bei argen plattenproblemen imemr noch zzumindest teilweise lesbar sind und mit üblichen recover tools gerettet werden können.
gruß,
supa
So wie es aussieht ist die Raid-Struktur defekt und die lässt sich nicht
mehr reparieren, wenn es die Synchronisation nicht macht.
Wenn man schon soviel investiert, dann sollte man auch gleich einen
Hardware-Raidkontroller kaufen.
1.) weil man damit den Vorteil von echtem Hardware-Raid-Sicherheit bekommt
2.) weil der Batterie-Pack und der CacheSpeicher der Kontrollereinheit auf den neuen
Adapter mitgezügelt werden kann und somit auch die Cachedaten nicht verloren
gehen
3.) weil der Kontroller in der Regel WriteCache-Funktionen bietet
Die MS-Windows-Raid sind sehr heikel auf Strutur-Defekte, weshalb sich das Problem
von Disk zu Disk verlegen kann. Ich hab das auch schon beobachtet. Teilweise konnte
ich einen Teil der Daten nach einiger Nachtarbeit noch retten, aber sehr viele Dateien waren einfach korrupt. Finger weg von Software-Raid und bei solchen Datenmengen
ohnehin.
Grundsätzlich funktionieren Software-Raids, aber wenn es zu Troubles kommt, dann sind
die Daten einfach gefährdet und gerade für diesen Fall hatte man ja ein RAID aufgebaut...
mehr reparieren, wenn es die Synchronisation nicht macht.
Wenn man schon soviel investiert, dann sollte man auch gleich einen
Hardware-Raidkontroller kaufen.
1.) weil man damit den Vorteil von echtem Hardware-Raid-Sicherheit bekommt
2.) weil der Batterie-Pack und der CacheSpeicher der Kontrollereinheit auf den neuen
Adapter mitgezügelt werden kann und somit auch die Cachedaten nicht verloren
gehen
3.) weil der Kontroller in der Regel WriteCache-Funktionen bietet
Die MS-Windows-Raid sind sehr heikel auf Strutur-Defekte, weshalb sich das Problem
von Disk zu Disk verlegen kann. Ich hab das auch schon beobachtet. Teilweise konnte
ich einen Teil der Daten nach einiger Nachtarbeit noch retten, aber sehr viele Dateien waren einfach korrupt. Finger weg von Software-Raid und bei solchen Datenmengen
ohnehin.
Grundsätzlich funktionieren Software-Raids, aber wenn es zu Troubles kommt, dann sind
die Daten einfach gefährdet und gerade für diesen Fall hatte man ja ein RAID aufgebaut...
Hallo,
ich halte das hier geschriebene in Bezug auf die Vorteile für Hardware Controller, für sehr fragwürdig.
Ein HW-Controller entlastet die CPU, richtig, aber ist das heute noch relevant? Ein Server in einem Unternehmen mit 10-20 Rechnern z.B. dürfte selten CPU technisch auch nur annähernd ausgelastet sein, wenn dieser in erster Linie als File-Server dient.
Der Vorteil eines Software Raid mit Windows Server 2003 in Puncto Sicherheit hat sich doch hier ganz klar gezeigt: Der Controller war kaputt, eine Platte war kaputt und trotzdem sind alle Daten noch da. Da es sich um ein Software Raid handelt, kann nämlich auch der Controller hops gehen. Hätter der User ein Controller-basiertes Raid gehabt, wäre jetzt alles weg.
Das Hauptrisiko beim Raid 5 liegt nämlich ganz klar beim Controller, und das merzt man mit softwarebasiertem Raid bestens aus.
A.
ich halte das hier geschriebene in Bezug auf die Vorteile für Hardware Controller, für sehr fragwürdig.
Ein HW-Controller entlastet die CPU, richtig, aber ist das heute noch relevant? Ein Server in einem Unternehmen mit 10-20 Rechnern z.B. dürfte selten CPU technisch auch nur annähernd ausgelastet sein, wenn dieser in erster Linie als File-Server dient.
Der Vorteil eines Software Raid mit Windows Server 2003 in Puncto Sicherheit hat sich doch hier ganz klar gezeigt: Der Controller war kaputt, eine Platte war kaputt und trotzdem sind alle Daten noch da. Da es sich um ein Software Raid handelt, kann nämlich auch der Controller hops gehen. Hätter der User ein Controller-basiertes Raid gehabt, wäre jetzt alles weg.
Das Hauptrisiko beim Raid 5 liegt nämlich ganz klar beim Controller, und das merzt man mit softwarebasiertem Raid bestens aus.
A.
-> Ein HW-Controller entlastet die CPU, richtig, aber ist das heute noch relevant? Ein Server in
-> einem Unternehmen mit 10-20 Rechnern z.B. dürfte selten CPU technisch auch nur
-> annähernd ausgelastet sein, wenn dieser in erster Linie als File-Server dient.
Warum die CPU belasten, wenn ich das auf eine dedizierter Einheit zu verträglichen Kosten realisieren kann. Abgesehen davon, läuft ein Wintel-Server besser, wenn man einen CPU-Load
tief hält. Alleine das unplanbare Loadverhalten von Windows-Rechnern verlangt doch danach.
-> Der Vorteil eines Software Raid mit Windows Server 2003 in Puncto Sicherheit hat sich doch
-> hier ganz klar gezeigt: Der Controller war kaputt, eine Platte war kaputt und trotzdem sind
-> alle Daten noch da. Da es sich um ein Software Raid handelt, kann nämlich auch der
-> Controller hops gehen. Hätter der User ein Controller-basiertes Raid gehabt, wäre jetzt
-> alles weg.
Das stimmt doch einfach gar nicht ! Vielleicht bei Aldi-Controllern mag das so sein, aber bei einem vernünftigen RAID-Controller geht überhaupt nichts verloren, da die Raid-Konfigurationen sowohl auf dem batteriegestützten Controller-Cache-Modul wie auch auf den Platten gespeichert werden. Software-Raids sind wesentlich heikler und instabiler als Hardware-Raids, glaubs mir bitte. Mal abgesehen von den vielen Features, die ein Software-Raid nicht hat. (Automatische Blockumlagerung etc etc.)
-> Das Hauptrisiko beim Raid 5 liegt nämlich ganz klar beim Controller, und das merzt man mit
-> softwarebasiertem Raid bestens aus.
Das stimmt nur bei billigen Controllern, sonst überhaupt nicht; Bei OS-Wechseln oder sogar teilweise bei Upgrades, kann es vorkommen, dass dein Software-Raid fehlerhaft läuft oder sogar überhaupt nicht migrierbar mehr ist...
Ich sag dies alles nicht, weil ich schon EMC und Netapp-Systeme installiert und supported habe, sondern weil mich privat schon manches Software-Raid über die letzten 15 Jahre hängenliess. Und ob du's glaubst oder nicht, es waren mehr Software-Raids, die Probleme machten, als Hardware-Raids.
-> einem Unternehmen mit 10-20 Rechnern z.B. dürfte selten CPU technisch auch nur
-> annähernd ausgelastet sein, wenn dieser in erster Linie als File-Server dient.
Warum die CPU belasten, wenn ich das auf eine dedizierter Einheit zu verträglichen Kosten realisieren kann. Abgesehen davon, läuft ein Wintel-Server besser, wenn man einen CPU-Load
tief hält. Alleine das unplanbare Loadverhalten von Windows-Rechnern verlangt doch danach.
-> Der Vorteil eines Software Raid mit Windows Server 2003 in Puncto Sicherheit hat sich doch
-> hier ganz klar gezeigt: Der Controller war kaputt, eine Platte war kaputt und trotzdem sind
-> alle Daten noch da. Da es sich um ein Software Raid handelt, kann nämlich auch der
-> Controller hops gehen. Hätter der User ein Controller-basiertes Raid gehabt, wäre jetzt
-> alles weg.
Das stimmt doch einfach gar nicht ! Vielleicht bei Aldi-Controllern mag das so sein, aber bei einem vernünftigen RAID-Controller geht überhaupt nichts verloren, da die Raid-Konfigurationen sowohl auf dem batteriegestützten Controller-Cache-Modul wie auch auf den Platten gespeichert werden. Software-Raids sind wesentlich heikler und instabiler als Hardware-Raids, glaubs mir bitte. Mal abgesehen von den vielen Features, die ein Software-Raid nicht hat. (Automatische Blockumlagerung etc etc.)
-> Das Hauptrisiko beim Raid 5 liegt nämlich ganz klar beim Controller, und das merzt man mit
-> softwarebasiertem Raid bestens aus.
Das stimmt nur bei billigen Controllern, sonst überhaupt nicht; Bei OS-Wechseln oder sogar teilweise bei Upgrades, kann es vorkommen, dass dein Software-Raid fehlerhaft läuft oder sogar überhaupt nicht migrierbar mehr ist...
Ich sag dies alles nicht, weil ich schon EMC und Netapp-Systeme installiert und supported habe, sondern weil mich privat schon manches Software-Raid über die letzten 15 Jahre hängenliess. Und ob du's glaubst oder nicht, es waren mehr Software-Raids, die Probleme machten, als Hardware-Raids.
Was sind den Aldi Controller und was nicht? Woran erkenne ich, dass ein Controller nach seinem eigenen Austausch das Raid wieder findet? Theoretisch muss ich dann gleich zwei Controller des gleichen Typs kaufen, richtig? Oder gibt es einen definierten Standard für diese Funktionalität?
Ich bin auch grad dabei, einen neuen Server zu bauen und befasse mich ernsthaft mit dem Gedanken, das Raid von Windows Server 2003 managen zu lassen, eben wegen der Argumentation oben. Die Chance, dass ich das Betriebssystem auf Unix oder keine Ahnung was umstelle, ist gleich Null.
Mein Controller im jetzigen Server, an welchem 8 Platten hängen, 2x5 Raid läuft, funktioniert zwar seit 2 Jahren tadellos, aber ich frage mich immer: Was ist wenn der Controller ausfällt? Von meinem Betriebssystem mache ich eine 1:1 Spiegelung der Partition und habe damit ein Backup des "Controllers", aber bei einem Hardware-Controller? Wie gesagt, ich müsste zwei identische und noch dazu teure Controller kaufen um den gleichen Effekt zu haben. Vermutlich reden wir hier nicht über 100-200 EUR , sondern über wesentlich mehr.
Korrigier mich bitte wenn ich falsch liege. Ich möchte auch für mich die richtige Entscheidung treffen können, daher bin ich froh für alle Erfahrungswerte.
Danke.
A.
Ich bin auch grad dabei, einen neuen Server zu bauen und befasse mich ernsthaft mit dem Gedanken, das Raid von Windows Server 2003 managen zu lassen, eben wegen der Argumentation oben. Die Chance, dass ich das Betriebssystem auf Unix oder keine Ahnung was umstelle, ist gleich Null.
Mein Controller im jetzigen Server, an welchem 8 Platten hängen, 2x5 Raid läuft, funktioniert zwar seit 2 Jahren tadellos, aber ich frage mich immer: Was ist wenn der Controller ausfällt? Von meinem Betriebssystem mache ich eine 1:1 Spiegelung der Partition und habe damit ein Backup des "Controllers", aber bei einem Hardware-Controller? Wie gesagt, ich müsste zwei identische und noch dazu teure Controller kaufen um den gleichen Effekt zu haben. Vermutlich reden wir hier nicht über 100-200 EUR , sondern über wesentlich mehr.
Korrigier mich bitte wenn ich falsch liege. Ich möchte auch für mich die richtige Entscheidung treffen können, daher bin ich froh für alle Erfahrungswerte.
Danke.
A.