Raid 1 Problem mit Intel Matrix Storage Console und Windows Server 2003 Standard 64 Bit
Raid 1 funktioniert ca. 4 Wochen dann ständiger Ausfall einer Platte mit der Fehlermeldung "Festplatte felht".
Hallo allerseits,
ich hoffe hier kann mir einer weiterhelfen oder einen brauchbaren Tipp geben.
Folgendes Problem:
Ich habe ein Raid (SATA) 2 x Maxtor Maxline je 250 GB SATA-II Festplatten über die Software Intel Matrix Storage Console zu einem Raid 1 Verbund als Plattenspiegelung laufen. Dies funktioniert auch soweit wunderbar, allerdings erscheint nach ca. 3-4 Wochen Betrieb oder noch starken Datenzugriffen, kann man nicht genau sagen, die Fehlermeldung "Raid wurde heruntergestuft bitte Platte wechseln" wenn man dann über die Intel Software nachschaut fehlt tatsächlich die zweite Platte auf die gespiegelt wurde bzw. wird als "fehlt" gemeldet. Ich habe diese Platte schon mahrfach erneuert und überprüft jedoch funktionieren diese Platten reibungslos und ohne Fehler daher kann es meiner Meinung nach nicht an den Platten liegen. Wenn ich nun den Server herunterfahre und Neustarte kann ich die Platte wieder einrichten bzw. einen Datenabgleich durchführen dies dauert dann ca. 2 Stunden und mein Raidverbund ist wieder voll funktionsfähig. Ich habe auch schon mal das Board so wie die SATA-Kabel erneuert brachte alles keinen Erfolg. Ich habe mal gehört das die Platten evtl. einen "Time out" haben können bei sehr hoher Belastung und wenn dann der Raidcontroller keine Antwort erhält er die Platte als defekt einstufft kann das evtl. hier der Fall sein? Ich meine aber bei derart hochwertigen Platten mit 16MB Cache MAXLINE III kann das doch nicht vorkommen oder?
Ich würde mich freuen wenn einer von euch einen Rat hätte.
Gruß
jup25
Hallo allerseits,
ich hoffe hier kann mir einer weiterhelfen oder einen brauchbaren Tipp geben.
Folgendes Problem:
Ich habe ein Raid (SATA) 2 x Maxtor Maxline je 250 GB SATA-II Festplatten über die Software Intel Matrix Storage Console zu einem Raid 1 Verbund als Plattenspiegelung laufen. Dies funktioniert auch soweit wunderbar, allerdings erscheint nach ca. 3-4 Wochen Betrieb oder noch starken Datenzugriffen, kann man nicht genau sagen, die Fehlermeldung "Raid wurde heruntergestuft bitte Platte wechseln" wenn man dann über die Intel Software nachschaut fehlt tatsächlich die zweite Platte auf die gespiegelt wurde bzw. wird als "fehlt" gemeldet. Ich habe diese Platte schon mahrfach erneuert und überprüft jedoch funktionieren diese Platten reibungslos und ohne Fehler daher kann es meiner Meinung nach nicht an den Platten liegen. Wenn ich nun den Server herunterfahre und Neustarte kann ich die Platte wieder einrichten bzw. einen Datenabgleich durchführen dies dauert dann ca. 2 Stunden und mein Raidverbund ist wieder voll funktionsfähig. Ich habe auch schon mal das Board so wie die SATA-Kabel erneuert brachte alles keinen Erfolg. Ich habe mal gehört das die Platten evtl. einen "Time out" haben können bei sehr hoher Belastung und wenn dann der Raidcontroller keine Antwort erhält er die Platte als defekt einstufft kann das evtl. hier der Fall sein? Ich meine aber bei derart hochwertigen Platten mit 16MB Cache MAXLINE III kann das doch nicht vorkommen oder?
Ich würde mich freuen wenn einer von euch einen Rat hätte.
Gruß
jup25
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 34928
Url: https://administrator.de/contentid/34928
Ausgedruckt am: 26.11.2024 um 12:11 Uhr
6 Kommentare
Neuester Kommentar
Hi,
ich denke, Deine Idee mit dem Timeout könnte hinkommen.
Ich kenne diese Timeouts zwar nur aus dem SCSI- Bereich, die Gründe sind aber gleich.
Solche Timeouts sind an sich nichts besonderes (ausser sie treten sehr häufig an gleicher Stelle auf, dann liegt ein HW Defekt vor), wenn allerdings der Kontroller "überreagiert", nimmt er die Platte raus, obwohl dies unnötig wäre.
Da Du die HW schon getauscht hast (Kabel??? ist bei SATA oft ein Problem!!!), könnte man das wohl ausschließen.
Behoben werden kann dieser Fehler (sofern kein HW Defekt vorliegt) durch einen Firmwareupgrade des Kontrollers bzw. Timeout- Settings in der Konfig (ich kenne das Ding leider nicht).
Frag mal beim Support nach...
Gruß - Toni
ich denke, Deine Idee mit dem Timeout könnte hinkommen.
Ich kenne diese Timeouts zwar nur aus dem SCSI- Bereich, die Gründe sind aber gleich.
Solche Timeouts sind an sich nichts besonderes (ausser sie treten sehr häufig an gleicher Stelle auf, dann liegt ein HW Defekt vor), wenn allerdings der Kontroller "überreagiert", nimmt er die Platte raus, obwohl dies unnötig wäre.
Da Du die HW schon getauscht hast (Kabel??? ist bei SATA oft ein Problem!!!), könnte man das wohl ausschließen.
Behoben werden kann dieser Fehler (sofern kein HW Defekt vorliegt) durch einen Firmwareupgrade des Kontrollers bzw. Timeout- Settings in der Konfig (ich kenne das Ding leider nicht).
Frag mal beim Support nach...
Gruß - Toni
Tja, über die onboard SATA- Raid- (Soft) Kontroller wurde hier ja schon viel geschrieben,
es gibt eigentlich nur eine sinnvolle Alternative, und das ist ein "vernünftiger" HW- Raid- Kontroller.
Da führt kein Weg vorbei, die onboards sind bis auf ganz wenige, von Haus aus teure Boards, Ramschware, deren Einsatz meist mehr Ärger verursacht, als darauf zu verzichten.
Daß es mit W2K3 keine Probleme gibt, liegt eben daran, daß es sich um SW handelt, welche von diesem OS vielleicht etwas anders verwaltet wird. Die lernen ja schließlich auch dazu...
Gruß - Toni
P.S.: die Meldungen, daß die Daten bei einem Upgrade auf 6.0 verloren gehen, kann ich so nicht glauben, vermutlich wird nur auf die Möglichkeit verwiesen (Hund /Microwelle). Aber ausschließen kann man es letztendlich auch nicht...
es gibt eigentlich nur eine sinnvolle Alternative, und das ist ein "vernünftiger" HW- Raid- Kontroller.
Da führt kein Weg vorbei, die onboards sind bis auf ganz wenige, von Haus aus teure Boards, Ramschware, deren Einsatz meist mehr Ärger verursacht, als darauf zu verzichten.
Daß es mit W2K3 keine Probleme gibt, liegt eben daran, daß es sich um SW handelt, welche von diesem OS vielleicht etwas anders verwaltet wird. Die lernen ja schließlich auch dazu...
Gruß - Toni
P.S.: die Meldungen, daß die Daten bei einem Upgrade auf 6.0 verloren gehen, kann ich so nicht glauben, vermutlich wird nur auf die Möglichkeit verwiesen (Hund /Microwelle). Aber ausschließen kann man es letztendlich auch nicht...
Prinzipiell bedeutet das Auflösen des Raids nicht gleich Datenverlust, solange keine Formatierung oder Initialisierung erfolgt. Mit SCSI Arrays hab ich da schon die verrücktesten Dinger veranstaltet, es ist teilweise nicht zu glauben, was man anstellen muß, bis nichts mehr geht.
Allerdings war es natürlich immer ein Testsystem, Datenverlust kein Thema.
Leider weiß man nie vorher so genau, was die SW als nächstes tun wird, und hinterher ist es zu spät.
Ich hatte vorher total übersehen, daß die Raid- Treiber ja im OS laufen, von daher klingt die Aussage mit dem Totalverlust schon recht plausibel.
Image wäre natürlich in MUSS bevor man das angeht, allerdings hast Du dann, wenns schiefläuft, das alte System mit allen Macken.
Fazit: Never touch a running system....
Gruß - Toni
Allerdings war es natürlich immer ein Testsystem, Datenverlust kein Thema.
Leider weiß man nie vorher so genau, was die SW als nächstes tun wird, und hinterher ist es zu spät.
Ich hatte vorher total übersehen, daß die Raid- Treiber ja im OS laufen, von daher klingt die Aussage mit dem Totalverlust schon recht plausibel.
Image wäre natürlich in MUSS bevor man das angeht, allerdings hast Du dann, wenns schiefläuft, das alte System mit allen Macken.
Fazit: Never touch a running system....
Gruß - Toni