tshunsh
Goto Top

SLES 9 Raid Array Problem

Hallo Leute,

ich habe ein seltsames Problem am Server und zwar:

Maxdata 19" Server mit SCSI Vortex Controller 4x SCA Platten
1 Platte ist mit Betriebsystem SLES 9 bespielt
3 Platten in ein Array raid 0 zusammen gefasst

nur zum Problem, in regelmäßigen Abständen (2 bis 3Wochen) wird Array nicht mehr vom
System erkannt, wenn ich das System neu hoch fahre, funktioniert alles wider wie gehabt.
Die Festplatten habe ich einzeln überprüft, alles in Ordnung.
Hat jemand ne Idee was das sein könnte?

Im Log steht folgendes:

Sep 18 09:50:26 fileserver kernel: Device sdb not ready.
Sep 18 09:50:26 fileserver kernel: end_request: I/O error, dev sdb, sector 86512295
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814029
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814030
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814031
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814032
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814033
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814034
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814035
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814036
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814037
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814038
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Device sdb not ready.

mfg Tshunsh

Content-Key: 40336

Url: https://administrator.de/contentid/40336

Ausgedruckt am: 28.03.2024 um 21:03 Uhr

Mitglied: leknilk0815
leknilk0815 18.09.2006 um 13:21:18 Uhr
Goto Top
Hi,
ich weiß nicht, wie Du die Platten einzeln überprüft hast, aber die Fehlermeldung und die Symptome deuten schon recht eindeutig auf einen Disk- Error hin.
Regelmässigkeit:
evt. macht der Kontroller zu der Zeit einen Konsistenz- Check, bei dem der Fehler auftritt. Mal die Konfig darauf prüfen, bzw. manuell einen Check anstoßen, vielleicht läßt sich der Fehler so reproduzieren.

ruß - Toni
Mitglied: Tshunsh
Tshunsh 18.09.2006 um 13:39:39 Uhr
Goto Top
Danke Toni,

Festplatten defekte war mein erster Gedanke, daraufhin habe ich die Platten mit SCSI Controller eigenem Tool überprüft und Array an sich auch, laut Controller Aussagen ist es alles ok.
Ich habe auch unter Linux die Betreffende Partition ausgehängt und mit fsck.ext3 Tool überprüft.
Das Tool hat inkonsistente Blöke gefunden aber keine Medien defekte.

mfg Tshunsh
Mitglied: leknilk0815
leknilk0815 18.09.2006 um 13:57:39 Uhr
Goto Top
wie entsteht ein inkonsistenter Block?

- die Platte hat einen Defekt, die Plattenelektronik (SMART) bemerkt dies und markiert den Sektor als BAD, die Daten werden in die redirection Area kopiert (zumindest, was noch lesbar war).
Ein Scan- Tool prüft die Platte, findet aber nichts, da der BAD- Sektor bereits ausgelagert ist, daher OK
Leider sind die ausgelagerten Daten nicht vollständig, daher inkonsistent.

So in etwa könnte das Szenario aussehen....

Gruß - Toni
Mitglied: Tshunsh
Tshunsh 18.09.2006 um 14:20:04 Uhr
Goto Top
OK! Danke!

Ich würde die Platten erstmal ersetzen und mal schauen was dann passiert.
Das Ergebnis würde ich hier posten.

mfg Tshunsh
Mitglied: leknilk0815
leknilk0815 18.09.2006 um 14:39:11 Uhr
Goto Top
Thema Plattentest:
Eine vernünftige Überprüfung kann man nur mit speziellen Tools machen, die gibts normalerweise beim Hersteller (gratis), oder für alle bei Ontrack (kostenpflichtig).
Die Prüfung damit dauert mehrere Stunden (pro Disk), dafür aber zuverlässig.
Würde ich empfehlen..