SLES 9 Raid Array Problem
Hallo Leute,
ich habe ein seltsames Problem am Server und zwar:
Maxdata 19" Server mit SCSI Vortex Controller 4x SCA Platten
1 Platte ist mit Betriebsystem SLES 9 bespielt
3 Platten in ein Array raid 0 zusammen gefasst
nur zum Problem, in regelmäßigen Abständen (2 bis 3Wochen) wird Array nicht mehr vom
System erkannt, wenn ich das System neu hoch fahre, funktioniert alles wider wie gehabt.
Die Festplatten habe ich einzeln überprüft, alles in Ordnung.
Hat jemand ne Idee was das sein könnte?
Im Log steht folgendes:
Sep 18 09:50:26 fileserver kernel: Device sdb not ready.
Sep 18 09:50:26 fileserver kernel: end_request: I/O error, dev sdb, sector 86512295
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814029
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814030
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814031
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814032
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814033
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814034
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814035
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814036
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814037
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814038
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Device sdb not ready.
mfg Tshunsh
ich habe ein seltsames Problem am Server und zwar:
Maxdata 19" Server mit SCSI Vortex Controller 4x SCA Platten
1 Platte ist mit Betriebsystem SLES 9 bespielt
3 Platten in ein Array raid 0 zusammen gefasst
nur zum Problem, in regelmäßigen Abständen (2 bis 3Wochen) wird Array nicht mehr vom
System erkannt, wenn ich das System neu hoch fahre, funktioniert alles wider wie gehabt.
Die Festplatten habe ich einzeln überprüft, alles in Ordnung.
Hat jemand ne Idee was das sein könnte?
Im Log steht folgendes:
Sep 18 09:50:26 fileserver kernel: Device sdb not ready.
Sep 18 09:50:26 fileserver kernel: end_request: I/O error, dev sdb, sector 86512295
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814029
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814030
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814031
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814032
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814033
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814034
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814035
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814036
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814037
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Buffer I/O error on device sdb1, logical block 10814038
Sep 18 09:50:26 fileserver kernel: lost page write due to I/O error on sdb1
Sep 18 09:50:26 fileserver kernel: Device sdb not ready.
mfg Tshunsh
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 40336
Url: https://administrator.de/contentid/40336
Ausgedruckt am: 20.11.2024 um 16:11 Uhr
5 Kommentare
Neuester Kommentar
Hi,
ich weiß nicht, wie Du die Platten einzeln überprüft hast, aber die Fehlermeldung und die Symptome deuten schon recht eindeutig auf einen Disk- Error hin.
Regelmässigkeit:
evt. macht der Kontroller zu der Zeit einen Konsistenz- Check, bei dem der Fehler auftritt. Mal die Konfig darauf prüfen, bzw. manuell einen Check anstoßen, vielleicht läßt sich der Fehler so reproduzieren.
ruß - Toni
ich weiß nicht, wie Du die Platten einzeln überprüft hast, aber die Fehlermeldung und die Symptome deuten schon recht eindeutig auf einen Disk- Error hin.
Regelmässigkeit:
evt. macht der Kontroller zu der Zeit einen Konsistenz- Check, bei dem der Fehler auftritt. Mal die Konfig darauf prüfen, bzw. manuell einen Check anstoßen, vielleicht läßt sich der Fehler so reproduzieren.
ruß - Toni
wie entsteht ein inkonsistenter Block?
- die Platte hat einen Defekt, die Plattenelektronik (SMART) bemerkt dies und markiert den Sektor als BAD, die Daten werden in die redirection Area kopiert (zumindest, was noch lesbar war).
Ein Scan- Tool prüft die Platte, findet aber nichts, da der BAD- Sektor bereits ausgelagert ist, daher OK
Leider sind die ausgelagerten Daten nicht vollständig, daher inkonsistent.
So in etwa könnte das Szenario aussehen....
Gruß - Toni
- die Platte hat einen Defekt, die Plattenelektronik (SMART) bemerkt dies und markiert den Sektor als BAD, die Daten werden in die redirection Area kopiert (zumindest, was noch lesbar war).
Ein Scan- Tool prüft die Platte, findet aber nichts, da der BAD- Sektor bereits ausgelagert ist, daher OK
Leider sind die ausgelagerten Daten nicht vollständig, daher inkonsistent.
So in etwa könnte das Szenario aussehen....
Gruß - Toni