trapper-tom
Goto Top

RAID5 mit Promise S150 sx4-m nach reboot offline

RAID5 mit Promise S150 sx4-m nach reboot offline - nachdem Abziehen einer HDD bootet der Server wieder.

Hallo Supportgemeinde,

ich habe ein für mich nicht erklärbares und ärgerliches Problem:
Ich betreibe einen Win2k-Server mit enem 3x80GB SATA RAID5-System mit einem Promise S150 sx4-m Controller. Der PAM (Konfigurationsprogramm unter Win) zeigt an, dass das Array functional ist. Auch der Status jeder einzelnen HDD ist o.k. Muss nun der Server nach Software-Installation o. ä. neugestartet oder heruntergefahren werden, zeigt das Controller BIOS das Array mit dem Status offline an. Ein Boot ist dann nicht möglich. Im BIOS-Konfigurationsprogramm sind dann HDD2 und HDD3 als free gekennzeichnet. Nichts geändert, das Konfigtool verlassen, Server ausgeschaltet, HDD1 stromlos gemacht, Server eingeschaltet und Server bootet! Danach im laufenden Betrieb HDD1 wieder mit Strom versorgt und Arrya über PAM - Rebuild-Funktion wieder neu aufgebaut. Nach dem Sync ist das Array wieder functional. IRQ-Konflikte sehe ich nicht - aber es wird ein IRQ 18????? benutzt. Hat jemand eine Idee warum das Array beim normalen Systemstart offline geht? Und seit wann gibt es 18 Interrupts?

Es ist lästig, jedesmal das Array neu aufbauen zu lassen und was mache ich bei einem echten Plattencrash?

Auf Hinweise foffend und schon jetzt dankend - Trapper Tom

Content-ID: 22396

Url: https://administrator.de/contentid/22396

Ausgedruckt am: 22.11.2024 um 11:11 Uhr

leknilk0815
leknilk0815 28.12.2005 um 16:09:33 Uhr
Goto Top
Hi,
sieht nach einem Hardwareproblem aus, entweder mit HDD1 oder mit dem Kontroller. Wenn möglich, mal die Disk tauschen, Kabel penibel prüfen!
Möglicherweise kannst Du den Fehler im Betrieb provozieren, indem Du den Plattencash ausschaltest (den Schreibcash sollte man ohnehin aus Sicherheitsgründen deaktivieren)
Der IRQ braucht Dich nicht zu beunruhigen, es gibt nach wie vor nur 15.
IRQ 18 ist "vituell" und wird vom APIC- Controller auf einen der 15 Hardware- IRQ's gemapped. Es kann also durchaus auch mal ein IRQ 28 auftauchen.
Gruß - Toni
20638
20638 28.12.2005 um 16:51:04 Uhr
Goto Top
Wenn man mal Fragen darf von welchem Hersteller sind die HDD`S???
Wenn es Maxtor ist kann ich dir nur empfehlen neue zu holen, daher diese sich gerne abschalten.
Dies kann sich später dann auch übel auf den Laufendenbetrieb auswirken.


MfG
JT
trapper-tom
trapper-tom 28.12.2005 um 17:11:35 Uhr
Goto Top
Hallo Toni,

danke für die schnelle Antwort. Ich habe den Schreibcache deaktiviert. Im laufenden Betrieb keine Probleme. Beim Booten das gleiche (array ist offline). Ich habe mal die HDD1 vom Kanal1 auf Kanal4 gesteckt, ohne Änderung. ( Der Gedanke war, dass HDD1 den Kanal1 blockiert und somit das Auslesen von HDD2 und HDD3 nicht möglich ist.) Die Einstellung des Controller Caches steht auf write through. Bringt es evtl. etwas, diesen auf write back einzustellen? Als nächstes werde ich mal die Platte tauschen (muss mir nur noch eine besorgen), obwohl ich nicht glaube, dass es daran liegt (im laufenden Betrieb keine Fehler! Eventlog bringt auch keine Fhelermeldungen).

weitersuchend - Trapper Tom
trapper-tom
trapper-tom 28.12.2005 um 17:14:20 Uhr
Goto Top
Hallo JT,

das Maxtorplattenschrottproblem ist mir wohlbekannt. Habe deshalb Seagate ST380013AS eingesetzt.

Bin für weitere Tipps dankbar - Traper Tom
leknilk0815
leknilk0815 28.12.2005 um 18:27:03 Uhr
Goto Top
Hi Tom,

write throu ist, soweit ich mich erinnere, die korrekte Einstellung (Cache off), ich meinte aber den Plattencache (ich denke, 8MB), den sollte man mittels Jumper auf der Platte deaktivieren können. Eventuelle Schreibfehler würden so sofort auftreten, da die Disk erst Vollzug melden kann, wenn der Schreibvorgang erfolgreich abgeschlossen wurde. Einträge im Eventlog vom Betriebssystem tauchen erst auf, wenn der Kontroller schon "auf dem letzten Loch pfeift", da das OS nichts von dem mitbekommt, was auf Raid- Ebene abläuft. Du könntest natürlich auch noch die Platten tauschen (HDD1 - HDD2) und dann noch mal testen, dann müsste der Fehler ja an anderer Stelle auftreten. Allerdings würde dies eine Neuinstallation oder Image zurückspielen nötig machen.
20638
20638 28.12.2005 um 20:12:10 Uhr
Goto Top
Gut.

Nur als Info es gibt auch bei Seagate HDD`s ein Problem.
Haben die selben Probleme wie die Maxtor und zwar ist das die ST30817AS welcher der Nachfolger seiner Platten sein kann.
Einfach nur mal um mein Gewissen zu beruhigen starten den Rechner einmal ohne Platten und dann hägst du alle wieder ran. Wenn sie dann mit anlaufen kann ich euch allen Rechtgeben.

MfG
JT
P.S.: Fehler sind nicht gefundene Lösungen
trapper-tom
trapper-tom 28.12.2005 um 22:40:59 Uhr
Goto Top
Hi JT,

mit dem Hotswap der Platten gibt es keine Probleme. Das ist ja immer meine Übung nach einem Reboot des Rechners. Ich mache dann immer folgendes:
Im ausgeschalteten Zustand des Rechners die Stromversorgung einer Platte abziehen (in diesem Fall die Platte am Kanal1), Rechner einschalten, warten bis M$ Windowss Server gestartet ist, Stromversorgung an die Platte ran und mittels PAM rebuild und Sync des RAID-Arrays. geht immer, auch wenn ich die Platte auf Kanal4 des Controllers stecke.

Gruß Tom
trapper-tom
trapper-tom 28.12.2005 um 22:49:17 Uhr
Goto Top
Hi Toni,

ich werde morgen im Büro mal probieren, ob ich den Plattencache auf der Platte selbst deaktivieren kann. Ich werde das erst einmal nur mit der HDD1 machen. Mal sehen, wie sich das Array nach dem Rebuild dann verhält. Der Write Cache des Controllers ist jedenfalls aus. Ich glaube aus Kostengründen ist der Tausch der Platte sinnvoller. Selbst wenn das Problem so nicht gelöst werden kann. Die Platte kann ich ja in einem anderen System immer noch einsetzen oder sie zur Erweiterung des Arrays oder als hotspare-platte benutzen...

Bis hierhin erstmal danke und Gut's Nächtle.

Ich halte Euch auf jeden Fall auf dem Laufenden, wenn ich das Prob geknackt habe.

Grüße Trapper Tom
trapper-tom
trapper-tom 06.07.2006 um 09:05:13 Uhr
Goto Top
Hi @all,

ich habe folgendes probiert, um das Problem zu umgehen - leider ohne Erfollg face-sad

1. mit dem config-utility geschaut, welche Platte als "FREE" gemeldet wird und die Platte ausgetauscht.
2. den Kanal am Controller gewechselt
3. einen anderen PCI-Slot benutzt

Heute Nacht ist der Server abgestürzt und ich bekomme dieses verdammte Array nicht wieder online.

Letzter Versuch, danach schmeiß ich den Controller raus:

Ich werde den Kontroller an einem anderen Mainboard (zur Zeit AMD geplant Intel) betreiben. Vielleicht geht es ja.

Der Promise - Support ist auch alles andere als hilfreich...

Glücklicherweise gibt's ne Datensicherung auf Band.

Wenn Euch noch irgendetwas einfällt, dann bitte posten.

Danke.

Gruß Trapper Tom


EDIT:
Es geht auch nicht mit einem anderen Board

Ich muss mir was anderes einfallen lassen, denn wer lesen kann , ist klar im Vorteil:
- weder mein(e) Boards, noch meine Festplatten tauchen in der Kompaliste auf, wobei, wenn die so alt ist, wie die im Internetangebotenen BIOS-updates, bin ich schon wieder am Zweifeln.

weiter bastel ...

Trapper Tom