e2mario
Goto Top

Bei Serverneustart fällt immer eine HDD im Raid Verbund aus

Hallo zusammen,

folgende Ausgangslage:

HP ProLiant ML350 G5 Server
4x HP SAS Festplatten davon 1 Hotspare im RAID5 Verbund.
Smart Array P400 Controller

Aufgrund einer elektrotechnischen Überprüfung im Haus ist es so, dass der Server Freitags heruntergefahren werden muss.
Beim Neustart des Servers jeweils am nächsten Tag war es jetzt 5x schon so, dass eine Platte aus dem Raidverbund nicht synchron ist (leuchtet rot) und daher neu synchronisiert werden muss.
Die Synchronisation läuft dann problemlos.
Es ist nicht immer die gleiche Platte sondern immer eine andere. Festplatten habe ich schon getauscht - auch eine neue war nach dem Neustart wieder asynchron - brachte also nichts. Das System läuft dann wieder einwandfrei ich habe nur "Angst" dass bei einem
neuerlichen Serverneustart mal 2 Platten asynchron sind...

Habt Ihr eine Idee oder Erfahrungen woran das liegen könnte? (Array Batterie tauschen?, Controller sagt leise und langsam adios?...)

Schöne Grüße und schon mal DANKE für Eure Hilfe
Mario

Content-ID: 245193

Url: https://administrator.de/contentid/245193

Ausgedruckt am: 13.11.2024 um 09:11 Uhr

keine-ahnung
keine-ahnung 31.07.2014 um 12:25:17 Uhr
Goto Top
Moin,

mal in's ILO schauen?

LG, Thomas
An-dir
An-dir 31.07.2014 aktualisiert um 13:11:56 Uhr
Goto Top
Hallo Mario,

eventuell auch gleich die Firmware des Controllers aktualisieren wenn du im Ilo, wie von Thomas vorgeschlagen, keine Fehler findest. Ansonsten mal kurz beim Hersteller anklingeln, und nachfragen, selbst wenn kein Support beim Hersteller mehr besteht würde ich das immer mindestens einmal versuchen.

Gruß
Andi
e2Mario
e2Mario 31.07.2014 um 13:47:51 Uhr
Goto Top
Danke für Eure Antworten.
Naja im Ilo lese ich 1789 - Drive not Responding - Pysical Drive - Error89


1789 - Drive not Responding, Physical Drive Check cables or replace physical drive X. Select "F1" to continue - drive array will remain disabled. Select "F2" to fail drive(s) that are not responding - Interim Recovery Mode will be enabled if configured for fault tolerance.

Cable or hard drive failure.

1.Check the cable connections.
2.If cables are connected, replace the drive.
3.If you do not want to replace the drives now, press F2 .


Nur das hilft mir nicht gerade, die Ursache zu finden....
Der Hersteller verweist nur auf, Platte ersetzten.
An-dir
An-dir 31.07.2014 um 14:16:52 Uhr
Goto Top
Und die Firmware des Controllers?
e2Mario
e2Mario 31.07.2014 um 14:23:00 Uhr
Goto Top
Ist aktuell...
AndiEoh
AndiEoh 31.07.2014 um 14:28:46 Uhr
Goto Top
Hallo,

eventuell ist das Netzteil zu schwach/instabil. Hatte wir auch schon das ein Array welches jahrelang lief beim Austausch einer Platte munter immer wieder einzelne Platten rausgeschmissen hat. Das Netzteil neu und eine Nummer größer (12V Schiene!) und das Problem war weg alle Platten waren i.O und das Ding läuft heute noch face-smile

Gruß

Andi
An-dir
Lösung An-dir 31.07.2014, aktualisiert am 11.08.2014 um 08:53:00 Uhr
Goto Top
Falls die Controller Batterie leer sein sollte, dann müsste dir dies ja auch angezeigt werden.
Ansonsten nochmal Hersteller anrufen, und hoffen dass du einen Spezialisten für den Controller bekommst, denn "Es ist nicht immer die gleiche Platte" und du kannst ja nicht alle Platten tauschen, nur weil der Controller nicht will wie er soll.

Hier ist noch ein wahrscheinlich wenig hilfreicher Artikel zu der Fehlernummer "1789":
"Drives that were working when the system was last used are now missing or are not starting up. A possible drive problem or loose SCSI cable exists."
http://h20566.www2.hp.com/portal/site/hpsc/template.PAGE/public/kb/docD ...

Alle Kabel die irgendwie an einer HDD / Controller Karte Stecken nochmal prüfen.

Dann fällt mir auf die schnelle auch nichts mehr ein.

Gruß
Andi
keine-ahnung
keine-ahnung 31.07.2014 um 14:47:35 Uhr
Goto Top
Moin nochmal,

die ersten vier Links sollten zielführend sein face-wink

LG, Thomas
e2Mario
e2Mario 31.07.2014 aktualisiert um 15:04:31 Uhr
Goto Top
Hallo Thomas,

du bist ja ein ganz schlauer face-big-smile.

Sei doch noch so nett und lies du das nochmal alles für mich durch. Möglicherweise habe ich
ja das zielführende überlesen - herzlichsten Dank!!
An-dir
An-dir 31.07.2014 um 15:06:34 Uhr
Goto Top
Wenn es dich beruhigt, ich war bei meinen Recherchen auch schon auf den von ihm vorgeschlagenen Seiten, und konnte nichts wirklich hilfreiches finden face-smile
e2Mario
e2Mario 31.07.2014 um 15:16:26 Uhr
Goto Top
Da geht's uns beiden gleich - hatte mich ja bevor ich hier fragte schon im Netz informiert.
keine-ahnung
keine-ahnung 31.07.2014 um 16:33:10 Uhr
Goto Top
Sei doch noch so nett und lies du das nochmal alles für mich durch.
Nein. Mein P400 und mein P420 funktionieren incl. backplane, cage, Kabel und Platten ... warum sollte ich mir die Mühe machen face-wink?

An Deiner Stelle würde ich mich da aber durchackern ... ist ja Deine Büchse!

LG, Thomas
e2Mario
e2Mario 31.07.2014 um 16:40:55 Uhr
Goto Top
Das war ja auch "ironisch" gemeint.
Hatte das alles schon im Vorfeld durchgelesen, aber kam nicht weiter - daher die Frage hier ob das "Phänomen" jemand kennt.

Trotzdem danke für den Link und nichts für ungut! face-smile
keine-ahnung
keine-ahnung 31.07.2014 um 17:15:13 Uhr
Goto Top
Das war ja auch "ironisch" gemeint.
von mir auch face-wink!

Es scheint sich auf einen Defekt der Verkabelung (dies schliesst auch die controller- und hdd-seitigen SAS-Ports ein) und/oder der HDD zu fokussieren. In der maintenance würde jetzt der HP-Onkel kommen und das Stück für Stück wechseln ...

LG, Thomas
An-dir
An-dir 31.07.2014 um 17:28:23 Uhr
Goto Top
Wie wäre es mit Ersatzteilen... Vielleicht findest du zufällig hier sogar was passendes:
Hardware von privat abzugeben
Lochkartenstanzer
Lochkartenstanzer 31.07.2014 um 19:14:59 Uhr
Goto Top
Zitat von @An-dir:

Wenn es dich beruhigt, ich war bei meinen Recherchen auch schon auf den von ihm vorgeschlagenen Seiten, und konnte nichts wirklich
hilfreiches finden face-smile

Aber das HP-Support-Dokument habt Ihr euch schon durchgelesen, das unter den ersten 4 treffern ist?

lks
An-dir
An-dir 31.07.2014 aktualisiert um 19:30:19 Uhr
Goto Top
Ja, Danke. Das "Document ID: c01232270" (Falls du dies meinst) bezieht sich auf ein Firmware Update.
Firmware ist angeblich aktuell, was ja auch die Empfehlung vom Hersteller ist. "HP recommends upgrading to the latest available versions of software and firmware."
e2Mario
e2Mario 11.08.2014 um 08:52:07 Uhr
Goto Top
So ich denke der "Fehler" ist gefunden - es war die Array Controller Batterie.
Server geöffnet, Batteriepack angesehen und diese hatte eine Wölbung als würde sie bald platzen... :o
Batterie gewechselt - Server 3x neu gestartet und alle Platten waren auf Anhieb immer synchron.