antenope
Goto Top

DELL PERC H710 mini - Meldung nicht zertifizierter Festplatten abschalten

Hallo zusammen,

ich habe hier einen Dell R720 der mir bei Ausfall von Festplatten dies nicht mitteilt (weder optisch am Server, noch auf eine andere Art und Weise). Im OpenManage steht das auch erst wenn die Platte faktisch Kernschrott ist.

img_3828

Soll heißen die ursprünglich verbauten SAS-Festplatten sterben immer mal wieder fröhlich vor sich hin ohne jegliche Vorwarnung und reißen meist sogar das ganze System mit in den Abgrund (wie auch immer das bei einem RAID (1 und 5) möglich ist) ...

Jedenfalls habe ich jetzt richtig den Papp mit den Sch%%%-Platten auf. Der Server braucht keine 15k Platten, also WD Gold rein. Damit habe bei einem Dell PowerEdge 2900 mit PERC 5i super Erfahrungen gemacht.

Der R720 meint nun aber, er müsse über die Festplatten meckern weil "nicht Dell zertifiziert" und gibt denen ein gelbes Ausrufezeichen (nicht kritisch) ...

clipboard02

Danke für die Erinnerung Dell, nur sterben mir eure Gammel-Platten zu spontan und zu häufig.

Nun meine Frage, kann man diese Meldung deaktivieren, so dass die als "grün" (wie beim PE2900) angezeigt werden? Also, quasi dass der ignoriert, dass die Festplatten nicht zertifiziert sind?

Content-ID: 368017

Url: https://administrator.de/contentid/368017

Ausgedruckt am: 25.11.2024 um 13:11 Uhr

Pjordorf
Pjordorf 14.03.2018 aktualisiert um 16:57:12 Uhr
Goto Top
Hallo,

Zitat von @anteNope:
img_3828
Ahja, Spanabhendende Datenverarbeitung face-smile

(wie auch immer das bei einem RAID (1 und 5) möglich ist) ...
Nun, wenn in deinen RAID Verbund aus 2 Platten (RAID 1) eine den geist aufgibt oder bei deinen RAID 5 (3 Platten) was soll dann dein RAID Verbund tun? Wenn die Platten in eine Spanabhebende DV Anlage übergehen machen die wenigstens Krach, sonst hörst du nichts. Wenn aber auch keine HotSpares vorhanden sind dann wirds meist nichts mit der Datenverarbeitung....

Nun meine Frage, kann man diese Meldung deaktivieren


so dass die als "grün" (wie beim PE2900) angezeigt werden? Also, quasi dass der ignoriert, dass die Festplatten nicht zertifiziert sind?
Baue dir einen PERC 5i ein anstelle deines PERC H710 Mini

Gruß,
Peter
anteNope
anteNope 14.03.2018 um 19:08:40 Uhr
Goto Top
Nun, wenn in deinen RAID Verbund aus 2 Platten (RAID 1) eine den geist aufgibt oder bei deinen RAID 5 (3 Platten) was soll dann dein RAID Verbund tun? Wenn die Platten in eine Spanabhebende DV Anlage übergehen machen die wenigstens Krach, sonst hörst du nichts. Wenn aber auch keine HotSpares vorhanden sind dann wirds meist nichts mit der Datenverarbeitung....

Der soll dann bitte auf "degraded" gehen (was er auch gemacht hat) das melden (was er nicht macht) und dann erstmal weiterlaufen. Gut hat er gemacht, nur war dann irgendwann das RAID nicht mehr ansprechbar was das System zum Absturz gebracht hat.

aue dir einen PERC 5i ein anstelle deines PERC H710 Mini
Ich glaube das passt bauartbedingt nicht ;)


Schade, hätte ja sein können, dass es da eine Einstellung gibt.

p.s. witzig, dass das Display anzeigt, wenn man Festplatten entfernt, aber es egal ist wenn die Platte schon Funken schlägt ...
Pjordorf
Pjordorf 14.03.2018 um 19:46:03 Uhr
Goto Top
Hallo,

Zitat von @anteNope:
Der soll dann bitte auf "degraded" gehen (was er auch gemacht hat)
OK

Gut hat er gemacht, nur war dann irgendwann das RAID nicht mehr ansprechbar was das System zum Absturz gebracht hat.
Dein Monitoring hat versagt, und sei es das es selbst bist (Physikalisch)face-smile

Ich glaube das passt bauartbedingt nicht ;)
War auch eher Svherzhaft gemeint. Weiss gar nichts über deine Steckplätze und dein Steckkarten.

Schade, hätte ja sein können, dass es da eine Einstellung gibt.
Das wäre ja schön. Es wird schon Gründe haben warum Hersteller ihr Zubehör so handhaben...

p.s. witzig, dass das Display anzeigt, wenn man Festplatten entfernt, aber es egal ist wenn die Platte schon Funken schlägt ...
Es wird dir schon sagen das der RAID Verbund nicht mehr kann, aber warum soll er dann die ausgebaute Platte noch anzeigen - auch wenn die im eingebauten zustand Funken schlägt. Wenn die Platte ihm nicht sagt "Hey, mir schlagen Funken ausm Blech" wird es der Kontroller auch nicht wissen. face-smile

https://www.dell.com/community/OOW-Forum/PowerEdge-R510-Festplattentausc ...
https://www.dell.com/community/OOW-Forum/PowerEdge-R720-Platte-Status-Fa ...
http://www.dell.com/support/article/de/de/debsdt1/sln129432/list-of-rai ...

Keine Ahnung wie dein PERC H710 Mini mit nicht Dell Zertifizierten Platten umgeht, wenn überhaupt.

Gruß,
Peter
anteNope
anteNope 14.03.2018 um 23:22:00 Uhr
Goto Top
Gut hat er gemacht, nur war dann irgendwann das RAID nicht mehr ansprechbar was das System zum Absturz gebracht hat.
Dein Monitoring hat versagt, und sei es das es selbst bist (Physikalisch)

Ich gucke 1x im Monat nach dem Patchday drauf. Letzten Monat alles i.O., dann zufällig die Tage ins OpenManage geschaut, Platte offline, Raid degraded. Also die möglichen Lösungen besprochen. Ein paar Stunden später reagiert dann die VD nicht mehr und aus die Maus; obwohl die anderen Festplatten kein Problem haben. Erst nachdem man die (bereits als offline gelistete )Festplatte zieht (DAS er dann auch im dann orangenen Display anmeckert!), kommt wieder etwas.

Der Bediener vom System schaut jeden Tag auf die Festplatten ob dort etwas rot leuchtet oder ob ein Fehler im Display steht. Der PE2900 signalisiert beides korrekt, den R720 interessiert das die Bohne! Display alles i.O. Platten alle grün. Ist ja nicht so als wäre das schon öfters passiert. Die Status-LED der Platten hat noch nie geleuchtet ...

Es wird dir schon sagen das der RAID Verbund nicht mehr kann, aber warum soll er dann die ausgebaute Platte noch anzeigen - auch wenn die im eingebauten zustand Funken schlägt. Wenn die Platte ihm nicht sagt "Hey, mir schlagen Funken ausm Blech" wird es der Kontroller auch nicht wissen.

Der Raid-Controller reitet die Festplatten bis zum maximalen Schrottzustand. Der Status "Fehler erwartet" steht IMMER auf "Nein" ... Also entweder ignoriert der Controller die gemeldeten SMART Werte gänzlich (man kann sie auch nicht einsehen ...) oder aber die Dell-Festplatten liefern keine ...?! Der Controller sollte doch merken, dass defekte Sektoren vorhanden sind und diese nicht so lange weiter in Betrieb lassen bis faktisch die Firmware von den Plattern gehobelt wurde?. Ein Ring auf der Platte beim Headcrash ist ja noch nachvollziehbar, aber das da?!

Keine Ahnung wie dein PERC H710 Mini mit nicht Dell Zertifizierten Platten umgeht, wenn überhaupt.
Erstellen eines neuen RAID5 funktionierte ohne Mecker und läuft bislang.Dazu gesellt sich jetzt noch eine Hotspare um das "Erkennen" von defekten Datenträgern etwas zu entspannen ... (wenn die Hotspare Aktivität aufweist, wird wohl eine andere Platte defekt sein :D)
Vision2015
Vision2015 15.03.2018 aktualisiert um 06:20:32 Uhr
Goto Top
Moin...
Zitat von @anteNope:

Hallo zusammen,

ich habe hier einen Dell R720 der mir bei Ausfall von Festplatten dies nicht mitteilt (weder optisch am Server, noch auf eine andere Art und Weise). Im OpenManage steht das auch erst wenn die Platte faktisch Kernschrott ist.
Richtig.... würdest du dich mal mit deiner Hardware auseinandersetzen, würdest du auch wissen, warum das so ist!


Soll heißen die ursprünglich verbauten SAS-Festplatten sterben immer mal wieder fröhlich vor sich hin ohne jegliche Vorwarnung und reißen meist sogar das ganze System mit in den Abgrund (wie auch immer das bei einem RAID (1 und 5) möglich ist) ...
das ist ein gimmick des Controllers... face-smile ist aber bekannt...


Jedenfalls habe ich jetzt richtig den Papp mit den Sch%%%-Platten auf. Der Server braucht keine 15k Platten, also WD Gold rein. Damit habe bei einem Dell PowerEdge 2900 mit PERC 5i super Erfahrungen gemacht.
ah... ja... also weil ein F90 Raptor Kerosin tankt, kann das dein Ford K auch face-smile
jetzt mal ernsthaft, eine WD Gold gehört nicht in einen Server, zumindest nicht in deinen Dell 720 mit PERC H710 Controller!
der kann mit deiner HD nix anfangen- OK, der H710 kann SATA... baut aber aus SAS auf! du hättest besser HGST SAS Platten gekauft... 7200er mit 2TB gibbet schon für 100 euro netto.... und das Meldewesen hätte ein ende... face-smile
da der Dell R720 einen recht stabilen unterbau hat, würde ich an deiner stelle das PercH710 geraffel rauswerfen, und einen
MegaRAID SAS 9271-8i oder 93XX einbauen... die laufen im Dell sehr zuverlässig & und das meldewesen incl. alarmierung klappt auch...
oder aber einen Neuen Server Kaufen!!!!!!
viele Administratoren vertreten ja die meinung, nur weil es physikalisch reinpasst, ist es auch richtig, und wenn es sich einschalten lässt, muss es auch klappen....


Der R720 meint nun aber, er müsse über die Festplatten meckern weil "nicht Dell zertifiziert" und gibt denen ein gelbes Ausrufezeichen (nicht kritisch) ...
jo.. ist so...

Danke für die Erinnerung Dell, nur sterben mir eure Gammel-Platten zu spontan und zu häufig.
wie alt sind den die Platten?


Nun meine Frage, kann man diese Meldung deaktivieren, so dass die als "grün" (wie beim PE2900) angezeigt werden? Also, quasi dass der ignoriert, dass die Festplatten nicht zertifiziert sind?
nee...soo nicht

Gruß Frank
anteNope
anteNope 15.03.2018 um 08:27:07 Uhr
Goto Top
würdest du dich mal mit deiner Hardware auseinandersetzen, würdest du auch wissen, warum das so ist!
Bis Ende letzten Jahres war das Teil im Wartungsvertrag bei Kodak, also selbst groß was machen war da nicht.

jetzt mal ernsthaft, eine WD Gold gehört nicht in einen Server ...
Okay, wie kommst du da drauf? Als Nachfolger der RE-Serie würde ich sagen, sind die eine gute Wahl.

da der Dell R720 einen recht stabilen unterbau hat, würde ich an deiner stelle das PercH710 geraffel rauswerfen, und einen
MegaRAID SAS 9271-8i oder 93XX einbauen... die laufen im Dell sehr zuverlässig & und das meldewesen incl. alarmierung klappt auch...
oder aber einen Neuen Server Kaufen!!!!!!
Danke für den Tipp, wäre eine Option. Neuer Server ist leider nicht möglich, da hier eine recht spezielle Software drauf läuft, welche vom Hersteller nicht mehr supportet wird. Sprich die Büchse der Pandora werde ich definitiv nicht öffnen.

wie alt sind den die Platten?
Och so im Schnitt leben die ihre 3-4 Jahre und haben leider auch die Angewohnheit gleichzeitig das zeitliche zu segnen. Darum die Gold, 5 Jahre Garantie 24/7 Support, heißt am nächsten Tag ist Ersatz da. Und wenn nun irgendetwas sein sollte, kann ich immerhin ohne großen Aufwand die SMART-Werte auslesen.
Dr.EVIL
Dr.EVIL 16.03.2018 um 10:31:24 Uhr
Goto Top
Hol Dir einen neuen Rechner!
Der R720 dürfte mitlerweile 5-6 Jahre Dauerbetrieb auf dem Buckel haben.
Das 15k Platten so lange durchgehalten haben ist kein "Kernschrott" sondern "Glück und göttliche Fügung" face-smile
Sei Dankbar! face-wink
Sie durch irgendwelche "Retail" Platten auszutauschen ist hier nur eine Übergangslösung.
Auch wenn diese weitere 5 Jahre aushalten: Der Server supportet keine aktuellen Betriebssysteme mehr und auch die anderen Komponenten sind gealtert und werden mit hoher Wahrscheinlichkeit vor dem vorraussichlichen Tod der Platten ausfallen.
Eine Investition in den alten, bereits abgeschriebenen Server ist daher unwirtschaftlich.

Entscheide Dich am Besten für ein Modell, welches per iDRAC (oder ähnlich) eine Status-Mail versendet, wenn eine Komponente auszufallen droht... (Sollte mitlerweile selbst bei Dell möglich sein...)
anteNope
anteNope 16.03.2018 um 11:02:06 Uhr
Goto Top
Sie durch irgendwelche "Retail" Platten auszutauschen ist hier nur eine Übergangslösung.
Naja, besser als weiter (nun gebrauchte) 15k Platten reinzustecken. Die Leistung braucht der nicht und den (unnötigen) Stress mache ich mir nicht mehr

Der Server supportet keine aktuellen Betriebssysteme mehr...
Das ist egal, der ist Teil einer Maschinenansteuerung und wird definitiv keine neue Version mehr sehen. Davon mal abgesehen, was soll den davon abhalten auch z.B. 2016 auszuführen? XenServer drauf und schon läuft so ziemlich jede Betriebssystemversion von Server 2000 bis 2016 ...

und auch die anderen Komponenten sind gealtert und werden mit hoher Wahrscheinlichkeit vor dem vorraussichlichen Tod der Platten ausfallen. Eine Investition in den alten, bereits abgeschriebenen Server ist daher unwirtschaftlich.
Nö das ist eigentlich sehr sinnvoll. So lange das läuft, druckt das Teil quasi Geld. Den Server auszutauschen bedeutet, nicht nur neuen Server, sondern auch neue Software und neue Anlage. Was habe ich dann außer große Kosten? Richtig nix.

Entscheide Dich am Besten für ein Modell, welches per iDRAC (oder ähnlich) eine Status-Mail versendet, wenn eine Komponente auszufallen droht... (Sollte mitlerweile selbst bei Dell möglich sein...)
Witziger Weise kann der das, tut es aber nicht ... Weil die Festplatten ja immer "ganz überraschend" von jetzt auf gleich defekt sind ;)
Dr.EVIL
Dr.EVIL 16.03.2018 aktualisiert um 14:30:03 Uhr
Goto Top
Zitat von @anteNope:


Nö das ist eigentlich sehr sinnvoll. So lange das läuft, druckt das Teil quasi Geld. Den Server auszutauschen bedeutet, nicht nur neuen Server, sondern auch neue Software und neue Anlage. Was habe ich dann außer große Kosten? Richtig nix.

Wenn die Maschine ebenfalls abgeschrieben und für den Produktionsablauf nicht relevant ist: Kein Problem! (Hätte ich auch gern in meiner Hobbywerkstatt...)
Die Maschienensteuerungen die "meine" Server kontrollieren setzen allerdings eine 99,9999% Verfügbarkeit voraus, denn für den Gegenwert jeder Minute Produktionsstillstand kann man sich einen neuen Server anschaffen...



Entscheide Dich am Besten für ein Modell, welches per iDRAC (oder ähnlich) eine Status-Mail versendet, wenn eine Komponente auszufallen droht... (Sollte mitlerweile selbst bei Dell möglich sein...)
Witziger Weise kann der das, tut es aber nicht ... Weil die Festplatten ja immer "ganz überraschend" von jetzt auf gleich defekt sind ;)

Auch dann sollte der PERC 710 Controller diesen Ausfall erkennen und an das iDARC weiter leiten!
Ich vermute, das hier eine nicht von Dell supportete Konfiguration (z.B. Falscher Controller, falsche Platten) im R720 arbeitet.