cardisch
Goto Top

Herausfinden, welche Platte defekt ist (HP ML380G8 mit RAID1+Spare, W2K8 auf ESXi)

Hi @ all,

habe hier obigen Server, auf dem auf der HDD ein ESXi installiert und darauf aufbauend ein W2K8-Server (DC, alleiniger Server) installiert ist.
Auf dem RAID1+Spare schaltet sich immer wieder eine Platte wegen Zeitüberschreitung (bis zu 8 Sekunden)ab, man hört es kurz klacken, die Spare springt an, läuft ein wenig mit, dann hat sich das defekte wieder beruhigt, arbeitet weiter und die Spare sich ab.
Auch in den Logs des ESXi sind entsprechende Meldungen.
Wie bekomme ich jetzt aber WIRKLICH heraus, welche Platte betroffen ist, möglichst ohne den Server herunterzufahren ?!

Danke und Gruß

Carsten

Content-Key: 305196

Url: https://administrator.de/contentid/305196

Printed on: June 23, 2024 at 22:06 o'clock

Member: Th0mKa
Th0mKa May 23, 2016 at 11:56:51 (UTC)
Goto Top
Moin,

im iLO kannst du die Festplattenparamter auslesen, ganz ohne runterfahren. Ansonnsten sollte die defekte Platte lange vor diesen Ausfallerscheinungen orange leuchten, ist die denn original?

VG,

Thomas
Member: emeriks
emeriks May 23, 2016 updated at 11:58:38 (UTC)
Goto Top
Hi,
eine Spare-Platte entfernt sich nicht wieder selbst oder wird nicht entfernt, wenn sie einmal eingesprungen ist bzw. wurde, weil eine Platte des RAID ausgestiegen ist und diese dann "wieder da ist". Sowas habe ich noch nie gehört.

E.
Member: Lochkartenstanzer
Lochkartenstanzer May 23, 2016 at 12:11:10 (UTC)
Goto Top
Moin,

einfach iLO benühen oder die Smart-Werte der Plattenauslesen. Wenn die bis zu 8 Sekunden in timeouts rennt, hat die betroffene vermutlich erhöhte Lesefehlerraten.

lks
Member: keine-ahnung
keine-ahnung May 23, 2016 at 12:51:30 (UTC)
Goto Top
Moin,
mal abgesehen vom schnellen Griff zu ILO ... haben die HDD-Rahmen ab Gen8 nicht dieses wunderbunte Mäusekino an Bord face-smile?
Member: cardisch
cardisch May 23, 2016 at 12:54:04 (UTC)
Goto Top
Leider doch.....
ich könnte dir ein Video davon drehen, leider ist das wirklich so.
@tkr104

Muss noch "eben" ILO konfigurieren, habe für den Server nur eine Netzwerkleitung ;-(
Member: cardisch
cardisch May 23, 2016 at 12:56:26 (UTC)
Goto Top
@lks
dafür müsste ich den Server neu starten, ist aber ne Arztpraxis, da komme ich erst heute Abend ran
@keine-ahnung
Ja, Mäusekino vorhanden. Es dreht sich immer alles (an dem RAID1), dann schaltet sich die Spare dazu, aber leide leuchten die RAID1-Platten (also wirklich beide) einfach weiter...
Member: keine-ahnung
keine-ahnung May 23, 2016 at 17:01:43 (UTC)
Goto Top
Moin nochmal,
Muss noch "eben" ILO konfigurieren, habe für den Server nur eine Netzwerkleitung
warum stellt man sich solche Kisten auf, wenn man den wichtigsten Grund dafür dann nicht nutzt face-smile?
dafür müsste ich den Server neu starten, ist aber ne Arztpraxis, da komme ich erst heute Abend ran
ILO kannst Du auch online aus dem Windows heraus konfigurieren ... weiss allerdings nicht, ob das funktioniert, wenn das Teil auf einem ESXi rödelt.

LG, Thomas
Member: Th0mKa
Th0mKa May 23, 2016 at 18:05:08 (UTC)
Goto Top
Zitat von @keine-ahnung:

ILO kannst Du auch online aus dem Windows heraus konfigurieren ... weiss allerdings nicht, ob das funktioniert, wenn das Teil auf einem ESXi rödelt.

Wenn man ein HP Image bei der Installation genommen hat geht das schon.

VG,

Thomas
Member: cardisch
cardisch May 23, 2016 updated at 19:15:10 (UTC)
Goto Top
Hi,

ILO bekommt keine IP, da kann ich also schon einmal nix machen.
Nur eine Netzwerkleitung liegt daran, dass das ne alte und gewachsene Struktur ist..
(Image ist übrigens nicht von HP, alles händisch aufgesetzt)-
Hatte testweise eine (die vermeintlich defekte) gezupft, im Array Monitor wird die mit nem Ausrufezeichen versehen, Hinweis: Wird rebuilded, obwohl die schon seit gut 15 Minuten damit fertig ist.
Hab zwar jetzt ein brandfrisches Image, möchte aber ungern die vermeintlich heile HDD ziehen.
logs habe ich, daraus werde ich aber leider nicht schlauer..

Habt ihr noch nen Tipp?!

Danke und Gruß

Carsten

Toll.. Jetzt ist laut Smart ARray doch noch alles gut ;-( Trotzdem schaltet sich die Spare immerzu ein)..
Ich habe die im Bay 2, die, die ich für defekt halte, gezupft, morgen kontrolliere ich das Ganze, speziell im ESXi.
Member: keine-ahnung
keine-ahnung May 23, 2016 updated at 20:26:52 (UTC)
Goto Top
Moin nochmal,
ILO bekommt keine IP, da kann ich also schon einmal nix machen
ILO bekommt IMMER eine IP, auch wenn sie geshared ist.
(Image ist übrigens nicht von HP, alles händisch aufgesetzt)
Deswegen halte ich mir "Fachleute" aus der Praxis fern ...
Hab zwar jetzt ein brandfrisches Image, möchte aber ungern die vermeintlich heile HDD ziehen.
Würde ich ohne ILO-Zugriff eher auch nicht machen!

LG, Thomas

p.s.:
Habt ihr noch nen Tipp?!
IMHO gibt es bei ILO einen "shared-IP-modus"
Member: cardisch
cardisch May 25, 2016 updated at 20:47:10 (UTC)
Goto Top
Ilo muss ich mir mal separat zu Gemüte führen, allerdings habe ich jetzt ein,für mich, blödes update.
Ich hatte gestern nur Eine Platte des RAID und die spare laufen lassen, kein latzenzerhöhung (dachte ich zumindest, bis ich heute im vsphere Client nachgeguckt habe),aber alles ruhig und leise.
Heute kam eine ersatzplatte von hp, also die fehlende aufgefüllt, selber Terror.
Habe dann die Spiegelung abgewartet, zweite Platte des RAID getauscht, leider ohne Besserung.
Also noch die spare platte gewechselt auch nicht wirklich gut.
Die letzten hohen Latenzen waren gestern abend, als nur die spare und eine der RAID platten liefen, heute in keiner Konstellation, wobei immer die neue verbaut War, und das auch nur während des vollbackups, aber dann bis zu 26000! !! ms.
Heute überhaupt nichts, weder beim esxi, noch bei der virtuellen Maschine.
Aber immer noch schaltet sich die spare etwa ein bis zwei mal die Stunde für ca 10 Sekunden dazu, es gibt ein knacken,das sich nicht normal anhört, dazu, dann ist wieder Ruhe. ..
Da dies der einzige mir bekannte ml350p ist muss ich allmählich fragen, ob das Verhalten vielleicht normal ist..

Danke und Gruß

Carsten
Member: keine-ahnung
keine-ahnung May 26, 2016 at 07:41:35 (UTC)
Goto Top
Moin,
ich frage mich eigentlich immer noch, warum auf der Kiste ein ESXi läuft, wenn da nur ein W2008 drauf virtualisiert ist ... ? Eine Fehlerquelle mehr ... Der ESXi ist dann zur Fehlerdiagnose eher nicht so schick, gelle? IMHO kommst Du ohne ILO nicht wirklich weiter.

Was ist das eigentlich für ein ESXi? Die HP-Version?

LG, Thomas
Member: cardisch
cardisch May 26, 2016 at 09:46:54 (UTC)
Goto Top
Der ESXi wurde aufgesetzt, um im Fehlerfall die VM zügig auf einen passenden Client zu übertragen (der ist hardwareseitig entsprechend aufgerüstet), damit hier schnell weitergearbeitet werden kann.
Klar ist der ESX eine Fehlerquelle mehr, ist mir auch schon passiert, dass das Bootmedium/der Kartenleser zerschossen waren.
WIe kann ich denn ILO eine IP geben?!
Im Menü gibt es nur DHCP-Optionen und von ner Fritte nimmt sie keine IP... ;-0
Gruß

Carsten
Member: keine-ahnung
keine-ahnung May 26, 2016 at 10:00:56 (UTC)
Goto Top
Moin,
Der ESXi wurde aufgesetzt, um im Fehlerfall die VM zügig auf einen passenden Client zu übertragen
hmmmh face-smile.
im Menü gibt es nur DHCP-Optionen und von ner Fritte nimmt sie keine IP

ilo

LG, Thomas
Member: cardisch
cardisch May 26, 2016 at 15:08:33 (UTC)
Goto Top
Es ist heute Feiertag und Thomas macht mir Arbeit face-wink)
ILO mag keine IPs von einer Fritte, habe aber zufällig meinen alten Linksys beigehabt. Jetzt hatte sie eine IP bekommen, die durfte ich dann gnädigerweise auf statisch ändern.
Komme jetzt per Console dran, bekomme aber nur die Meldung, dass das nach dem POST für mich nicht statthaft sei.
Also muss ich erst lizensieren ;-(
Leider habe ich GAR keine Erfahrung mit ILO, weder was man damit alles anstellen kann, noch welche Lizenz ich benötige, noch ob es mir bei
(m)einer VM überhaupt etwas bringt.
Was sagt ihr dazu?!

Danke,

Carsten
Member: keine-ahnung
Solution keine-ahnung May 26, 2016 at 16:23:57 (UTC)
Goto Top
Es ist heute Feiertag und Thomas macht mir Arbeit
Nicht jammern - tun! Und ich hatte ja auch keinen Feiertag ... face-sad
Komme jetzt per Console dran, bekomme aber nur die Meldung, dass das nach dem POST für mich nicht statthaft sei.
Ich kann mich jetzt an den unlizensierten Zustand nicht mehr erinnern, aber zumindest den health state müsste man doch einsehen können? Aber Wurst ... dafür gibt es trial-Lizenzen face-smile.
Leider habe ich GAR keine Erfahrung mit ILO, weder was man damit alles anstellen kann
Lass mich nachdenken:
- voll funktionale KVM-over-LAN-Lösung
- remote-Konsole bis auf BIOS-Ebene
- ziemlich gute hardware-Überwachung mit alert-mails
- und weiss der Geier, was nicht noch alles

Das Ganze sollte es für einen Hunderter Brutto geben, ich habe damals essential-Lizenzen mit nur einem Jahr maintenance per ILO gekauft, IMHO bekommst Du den Gen8 aber sogar noch mit einer ILO2-Lizenz freigeschalten.

Und da ich fast vermute, dass die proliant-Systemprogramme aus einer VM heraus nicht wirklich gut funktionieren dürften ... face-wink.

So, Schluss, sonst denke ich noch Du bist der Laie und nicht ich ...

LG, Thomas
Member: cardisch
cardisch Jun 02, 2016 at 07:38:06 (UTC)
Goto Top
Hi,

ich setze diesen Thread mal auf gelöst (den Ursprünglichen).
Weder VSphere, noch Windows, noch der Controller haben irgendwelche Meldungen gemacht, welche Platte WIRKLICH defekt ist.
Habe mit der neuen Platte alle drei Bays durchlaufen lassen, der Fehler blieb, wenn auch nicht ganz so krass (je nachdem in welchem Bay die neue Platte steckte).
Aber zumindest scheint nach einem Firmwarupdate der "Fehler" weg sein oder zumindest deutlich seltener auftreten.
Ich war Montag zur Kontrolle dort, der Server hat locker 45 Minuten keinen Piep von sich gegeben, die Logs des ESXi waren ALLE sauber...
Dank an alle,
Gruß

Carsten