peak
Goto Top

RAID 1 beide Platten gleichzeitig tot

Servercrash weil beide RAID Platten gleichzeitig abgeschwirrt sind.

Hallo zusammen

Hatte gestern einen Servercrash. Dank Sicherung mit Images des Servers war das ganze in annehmbarer Zeit wieder im Betrieb.

Folgende Situation

Server mit Supermicro X7SBL Mainboard.

SATA Port 0 - WD RE3 750GB (Prod: 22 Feb 2009)
SATA Port 1 - WD RE3 1TB (Prod: 22 May 2009)
SATA Port 2 - Leer
SATA Port 3 - Leer
SATA Port 4 - DVD LW
SATA Port 5 - eSATA Adapter (für ext HD Datensicherung)

SATA Port 0 und SATA Port 1 sind zu einem 750 GB Grossen RAID 1 zusammen geschlossen.

Datensicherung wird mittels Acronis Backup & Recovery 10 auf die externe Festplatte an SATA Port 5 gemacht. Die platten werden Täglich gewechselt und sind in einem ähnlichen Gehäuse wie das IcyBox IB-366StUS2-B.
Zum wechsel der Platte wird die IcyBox ausgeschaltet, die Platte gewechselt und dann die IcyBox wieder eingeschaltet.

Das ganze funktionierte bis anhin problemlos.

Nun gestern wurden die Platten ganz normal gewechselt. Danach habe der Server neu gestartet und ist dann nach dem Bootversuch von allen möglichen Geräten stehen geblieben, und meldete, dass kein Betriebssystem gefunden werden konnte.

Ich habe mir die RAID Platten angeschaut. Mir ist aufgefallen, dass diese nach dem Start nicht mehr richtig hoch fahren. Ich habe die dann an einen anderen Rechner angeschlossen um sicher zu stellen, dass es nicht am Netzteil liegt. Die Platten fangen an hoch zu drehen, brechen dann aber ab und fangen wieder von vorne an.

Nachdem ich die Platten ersetzt und ein neues RAID 1 gemacht habe, konnte das Backup problemlos zurück gespielt werden.

Wie kann das passieren, dass zwei Platten, unterschiedlicher Grösse und Charge, genau gleichzeitig aussteigen? Hat jemand schon mal einen solchen Fall gehabt? Kann das mit dem Wechsel der Backup platte im externen Gehäuse zusammen hängen?

Ich kann mir einfach nicht vorstellen, dass zwei Platten, gleichzeitig mit den gleichen Symptomen kaputt gehen.

Gruss,
Steff

Content-ID: 182831

Url: https://administrator.de/contentid/182831

Ausgedruckt am: 05.11.2024 um 12:11 Uhr

Chonta
Chonta 30.03.2012 um 08:45:37 Uhr
Goto Top
Hallo,

was sagt denn das Log vom RAID-Controler? Was für ein RAID-Controler wird verwendet?

Wenn die RAID-HDDs in ein USB-Gehäuse gepackt werden, kannst Du dann etwas darauf erkennen, oder geht das auch nicht?
Warum wurde der Server neu gestartet?
Hast Du den Server auch komplett ausgeschaltet gehabt und neu eingeschaltet? Bei uns hat der Controler mal keine Neustarts machen wollen, vor allem nach einem Windowsupdate, hat sogar Bluescreens angezeigt. Nachdem der Server ganz ausgeschaltet wurde und wieder eingeschaltet wurde war wieder alles in Butter.

Gruß

Chonta
lbtobi
lbtobi 30.03.2012 um 08:48:51 Uhr
Goto Top
Servus Steff,

das Problem kenn ich nur zu gut - ebenfalls WD Platten. Waren zwar bisher nur einzelne Platten aber das passiert. Mir sind auch schon zwei Platten "abgedampft", zwar andere Symptome aber es passiert, dass zwei Platten gleichzeitig ausfallen. Wenn du kein RAID 6 oder ähnliches hast, ists mega kacke.
Sofern noch Garantie besteht (Server HDDs haben oft 3-5 Jahre) würde ich die Platten auf jeden Fall einschicken.

Wieso schaltest du den Server aus wenn du SATA Platten wechselst? SATA ist HotPlug fähig oder hab ich da was falsch verstanden?!

Gruß
Tobi
Peak
Peak 30.03.2012 um 08:54:18 Uhr
Goto Top
Hallo Tobi

1. Habe nicht ich die Platte gewechselt. ( Ich bin 'nur' der IT Mensch der rennt wenn was nicht mehr geht )
2. Wurde nicht der Server ausgeschaltet sondern das eSATA Gehäuse.
3. Startet der Server danach selbständig neu. Wobei ich eher das Gefühl habe, dass der Server nicht neu startete, sondern durch einen Bluescreen zum Neustart gezwungen wurde, weil beide Platten den Geist aufgaben.

Ich werde sicher mal prüfen, ob die Platten noch Garantie haben. Zum Glück hat ja die Datensicherung funktioniert.

Ich finds aber schön, dass ich nicht der Einzige bin, der das Problem mit zwei gleichzeitig sterbenden Platten hat.

Gruss,
Steff
Peak
Peak 30.03.2012 um 08:54:42 Uhr
Goto Top
Hallo Chonta

Da, gegen meine entscheidung, der Onboard RAID Controlller verwendet wurde, kann ich dir zum Log des Controllers leider nichts sagen. Ist dann halt ein Intel Matrix Storage... (ein LSI wäre ja nicht wirklich teuer gewesen)

Der Server wurde komplett vom Netz getrennt. Spätestens dann, als ich den Server von der USV abgehängt habe.

Ich habe die Platten an einem anderen Rechner direkt am SATA und auch über ein Gehäuse per USB angehängt. Leider nichts.

Gruss,
Steff
Chonta
Chonta 30.03.2012 um 09:09:54 Uhr
Goto Top
Hallo,

wenn der Server beim ausschalten der USB-Platte nen Bluescreen hat, dann hat der Server noch ein ganz anderes Problem.
Schon getestet ob der beim jetzt auch abschmiert, wenn das USB-Gehäuse abgeschaltet wird?

Gruß

Chonta
Peak
Peak 30.03.2012 um 09:21:12 Uhr
Goto Top
Hi,

Da hast du wohl was falsch verstanden. Ich gehe davon aus, dass die beiden Platten im laufenden Betrieb des Servers abgeschwirrt sind. Dies hat zu einem Bluescreen geführt, was wiederum dazu geführt hat, dass der Server neu startete. Dann natürlich nicht mehr hoch kam, weil die Platten dann ja tot waren.

So rum war das gemeint.

Gruss,
Steff
85807
85807 30.03.2012 um 09:51:23 Uhr
Goto Top
Hallo,

Ich hatte das auch mal bei einem HP Server mit RAID 1. Dort sind ja die Seagate Festplatten mit einer Firmware von HP bespielt. Diese Firmware hatte einen von HP bekannten Fehler, welcher nach einer bestimmten Zeit die Festplatte in einen Bad Block Modus stellte und keinen Zugriff auf die Festplatte zuließ.
HP drückte sich von der verantwortung und meinte es sei ausserhalb der Garantie aber sie würden die Festplatten mit einer neuen Firmware bespielen. (Manuel ging das nicht mehr, weil die Festplatten komplett gesperrt waren. Das konnte nurmehr HP.)
Die Daten wären aber danach futsch. Seagate wiederrum schob die Schuld auf HP und meinte dass es nicht ihre Firmware wäre. usw.
Naja neue Festplatten , nicht von HP, rein. Backup drüber gespielt und fertig.


lg
Chris
60730
60730 30.03.2012 um 09:53:59 Uhr
Goto Top
Moon,

Ganz einfach...

Die verbauten komponenten sind am unteren ende der specs.
Eine externe sicherung mit ausschalten, umbauen, anschalten ist immer suspekt.

Nehmen wir mal an, denn man kann ja nix mehr auslesen, diese "sieht so aus, wie die icybox"
Hat beim ausschalten (weil der schalter billig ist) eine spannungsspitze durch den kabelsalat gejagt, was passiert dann mit allen anderen angeschlossenen platten, egal wie alt oder gross die sind?

Ergo...

Wenn das 3 jahre gut lief, dann hattet ihr 3 jahre erfahrung damit, das es manchmal auch mit den saxhen vom obi geht.

Ein software raid 1 mit verschiedenen platten macht man nicht, weisst du ja.
Das mit dem platte aus dem gehause eher auch nicht, denn diese platten /anschluesse (rechne mal 3 jahre abzuegl. We morgens rein, abends raus, wie viele verbindungen das waren)
und jetzt kannst du deinem chef auch sagen wieso.


Gruss
Peak
Peak 30.03.2012 um 10:10:49 Uhr
Goto Top
Danke TimoBeil

Die Sache mit der Spannungsspitze habe ich auch noch vermutet. Habe ich so auch als mögliche Ursache gemeldet.

Danke euch.
Steff