Gedankenspiel Festplatte im Raid defekt.
Was tun wenn eine Platte im Raid defekt ist.
Hi,
glücklicher Weise hatte ich den Fall noch nie, die Hardware wurde immer vorher ausgetaucht ^^.
Aber was wäre wenn in einem Raid 1 eine der beiden Platten einen defekt hat?
So wie ich das verstehe müsste ich die Defekte ausbauen und eine Neue (am besten baugleiche) einbauen dem Kontroller sagen, dass er die alte auf die neue spiegeln soll.
Ist das soweit korrekt?
Würdet ihr euch solch eine baugleich Platte auf Lager legen um
1. im Ernstfall schnell reagieren zu können
2. um Probleme auf dem Kontroller zu vermeiden
???
Danke schon mal an alle Poster.
Hi,
glücklicher Weise hatte ich den Fall noch nie, die Hardware wurde immer vorher ausgetaucht ^^.
Aber was wäre wenn in einem Raid 1 eine der beiden Platten einen defekt hat?
So wie ich das verstehe müsste ich die Defekte ausbauen und eine Neue (am besten baugleiche) einbauen dem Kontroller sagen, dass er die alte auf die neue spiegeln soll.
Ist das soweit korrekt?
Würdet ihr euch solch eine baugleich Platte auf Lager legen um
1. im Ernstfall schnell reagieren zu können
2. um Probleme auf dem Kontroller zu vermeiden
???
Danke schon mal an alle Poster.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 177648
Url: https://administrator.de/contentid/177648
Ausgedruckt am: 22.11.2024 um 14:11 Uhr
16 Kommentare
Neuester Kommentar
Hallo,
ich würde bei Ausfall einer Platte beide Platten tauschen, da die mechanische und thermische Belastung bei allen Platten gleicht ist/war und damit womöglich die andere Platte auch zeitnah abraucht. Eine Ersatzplatte ist somit nur zum Überbrücken, bis die neuen da sind. Ob sich das rechnet, mußt Du entscheiden.
Grüße perseues
ich würde bei Ausfall einer Platte beide Platten tauschen, da die mechanische und thermische Belastung bei allen Platten gleicht ist/war und damit womöglich die andere Platte auch zeitnah abraucht. Eine Ersatzplatte ist somit nur zum Überbrücken, bis die neuen da sind. Ob sich das rechnet, mußt Du entscheiden.
Grüße perseues
Hallo perseuses,
Aus den letzten 8 Jahren Rechenzentrumserfahrung kann ich das nicht bestätigen.
grüße vom it-frosch
ich würde bei Ausfall einer Platte beide Platten tauschen, da die mechanische und thermische Belastung bei allen Platten gleicht ist/war und damit womöglich die andere
Platte auch zeitnah abraucht.
Platte auch zeitnah abraucht.
Aus den letzten 8 Jahren Rechenzentrumserfahrung kann ich das nicht bestätigen.
grüße vom it-frosch
Hallo GuentherH,
er hat aber keine 24 SCSI/SAS Platten verbaut, die in einem klimatisierten Serverraum laufen, sondern zwei im RAID 1. Da würde ich bei den aktuellen Plattenpeisen beide tauschen (und erst dann besorgen), bevor 1 im Schrank auf den möglichen Einsatz wartet, der am Schluss dann doch nicht eintritt.
Grüße perseues
er hat aber keine 24 SCSI/SAS Platten verbaut, die in einem klimatisierten Serverraum laufen, sondern zwei im RAID 1. Da würde ich bei den aktuellen Plattenpeisen beide tauschen (und erst dann besorgen), bevor 1 im Schrank auf den möglichen Einsatz wartet, der am Schluss dann doch nicht eintritt.
Grüße perseues
Wir versuchen im Unternehmen alle Platten zu standardisieren. D.h. alle Platten von einem Hersteller und wenn möglich der selben Größe zu verwenden. Das klappt nicht immer, weil die Platten ja von der Größe her wachsen und länger im Einsatz sind.
Und deshalb habe ich von einer eingesetzten Platte immer eine identische als Ersatz da. Mir sind auch nie Platten kurz hintereinander kaputt gegangen. Das ist statistisch auch höchst unwahrscheinlich. Noch werden Platten ja nicht so gebaut, dass sie in x Jahren kaputt gehen MÜSSEN.
Ob man sich eine Platte hinlegt hängt von ein paar Faktoren ab. Wie kritisch sind die Daten? Kann man sich einen Tag ohne Ausfallsicherheit leisten? Wie lange dauert es, bis man die Daten von einem Offline-Medium zurückgespielt hat?
Wir verfolgen die Strategie im Haus, dass wir sämtliche Rechner in Einzelteilen noch einmal bereit liegen haben. Das ist am Ende billiger als einen Wartungsvertrag mit 24h Reaktionszeit für alle Rechner vorzuhalten. Wenn man dann die Teile noch in Losen standardisiert, dann hat man im Idealfall nur einen Client- und einen Server-Rechner in Einzelteilen rumliegen. Keine zu große Investition. Hardware ist billig.
Wir gehen bei unseren geschäftskritischen Daten noch einen Schritt weiter und halten zu jedem RAID1 noch ein Hotspare-Laufwerk vor, so dass beim Ausfall einer Platte (z.B. in der Nacht) die Hotspare einspringt und die Sicherheit wiederherstellt. Damit ist ein Ausfall beider Platten mit einem Abstand von ein paar Stunden (Kopierzeit) möglich, ohne dass die Daten weg sind. Am nächsten Tag tauschen wir dann die Hotspare aus und bestellen eine Neue.
Im Moment sind wir mit dieser Vorgehensweise auch zusätzlich im Vorteil, weil Serverplatten durch die Überschwemmung in Thailand derzeit Mangelware sind und man nur noch schwer und mit Zusatzkosten welche bekommt.
Und deshalb habe ich von einer eingesetzten Platte immer eine identische als Ersatz da. Mir sind auch nie Platten kurz hintereinander kaputt gegangen. Das ist statistisch auch höchst unwahrscheinlich. Noch werden Platten ja nicht so gebaut, dass sie in x Jahren kaputt gehen MÜSSEN.
Ob man sich eine Platte hinlegt hängt von ein paar Faktoren ab. Wie kritisch sind die Daten? Kann man sich einen Tag ohne Ausfallsicherheit leisten? Wie lange dauert es, bis man die Daten von einem Offline-Medium zurückgespielt hat?
Wir verfolgen die Strategie im Haus, dass wir sämtliche Rechner in Einzelteilen noch einmal bereit liegen haben. Das ist am Ende billiger als einen Wartungsvertrag mit 24h Reaktionszeit für alle Rechner vorzuhalten. Wenn man dann die Teile noch in Losen standardisiert, dann hat man im Idealfall nur einen Client- und einen Server-Rechner in Einzelteilen rumliegen. Keine zu große Investition. Hardware ist billig.
Wir gehen bei unseren geschäftskritischen Daten noch einen Schritt weiter und halten zu jedem RAID1 noch ein Hotspare-Laufwerk vor, so dass beim Ausfall einer Platte (z.B. in der Nacht) die Hotspare einspringt und die Sicherheit wiederherstellt. Damit ist ein Ausfall beider Platten mit einem Abstand von ein paar Stunden (Kopierzeit) möglich, ohne dass die Daten weg sind. Am nächsten Tag tauschen wir dann die Hotspare aus und bestellen eine Neue.
Im Moment sind wir mit dieser Vorgehensweise auch zusätzlich im Vorteil, weil Serverplatten durch die Überschwemmung in Thailand derzeit Mangelware sind und man nur noch schwer und mit Zusatzkosten welche bekommt.
Moin,
Jje nach dem - bei einem wichtigen Server an dem xxx Kollegen hängen und von dem ich "logischerweise" Backups habe - würde "ich":
Bei ner 148 GB Platte mit 10k und SAS gilt das natürlich nur bedingt. - Wobei da auch das Backup keinen Spass macht.
Immer frei nach dem Motto - wird die Platte nicht benutzt/die daten darauf nicht verändert und der interne Cache ausschliesslich "sinnvoll" genutzt - ratzfatz
Gruß
Aber was wäre wenn in einem Raid 1 eine der beiden Platten einen defekt hat?
Jje nach dem - bei einem wichtigen Server an dem xxx Kollegen hängen und von dem ich "logischerweise" Backups habe - würde "ich":
- den Server abends runterfahren
- Platten offline tauschen - auch bei Hotplug
- im Bios vom Raid Controller das Raid rebuilden lassen
- via ILO einen Blick von zuhause auf den Kasten werfen
- und den dann durchstarten, wenn der "fertig" ist.
- Rebuild einer lahmen großen Raid1/5 x Baustelle im laufenden Betrieb geht zar auch - dauert aber 3* länger und die Kiste ist währenddessen nicht wirklich "Sie selbst"
Bei ner 148 GB Platte mit 10k und SAS gilt das natürlich nur bedingt. - Wobei da auch das Backup keinen Spass macht.
Immer frei nach dem Motto - wird die Platte nicht benutzt/die daten darauf nicht verändert und der interne Cache ausschliesslich "sinnvoll" genutzt - ratzfatz
Würdet ihr euch solch eine baugleich Platte auf Lager legen um
- das kommt ganz drauf an - üblicherweise haben wir ja "Support Packs" - also jein...
Gruß
Hi !
[ot]
Hast Du dir überhaupt mal die aktuellen Plattenpreise angeschaut? Sieht nicht so aus... :-P
Edit ...Und nicht nur die Preise für Serverplatten sind massiv gestiegen und das soll (wird) wohl auch noch eine Weile so bleiben...
[/ot]
mrtux
[ot]
Zitat von @perseues:
würde ich bei den aktuellen Plattenpeisen beide tauschen (und erst dann besorgen), bevor 1 im Schrank auf den möglichen
würde ich bei den aktuellen Plattenpeisen beide tauschen (und erst dann besorgen), bevor 1 im Schrank auf den möglichen
Hast Du dir überhaupt mal die aktuellen Plattenpreise angeschaut? Sieht nicht so aus... :-P
Edit ...Und nicht nur die Preise für Serverplatten sind massiv gestiegen und das soll (wird) wohl auch noch eine Weile so bleiben...
[/ot]
mrtux
Üblicherweise baut man bei kritischen Infrastrukturen gleich noch eine hotspare-Platte mit ein. Sobald eine der Platten im RAID-Verbund schlappmacht, wird halt die hotspare gleich mit Daten befüllt. Dann ist die Zeitspanne in der die Redundanz weg ist, möglichst kurz gehalten. Wichtig ist natürlich, daß das System den Admin vernünftig benachrichtigt, damit das System nicht tagelang alleine vor sich rumheult, daß der Admin die Platte nicht tauscht.
@mrtux
die Frage war bei RAID1 = 2 Platten. Hier lege ich mir keine Ersatzplatte in den Schrank, die möglicherweise nie zum Einsatz kommt (totes Kapital, dass dann mit dem Server entsorgt wird). Bei 24 Platte schauts anders aus, war aber nicht die Frage. Und sollte es mal das RAID 1 zerbröseln, kaufe ich zwei (wenns denn passiert) . : -P
Grüße perseues
die Frage war bei RAID1 = 2 Platten. Hier lege ich mir keine Ersatzplatte in den Schrank, die möglicherweise nie zum Einsatz kommt (totes Kapital, dass dann mit dem Server entsorgt wird). Bei 24 Platte schauts anders aus, war aber nicht die Frage. Und sollte es mal das RAID 1 zerbröseln, kaufe ich zwei (wenns denn passiert) . : -P
Grüße perseues
Und was machst Du in der Zeit, bis die beiden neuen Platten da sind? Server herunterfahren udn darauf warten, daß die kommen? ich weiß es ja nicht wie es bei Dir im Betrieb ist, aber bei meinen Kunden bedeutet jede Wartezeit Geldverslust. Daher wird diese Wartezeit und die Gefahr des Datenverlusts dadurch minimiert, daß man auch mal eine Festplatte "verschwendet". Die kostet egal, wie teuer sie momentan sein mag, deutlich weniger als eine Stunde länger auf den Betrieb des Servers. zu warten.
Wenn man natürlich direkt einen Händler/Distributer ums Eck hat, von dem man dann die Sachen schnell mal holen kann, ist das natürlich anders. Da hat man auch nicht mehr Zeitverlust als wenn man ins Lager geht und die Platte holt. Den Vorteil hatte ich vor 15 Jahren mal, als ich noch bei einem Systemhaus gearbeitet habe, das direkt neben einem Distributor stand. Das war vielleicht angenehm den als gut ausgestattes Lager direkt nebenan zu haben. Nur ganz selten auf Ware warten müssen.
Wenn man natürlich direkt einen Händler/Distributer ums Eck hat, von dem man dann die Sachen schnell mal holen kann, ist das natürlich anders. Da hat man auch nicht mehr Zeitverlust als wenn man ins Lager geht und die Platte holt. Den Vorteil hatte ich vor 15 Jahren mal, als ich noch bei einem Systemhaus gearbeitet habe, das direkt neben einem Distributor stand. Das war vielleicht angenehm den als gut ausgestattes Lager direkt nebenan zu haben. Nur ganz selten auf Ware warten müssen.
OT
eigentlich ist der Fred doch gelöst...
Ganz im Ernst - ich hab nen "Fetten" Client - dem ich auch mal - wenns garnicht anders geht als ESX laufen lassen kann.
Im SAN hab ich genauso ne Hotspare, wie in jedem Raid5.
Bei Raid1 und Servern - die "nur" 8 Platten abkönnen (ok die Geräter "sterben" aus) Verschwende ich keinen Plattenmontageplatz um eine Hotspare Raid1 und Raid5 vorzuhalten.
[/OT]
eigentlich ist der Fred doch gelöst...
Ganz im Ernst - ich hab nen "Fetten" Client - dem ich auch mal - wenns garnicht anders geht als ESX laufen lassen kann.
Im SAN hab ich genauso ne Hotspare, wie in jedem Raid5.
Bei Raid1 und Servern - die "nur" 8 Platten abkönnen (ok die Geräter "sterben" aus) Verschwende ich keinen Plattenmontageplatz um eine Hotspare Raid1 und Raid5 vorzuhalten.
[/OT]
Hallo CSE,
bau in den Server immer Wechselplattenrahmen und Bandlaufwerk ein. Es gibt da solide für SSD und SATA und ... Nimm doppelt so viele wie du genötigst und tausche jeden Abend eine aus und jede Woche und jeden Monat aus und bring sie im Backup Koffer ins Nachbargebäude falls es mal brennt ist man auf der sicheren Seite. Vor dem Ausbau immer ein Backup und Restore machen und schaun ob alles drauf ist. Die Ursache dokumentieren. Es gibt heute super Temperaturfühler von http://www.ipteq.de/ Technical Solution mit kleiner Platine um Temperaturspitzen im Raum, Server, Backuptapes Raum und in der Telefonzentrale zu messen. Ob die Klimaanlage läuft und falls nicht das man remote via Website eine Email bekommt und man 4 Relais hat um z.B. Remote etwas abzuschalten . Die IPR110 ist ganz gut. Robust und passt in jeden Serverschrank. Platten sind momentan teuer, warte ein paar Monate oder kauf direkt SSD. Nun bei der alten Platte würde ich einmal nachschaun ob irgendwelche Brandspuren zu sehen sind. Sichtkontrolle und falls ja die Bauteile rund herum ausstauschen. Der UTD1025C und ein SMD Lötkolben sind immer als Werkzeugkoffer bei Reichelt zu kriegen und wenn die Platte danach wieder läuft kann man die Daten noch runterholen. Die meisten Fehler sind im Platinenbereich und die kann man für ein paar Eurocent reparieren. Baugleiche Platten sind immer gut. Wenn es die Platine ist einfach die Platine ausstauschen und die Daten runterholen. Vorher die Bauteile identifizieren und mit dem Messgerät durchmessen und auf einen Zettel schreiben und bei Reichelt mitbestellen. Damit die defekte Platine wieder fertig wird. Im Ernstfall die Platte rausholen. Platine wechseln. sofort wieder einbauen und fertig. Auch beim Kontroller, Sichtkontrolle, einen in reserve ist immer gut. Auch dort die Bauteile identifizieren und bei Reichelt besorgen. Vielleicht auch mal auf die mikrocontroller.net Seite Reinschaun und den Controllerbezeichnugn oder Festplattenbezeichnung im Suchfeld eingeben. Die meisten Serein haben schon mal Produktionsfehler in Serie und wenn dort eine Platte oder Controller auftauchen die Bauteile schon mal besorgen wenn man die gleiche hat. Sind meistens nur ein paar Eurocent aber wenn man im Bedarfsfall wenn mal wieder ein Asiatisches Land unter Wasser steht hat man Vorrat und kann schnell erneuern kostengünstig.
bau in den Server immer Wechselplattenrahmen und Bandlaufwerk ein. Es gibt da solide für SSD und SATA und ... Nimm doppelt so viele wie du genötigst und tausche jeden Abend eine aus und jede Woche und jeden Monat aus und bring sie im Backup Koffer ins Nachbargebäude falls es mal brennt ist man auf der sicheren Seite. Vor dem Ausbau immer ein Backup und Restore machen und schaun ob alles drauf ist. Die Ursache dokumentieren. Es gibt heute super Temperaturfühler von http://www.ipteq.de/ Technical Solution mit kleiner Platine um Temperaturspitzen im Raum, Server, Backuptapes Raum und in der Telefonzentrale zu messen. Ob die Klimaanlage läuft und falls nicht das man remote via Website eine Email bekommt und man 4 Relais hat um z.B. Remote etwas abzuschalten . Die IPR110 ist ganz gut. Robust und passt in jeden Serverschrank. Platten sind momentan teuer, warte ein paar Monate oder kauf direkt SSD. Nun bei der alten Platte würde ich einmal nachschaun ob irgendwelche Brandspuren zu sehen sind. Sichtkontrolle und falls ja die Bauteile rund herum ausstauschen. Der UTD1025C und ein SMD Lötkolben sind immer als Werkzeugkoffer bei Reichelt zu kriegen und wenn die Platte danach wieder läuft kann man die Daten noch runterholen. Die meisten Fehler sind im Platinenbereich und die kann man für ein paar Eurocent reparieren. Baugleiche Platten sind immer gut. Wenn es die Platine ist einfach die Platine ausstauschen und die Daten runterholen. Vorher die Bauteile identifizieren und mit dem Messgerät durchmessen und auf einen Zettel schreiben und bei Reichelt mitbestellen. Damit die defekte Platine wieder fertig wird. Im Ernstfall die Platte rausholen. Platine wechseln. sofort wieder einbauen und fertig. Auch beim Kontroller, Sichtkontrolle, einen in reserve ist immer gut. Auch dort die Bauteile identifizieren und bei Reichelt besorgen. Vielleicht auch mal auf die mikrocontroller.net Seite Reinschaun und den Controllerbezeichnugn oder Festplattenbezeichnung im Suchfeld eingeben. Die meisten Serein haben schon mal Produktionsfehler in Serie und wenn dort eine Platte oder Controller auftauchen die Bauteile schon mal besorgen wenn man die gleiche hat. Sind meistens nur ein paar Eurocent aber wenn man im Bedarfsfall wenn mal wieder ein Asiatisches Land unter Wasser steht hat man Vorrat und kann schnell erneuern kostengünstig.
Naaabend..
Nunja - ich fass das mal zusammen.
Hat was, warum sind die ganzen anderen Antworter bis jetzt noch nicht darauf gekommen?
Das beste kommt halt immer zum Schluß.
@cse mach bitte das Schloss vor den Fred.
- lol
Nimm doppelt so viele wie du genötigst und tausche jeden Abend eine aus und jede Woche und jeden Monat aus und bring sie im Backup Koffer ins Nachbargebäude falls es mal brennt ist man auf der sicheren Seite.
Vor dem Ausbau immer ein Backup und Restore machen und schaun ob alles drauf ist.
Vor dem Ausbau immer ein Backup und Restore machen und schaun ob alles drauf ist.
Nunja - ich fass das mal zusammen.
- Ein Raid1 immer durch ziehen und neueinstecken einer Platte sichern.
- Das das auch geklappt hat immer vorm ziehen der Platte überprüfen
- und dann mit der überprüften Platte zum Nachbarn in dessen Haus gehen, damit der es mit der Industriespionage nicht unnötig schwer hat.
- Zwischenzeitlich die Frau/Freundin anrufen und Schluß mit der Beziehung machen, denn man(n) hat ja jetzt was zu tun.
Hat was, warum sind die ganzen anderen Antworter bis jetzt noch nicht darauf gekommen?
Das beste kommt halt immer zum Schluß.
@cse mach bitte das Schloss vor den Fred.