thetoxic
Goto Top

Server Festplattenerweiterung + Raid0 auf Raid1

Hallo zusammen,

ich habe eine Frage zur Erweiterung einer bestehenden Server-Festplattenkonfiguration.
Bitte nicht hinterfragen warum das so ist... ich habe selbst mit dem Kopf geschüttelt und würde es gern verbessern...

Situation:
Ein HP Server vom Typ ProLiant DL360 Gen9 hat folgende Festplattenkonfiguration:
  • 1x 120GB SSD, Raid 0, als logisches Volume -> Systemlaufwerk mit installiertem OS (WinServer 2019)
  • 1x 1,2 TB NVMe SSD (Datenbereich)

Problem:
Im Falle eines Ausfalls der 120GB SSD ist der Server futsch... So ist die Lage, dies würde ich gern zeitnah als erstes beheben.
Um den Datenbereich kümmere ich mich später...

Ziel:
Der Server kann ad-hoc nicht neu installiert werden, sondern soll idealerweise im Live-Betrieb auf ein Raid1 gehoben werden
Also eine zusätzliche Festplatte einbauen und ein Raid1 für die Systemlaufwerke einrichten.

Meine Idee:
  • neue Festplatte einstecken -> Dies sollte ja im Live-Betrieb möglich sein, oder?
  • per HPE-Tool "Smart Storage Administrator" das RAID 0 in ein RAID 1 wandeln-> Ist dies so im Live-Betrieb möglich?

Ein Reboot/Downtime ist vertretbar, eine Formatierung der Platten(bzw. Raid) bzw. Neuinstallation soll vermieden werden.

Ich habe selbst noch nie eine Transformation von einem Raid0 mit einer Disk zu einem Raid1 mit zwei Disks ohne Formatierung durchgeführt, habe auch keine Möglichkeit dies an einem Testsystem zu testen.


Über eure Antworten, Ideen und Anregungen bin ich euch sehr dankbar.

Gruß, TheToxic

Content-ID: 24245890377

Url: https://administrator.de/contentid/24245890377

Ausgedruckt am: 24.11.2024 um 19:11 Uhr

MirkoKR
MirkoKR 04.01.2024 aktualisiert um 11:02:33 Uhr
Goto Top
Moin.

bleibt nur: System extern sichern!
Neues Raid einbauen/konfigurieren!

Am Besten gleich Raid 5!
(Verteilung über mehrere Platten mit erhöhter Ausfallsicherheit und Performancegewinn)

Nachtrag: Bei Hardwarewechsel des Raid-Controllers VORHER die neuen Treiber installieren, sonst ggf. Bluescreen ...
Hubert.N
Lösung Hubert.N 04.01.2024 aktualisiert um 11:43:35 Uhr
Goto Top
Moin

wenn du wirklich ein RAID 0 mit nur einer Platte hast (was ich ein wenig komisch finde, weil man für eine RAID 0 normalerweise 2 Platten braucht), dann könnte es gehen. Voraussetzung für solche Dinge ist bei HP normalerweise das Vorhandensein einer BBU.
Schau mal hier: https://community.hpe.com/t5/proliant-servers-ml-dl-sl/create-a-new-raid ...


Zitat von @MirkoKR:
Am Besten gleich Raid 5!
(Verteilung über mehrere Platten mit erhöhter Ausfallsicherheit und Performancegewinn)
"it depends on" - so pauschal kann man das leider nicht sagen. Je nach Hardwarecontroller kann z.B. ein RAID 1 im Lesezugriff schneller als ein RAID 5 sein.

Gruß
commodity
commodity 04.01.2024 aktualisiert um 12:25:23 Uhr
Goto Top
Zitat von @MirkoKR:
bleibt nur: System extern sichern!
Neues Raid einbauen/konfigurieren!

Nein. Eine RAID-Level-Migration ist oftmals möglich. Gerade im Fall von RAID0 auf RAID1 auf einer Platte werden ja nicht einmal die Daten angefasst. Da wird einfach die zweite Platte gespiegelt. Bei Software-RAID wird der Superblock angepasst, bei Hardware-RAID macht das der Controller.
Beisppiel:
https://www.dell.com/support/kbdoc/en-us/000129246/dell-poweredge-how-to ...
https://www.thomas-krenn.com/de/wiki/RAID-Migration

Wichtig - wie Kollege @MirkoKR sinngemäß schreibt: Backup vorab ist Pflicht (ich würde eine Vollspiegelung machen - und diese zunächst testen)!
Im Übrigen im Handbuch des Controllers nachlesen, ob die Prozedur erlaubt ist und wie man vorgeht face-wink

Am Besten gleich Raid 5!
RAID5 macht man heute eher nicht mehr. Wie jeder weiß, verkraftet RAID5 nur einen Laufwerksausfall. Dass mehr Laufwerke gleichzeitig ausfallen ist auch unwahrscheinlich, soweit also ok. Im nachfolgenden Rebuild ist aber die Belastung des Systems so groß, dass durchaus mit einem weiteren Ausfall zu rechnen ist. Daher wird RAID6 seit geraumer Zeit als Mittel der Wahl empfohlen. Besser aber ein RAID5 als keines face-smile

Viele Grüße, commodity
ukulele-7
ukulele-7 04.01.2024 aktualisiert um 12:26:13 Uhr
Goto Top
Was verstehst du unter "im Live-Betrieb"? Live im Sinne von OS läuft durch oder du kannst neu starten und im RAID Controller BIOS Operationen durchführen? Ggf. wirst du Firmware Updates für Controller und oder Platten durchführen müssen, wenn z.B. die neue Platte eine deutlich neuere Firmware hat. Während das OS weiter arbeitet solche Operationen durchführen können wirklich i.d.R. nur sehr teure Storrage Systeme, da wirst du mit Sicherheit nicht hin kommen. Abgesehen von der Möglichkeit besteht ja auch immer ein gewisses Risiko.

Dann ist die Frage welcher RAID Controller in dem Blech steckt. Ich weiß nicht ob HPE da mehrere anbietet für SSD in der G9, kann aber sein. Es wäre zu klären was der RAID Controller zusammen mit dem "Smart Storage Administrator" kann. Ich vermute es gibt gar keine Funktion das RAID Level zu wechseln, auch das können die ganz einfachen Controller meist nicht, 0 auf 1 könnte aber noch gehen.

Ich vermute das Blech hat keinen aktivien Support durch HPE? Die sichere Methode, und vielleicht auch die einzig mögliche Methode, ist aber vermutlich eh Backup und Restore auf ein neues RAID. Du gehst damit vielen Gefahren aus dem Weg (außer dein Backup ist fehlerhaft!) und brauchst nur eine ausreichend große Downtime. Du kannst das ganze Szenario ja auch nicht testen wie du selber schreibst, z.B. mit einem baugleichen Server.

Zitat von @MirkoKR:

Am Besten gleich Raid 5!
(Verteilung über mehrere Platten mit erhöhter Ausfallsicherheit und Performancegewinn)
Nein.

- Der Controller hat im RAID5 deutlich mehr zu rechnen (auch die CPU, grade bei so entry level Controllern die alles von der CPU rechnen lassen).
- Schreiben != Lesen
- RAID1 mit zwei defekten Platten = tot, RAID5 mit zwei defekten Platten = tot, die Ausfallsicherheit ist nicht höher.
- RAID5 durch Hardware ist ggf. propritär umgesetzt und kann nicht an jedem anderen Controller wieder in Betrieb genommen werden.
- Nicht alle SSDs sind gut im RAID5, so genau kenne ich mich aber mit SSD im RAID nicht aus.
MirkoKR
MirkoKR 04.01.2024 aktualisiert um 12:50:56 Uhr
Goto Top
Ein Raid 5 ist ja "nur" eine "ältere" Bezeichnung bei dem beliebig viele Platten eingebunden werden, heute oft als Raid 6 mit vier oder mehr Platten bezeichnet ...

Faktisch werden die Daten paritätiisch auf den verfügbaren Platten aufgeteilt, sodass bei Raid 5/6 mit vier oder mehr Platten auch mehr Platten physikalisch ausfallen können ohne Datenverlust ...

... Klar beim Austausch defekter Platten gibt es erhöhten Rechenaufwand ....

... muss aber nicht gleich so ausarten, wie bei "2 and a half man" 🤣
ukulele-7
ukulele-7 04.01.2024 um 15:06:17 Uhr
Goto Top
Zitat von @MirkoKR:

Ein Raid 5 ist ja "nur" eine "ältere" Bezeichnung bei dem beliebig viele Platten eingebunden werden, heute oft als Raid 6 mit vier oder mehr Platten bezeichnet ...
Also RAID5 ist sehr klar definiert, genau wie RAID6, und diese Bezeichnungen werden auch durch die Bank verwendet.

Faktisch werden die Daten paritätiisch auf den verfügbaren Platten aufgeteilt, sodass bei Raid 5/6 mit vier oder mehr Platten auch mehr Platten physikalisch ausfallen können ohne Datenverlust ...
Genau genommen bei RAID5 eine, bei RAID6 zwei. dafür sinkt auch die Nettokapazität bei RAID6 um die Speichermenge einer weiteren Platte.

... Klar beim Austausch defekter Platten gibt es erhöhten Rechenaufwand ....
...oder bei jeder Schreiboperation im laufenden Betrieb.

Ein vier Platten RAID6 für IO-intensive Systempartitionen auf SSDs ist aus meiner Sicht so ziemlich das schlechteste was man machen kann. Du opferst besonders teuren und schnellen Speicher (50%) für Paritätsinformationen und Verschleiß durch eigentlich recht unwichtige Systemdateien. Zusätzlich kann genau in dem Moment, wo dein System hohe Leistung liefern muss, die CPU zusätzlich belastet werden.

Natürlich kommt es immer auf den Einzelfall aber allgemein zu sagen immer gleich RAID5/6 für ein Systemlaufwerk halte ich für genau falsch gedacht. Wenn es schnell sein soll RAID0 oder 1. Wenn du Angst um dein OS oder deine Softwareinstallation hast, mache Backups, Restore Tests und dokumentiere vollständig wie sich das System auf der grünen Wiese neu aufbauen lässt.

Wenn es groß sein soll RAID5 oder 6. Wenn es richtig groß sein soll (im Sinne von Anzahl der Disks) und oder eventuell Restore Zeiten ein Problem werden dann ein Modi wie z.B. DDP bei unserer NetApp der Parität mehrfach (bei uns 4 mal) auf den gesamten Pool verteilt ablegt. Nichts ist schlimmer als ein großes RAID5/6 das bei einem Rebuild über Stunden oder Tage alle Blöcke von allen Disks lesen muss, und das muss es immer, und kein einziger Lesefehler passieren darf. Sowohl Festplatten als auch SSDs wissen ja nicht immer, was sie lesen können, bis sie es versuchen. So ein Rebuild deckt verborgene Probleme schonungslos auf.
MirkoKR
MirkoKR 04.01.2024 um 15:17:43 Uhr
Goto Top
OK, zu meiner Anfangszeit war nur von Raid5 mit mehr als 3 Laufwerken die Rede ... das war aber noch SCSI .,.
Avoton
Avoton 04.01.2024 um 22:18:30 Uhr
Goto Top
Zitat von @MirkoKR:

OK, zu meiner Anfangszeit war nur von Raid5 mit mehr als 3 Laufwerken die Rede ... das war aber noch SCSI .,.

Aber auch damals hat ein RAID5 nur einen Festplattenausfall verkraftet, auch wenn drölfzig Platten im Array waren ;)
MirkoKR
MirkoKR 04.01.2024 um 22:28:07 Uhr
Goto Top
Zitat von @Avoton:

Aber auch damals hat ein RAID5 nur einen Festplattenausfall verkraftet, auch wenn drölfzig Platten im Array waren ;)

Meines Wissens wurden immer schon die Paritäten bei Raid5/6 paarweise aufgeteilt

A-,B, B-C, C-A

wenn eine ausfällt passts

und bei mehr Platten, z. B 5 eben

A-B, B-C, C-D, D-E, E-A
es könnten also 2 ohne Verlust ausfallen ...
Avoton
Avoton 04.01.2024 aktualisiert um 22:40:18 Uhr
Goto Top
Meines Wissens wurden immer schon die Paritäten bei Raid5/6 paarweise aufgeteilt
Das stimmt nicht.
RAID 5 und 6 verteilen die Pairtätsinfos auf Blockebene (RAID 6 zweifach).

Es sieht bei RAID 5 eher so aus (eine Spalte ist eine Festplatte):
A1 A2 Ap
B1 Bp B2
Cp C1 C2

Du brauchst um die Daten lesen zu können entweder alle Teile (im Beispiel 1+2) oder n-1 Teile + die Parität. Brechen dir zwei Platten weg, sind die Daten futsch.

RAID6 hat zweifache Parität und kann daher zwei Ausfälle gleichzeitig verkraften.

Es ist dabei unabhängig, wie viele Platzen im Array sind.
MirkoKR
MirkoKR 04.01.2024 um 22:59:04 Uhr
Goto Top
OK. Kenne ich seit knapp 30 Jahren so wie von mir beacheieben und bestätigt sich auch bei einer einfache g*-Suche nach "Raid5"

RAID 5 nutzt das vom RAID-Level 0 bekannte Striping und verteilt die Daten in Blöcken auf den verschiedenen Platten. Zusätzlich errechnet RAID 5 aus den Nutzdaten Paritätsinformationen
https://www.storage-insider.de/was-ist-raid-5-a-821701/
Avoton
Avoton 04.01.2024 aktualisiert um 23:03:27 Uhr
Goto Top
Dann ist deine Beschreibung oben irreführend:

A-B, B-C, C-D, D-E, E-A
es könnten also 2 ohne Verlust ausfallen

Wenn in dem Beispiel die ersten beiden ausfallen, ist kein "B" mehr da...
MirkoKR
MirkoKR 04.01.2024 um 23:13:21 Uhr
Goto Top
Zitat von @Avoton:

Dann ist deine Beschreibung oben irreführend:

A-B, B-C, C-D, D-E, E-A
es könnten also 2 ohne Verlust ausfallen

Wenn in dem Beispiel die ersten beiden ausfallen, ist kein "B" mehr da...

korrekt
MirkoKR
MirkoKR 04.01.2024 um 23:28:09 Uhr
Goto Top
Pointe ... eigentlich erst für Morgen 😉 - erinnere mich noch zu meinen Anfangszeiten an Token Ring - Netzwerke, WLAN.b PCi -Einsteckkarten mit 11 MBit und erste Netzwerke mit "schnellen" 100MBit.... 🤣
Vision2015
Vision2015 05.01.2024 um 07:24:14 Uhr
Goto Top
Moin...

ein Raid 0 mit nur einer SSD /HDD ?!?!?!? auf einem HP DL380 G9...

neue Festplatte einstecken -> Dies sollte ja im Live-Betrieb möglich sein, oder?
jo... das ist machbar face-smile
per HPE-Tool "Smart Storage Administrator" das RAID 0 in ein RAID 1 wandeln-> Ist dies so im Live-Betrieb möglich?
wenn du mir jetzt noch sagst, welchen Controller du verbaut hast, würde ich sogar das für dich in der Werkstatt testen...
ich bin der meinung, das es nicht geht!
ich würde mich auf sowas auch nicht einlassen wollen, erstelle ein Image, erstelle dein Raid 1, mach ein Restore vom Image, und gut ist!

Frank
Avoton
Avoton 05.01.2024 um 08:21:01 Uhr
Goto Top
ein Raid 0 mit nur einer SSD /HDD ?!?!?!? auf einem HP DL380 G9...
Manche Controller betiteln eine single Disk tatsächlich so...
TheToxic
Lösung TheToxic 05.01.2024 um 08:28:24 Uhr
Goto Top
Ist ja ganz schön am Thema vorbei eskaliert hier :-P

Ich danke euch schonmal für eure Anregungen.

Wird so werden...
  • Server Fullbackup
  • Test ob Migration von Raid0 auf Raid1 möglich, wenn ok -> Freude! -> wenn nicht OK -> Raid0 platt machen, Raid1 sauber einrichten
  • Restore Backup in neues Raid1
Vision2015
Vision2015 05.01.2024 um 08:41:07 Uhr
Goto Top
Moin...
Zitat von @Avoton:

ein Raid 0 mit nur einer SSD /HDD ?!?!?!? auf einem HP DL380 G9...
Manche Controller betiteln eine single Disk tatsächlich so...

ja klar.... nur wo ist da der sinn?
ukulele-7
ukulele-7 05.01.2024 aktualisiert um 08:45:32 Uhr
Goto Top
Zitat von @MirkoKR:

und bei mehr Platten, z. B 5 eben

A-B, B-C, C-D, D-E, E-A
es könnten also 2 ohne Verlust ausfallen ...
In deinem Beispiel verwendest du 5 parallele Blöcke, A bis E, und jeder existiert scheinbar zwei mal. Soviele gibt es ja gar nicht in einem RAID5 mit 5 Platten, es gibt 4 + die Parität daher auch Kapazität Netto die von 4 Disks. Rein logisch existiert jeder Block einmal + die Parität aus je 4 Blöcken, nicht jeder Block zwei mal. Wo die Parität genau liegt ist damit eigentlich egal, fallen zwei Platten aus fehlt dir je ein Datenblock + die zugehörige Parität bzw. zwei Datenblöcke, damit kannst du nicht mehr zurück rechnen, egal wie viele Datenblöcke zusammen eine Parität bilden.
Avoton
Avoton 05.01.2024 um 09:23:28 Uhr
Goto Top
ja klar.... nur wo ist da der sinn?

Ich denke die "Logik" bei denen ist: Raid 0 passt am ehesten, da die Daten ja auf einer Disk verteilt werden (also quasi "Striping").

Bei allen anderen RAID Leveln ist ja irgendeine Redundanz gegeben, bei einer Disk und Raid 0 eben nicht.

So hab ich's mir immer erklärt 🤷🏻‍♂️
commodity
commodity 05.01.2024 um 18:04:27 Uhr
Goto Top
Wird so werden...
Dann bitte Wie kann ich einen Beitrag als gelöst markieren?

Viele Grüße, commodity
TheToxic
Lösung TheToxic 15.01.2024 um 12:54:57 Uhr
Goto Top
Hallo zusammen,

der Plan hat funktioniert.
Nachdem die Platte gesteckt wurde konnte direkt im laufenden Betrieb aus dem Raid0 ein Raid1 erzeugt werden.

Thema abgeschlossen.

Danke für eure Unterstützung!

Gruß, TheToxic


Zitat von @TheToxic:

Ist ja ganz schön am Thema vorbei eskaliert hier :-P

Ich danke euch schonmal für eure Anregungen.

Wird so werden...
  • Server Fullbackup
  • Test ob Migration von Raid0 auf Raid1 möglich, wenn ok -> Freude! -> wenn nicht OK -> Raid0 platt machen, Raid1 sauber einrichten
  • Restore Backup in neues Raid1