joh316
Goto Top

Austausch defekter BBU eines RaidControllers

Guten Abend.

Bei einem Server (Lenovo ThinkSystem SR630, 7x02) sind seit einigen Tagen hohe Latenzzeiten auf dem Datastore zu verzeichnen. Offenbar kommt es daher, dass die Battery Backup Unit des RAID Controllers tot ist und damit ein Write-Through stattfindet.

RAID Controller: ThinkSystem RAID 930-8i mit 2GB Flash

Ich hatte noch nie die Ehre, so ein Akkupaket / BBU zu tauschen. Daher mal eine grundsätzliche Frage zur Vorgehensweise:

Normalerweise würde ich einen Server ja immer stromlos machen, wenn ich ihn öffne, aber in diesem Fall bin ich mir nicht sicher, ob das klug ist. Wenn die BBU bzw. Der Akku tot ist, dann kommt doch die Stromversorgung für das Verfügbar halten der Controller-Konfiguration über die Stromversorgung des Servers, oder?
Das müsste doch heißen, wenn ich den Strom vom Server ziehe und dann das Akkupaket tausche, dann ist das RAID danach kaputt. Verstehe ich das richtig so, oder hat der RAID Controller noch eine weitere Spannungsquelle? Woher auch immer?

Danke für eine kurze Aufklärung dazu und einen schönen Abend noch.

Content-ID: 41558000216

Url: https://administrator.de/forum/austausch-defekter-bbu-eines-raidcontrollers-41558000216.html

Ausgedruckt am: 27.12.2024 um 11:12 Uhr

Vision2015
Vision2015 15.05.2024 um 21:18:55 Uhr
Goto Top
Moin..

die BBU hat nix mit deiner controller config zu tun, sondern mit dem Cache, wenn die daten zurückgeschrieben werden sollen!

also fahre die kiste sauber runter, und tausche die BBU aus, und alles wird gut- sofern du nix anders machst, als du sollst!

Frank
tikayevent
tikayevent 15.05.2024 aktualisiert um 21:38:23 Uhr
Goto Top
Die BBU ist nur dazu da, dass Daten, die im Cache des Controllers liegen, bei einem Stromausfall zwischen zu speichern, damit diese nach der Wiederherstellung auf die Festplatte geschrieben werden können.
Der Cache hält die Daten im Normalbetrieb aber nur so lange, bis die Festplatten diese geschrieben haben. Damit soll einfach nur das Geschwindigkeitsdefizit ausgeglichen werden.

Wenn das System und damit der Controller sauber heruntergefahren wird, wird beim Herunterfahren dafür Sorge getragen, dass die Daten vor dem Abschalten alle aus dem Cache auf die Festplatten geschrieben wurden.

Schau mal in die Anleitung des Servers und des Controllers, einige Komponenten werden als Hotplug-fähig markiert, dann kannst du die auch im laufenden Betrieb wechseln. Einige Hersteller machen dieses über unterschiedliche Farben.
Je nach Server kann man selbst CPU und RAM im laufenden Betrieb wechseln.

PS: Die BBU ist bei fast jedem Controller optional. Sie ist bei aktiviertem Cache dringend empfohlen, aber auch da nicht nötig, da eine USV vor dem Server effektiv das gleiche bewirkt.
em-pie
em-pie 15.05.2024 um 21:39:44 Uhr
Goto Top
Moin,

Wir Vision2015 schon schrieb.
Fahre alles sauber herunter. Die Bibi dient tatsächlich nur dazu, die Daten, die im Cache liegen, bei einer (kurzen) Stromunterbrechung, nicht verloren gehen zu lassen.

Die RaidConfig selbst wird im ROM/ persistenten Speicher des Controllers UND bei den meisten Controllern auch zusätzlich auf den Platten geschrieben. Dadurch ist gewährleistet, dass beim Tausch des Controllers das RAID intakt bleibt (sofern nicht gleichzeitig alle Platten durchgetauscht werden).

Würde die BBU den Erhalt der Config verantworten zu haben, wäre bei (geplanten) längeren Stromunterbrechungen ja ein heilloses Chaos da…
joh316
joh316 15.05.2024 um 21:45:51 Uhr
Goto Top
Alles klar. Besten Dank für die Aufklärung. Ich werde also den Server normal abstecken, bevor ich was tausche. Da ist mir wohler.
StefanKittel
Lösung StefanKittel 15.05.2024 um 22:21:13 Uhr
Goto Top
Zitat von @joh316:
...Offenbar kommt es daher, dass die Battery Backup Unit des RAID Controllers tot ist und damit ein Write-Through stattfindet...
Das kann gut sein. Viele Controller erlauben die Nutzung des Caches für Schreiboperationen nur wenn man eine BBU hat. Wenn der Controller der Meinung ist, dass Deine BBU nicht mehr funktioniert wechselt er den Cache zu Nur-Lese-Modus.

Hinweis: Eine BBU besteht aus 2 Componenten. Einmal dem Cachemodus und einmal einem Akku.
Häufig ist das eine Einheit. Bei Fujitsu konnte/musste man das früher seperat bestellen. Heute sind das meist Flash-Module.

Sonst wie besprochen.
Sauber runterfahren, alte BBU ab, neue BBU dran und fertig.

Stefan
Lochkartenstanzer
Lochkartenstanzer 16.05.2024 um 08:54:55 Uhr
Goto Top
Zitat von @joh316:

Normalerweise würde ich einen Server ja immer stromlos machen, wenn ich ihn öffne, aber in diesem Fall bin ich mir nicht sicher, ob das klug ist. Wenn die BBU bzw. Der Akku tot ist, dann kommt doch die Stromversorgung für das Verfügbar halten der Controller-Konfiguration über die Stromversorgung des Servers, oder?


Moin,

Nein, die BBU ist nur für den Cache zuständig. Die Raid-Konfiguration steht i.d.R. im nichtflüchtigen Speicher.

Außerdem hast Du ja ein Backup. face-smile

lks
Penny.Cilin
Penny.Cilin 16.05.2024 um 09:27:35 Uhr
Goto Top
@Lochkartenstanzer
Außerdem hast Du ja ein Backup.
Backup, was ist Backup? face-wink
Das ist doch Neuland, oder so....

Gruss Penny.
joh316
joh316 05.06.2024 um 11:07:27 Uhr
Goto Top
Besten Dank nochmal für alle Hilfe.

Kurz, um den Thread zu schließen:
Der Austauch der BBU ist problemlos durchgeführt worden. Server wurde ordnungsgemäß heruntergefahren, alle Kabel getrennt, BBU getauscht, alles wieder hochgefahren. Ohne Fehler.