Austausch defekter BBU eines RaidControllers
Guten Abend.
Bei einem Server (Lenovo ThinkSystem SR630, 7x02) sind seit einigen Tagen hohe Latenzzeiten auf dem Datastore zu verzeichnen. Offenbar kommt es daher, dass die Battery Backup Unit des RAID Controllers tot ist und damit ein Write-Through stattfindet.
RAID Controller: ThinkSystem RAID 930-8i mit 2GB Flash
Ich hatte noch nie die Ehre, so ein Akkupaket / BBU zu tauschen. Daher mal eine grundsätzliche Frage zur Vorgehensweise:
Normalerweise würde ich einen Server ja immer stromlos machen, wenn ich ihn öffne, aber in diesem Fall bin ich mir nicht sicher, ob das klug ist. Wenn die BBU bzw. Der Akku tot ist, dann kommt doch die Stromversorgung für das Verfügbar halten der Controller-Konfiguration über die Stromversorgung des Servers, oder?
Das müsste doch heißen, wenn ich den Strom vom Server ziehe und dann das Akkupaket tausche, dann ist das RAID danach kaputt. Verstehe ich das richtig so, oder hat der RAID Controller noch eine weitere Spannungsquelle? Woher auch immer?
Danke für eine kurze Aufklärung dazu und einen schönen Abend noch.
Bei einem Server (Lenovo ThinkSystem SR630, 7x02) sind seit einigen Tagen hohe Latenzzeiten auf dem Datastore zu verzeichnen. Offenbar kommt es daher, dass die Battery Backup Unit des RAID Controllers tot ist und damit ein Write-Through stattfindet.
RAID Controller: ThinkSystem RAID 930-8i mit 2GB Flash
Ich hatte noch nie die Ehre, so ein Akkupaket / BBU zu tauschen. Daher mal eine grundsätzliche Frage zur Vorgehensweise:
Normalerweise würde ich einen Server ja immer stromlos machen, wenn ich ihn öffne, aber in diesem Fall bin ich mir nicht sicher, ob das klug ist. Wenn die BBU bzw. Der Akku tot ist, dann kommt doch die Stromversorgung für das Verfügbar halten der Controller-Konfiguration über die Stromversorgung des Servers, oder?
Das müsste doch heißen, wenn ich den Strom vom Server ziehe und dann das Akkupaket tausche, dann ist das RAID danach kaputt. Verstehe ich das richtig so, oder hat der RAID Controller noch eine weitere Spannungsquelle? Woher auch immer?
Danke für eine kurze Aufklärung dazu und einen schönen Abend noch.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 41558000216
Url: https://administrator.de/contentid/41558000216
Ausgedruckt am: 24.11.2024 um 11:11 Uhr
8 Kommentare
Neuester Kommentar
Die BBU ist nur dazu da, dass Daten, die im Cache des Controllers liegen, bei einem Stromausfall zwischen zu speichern, damit diese nach der Wiederherstellung auf die Festplatte geschrieben werden können.
Der Cache hält die Daten im Normalbetrieb aber nur so lange, bis die Festplatten diese geschrieben haben. Damit soll einfach nur das Geschwindigkeitsdefizit ausgeglichen werden.
Wenn das System und damit der Controller sauber heruntergefahren wird, wird beim Herunterfahren dafür Sorge getragen, dass die Daten vor dem Abschalten alle aus dem Cache auf die Festplatten geschrieben wurden.
Schau mal in die Anleitung des Servers und des Controllers, einige Komponenten werden als Hotplug-fähig markiert, dann kannst du die auch im laufenden Betrieb wechseln. Einige Hersteller machen dieses über unterschiedliche Farben.
Je nach Server kann man selbst CPU und RAM im laufenden Betrieb wechseln.
PS: Die BBU ist bei fast jedem Controller optional. Sie ist bei aktiviertem Cache dringend empfohlen, aber auch da nicht nötig, da eine USV vor dem Server effektiv das gleiche bewirkt.
Der Cache hält die Daten im Normalbetrieb aber nur so lange, bis die Festplatten diese geschrieben haben. Damit soll einfach nur das Geschwindigkeitsdefizit ausgeglichen werden.
Wenn das System und damit der Controller sauber heruntergefahren wird, wird beim Herunterfahren dafür Sorge getragen, dass die Daten vor dem Abschalten alle aus dem Cache auf die Festplatten geschrieben wurden.
Schau mal in die Anleitung des Servers und des Controllers, einige Komponenten werden als Hotplug-fähig markiert, dann kannst du die auch im laufenden Betrieb wechseln. Einige Hersteller machen dieses über unterschiedliche Farben.
Je nach Server kann man selbst CPU und RAM im laufenden Betrieb wechseln.
PS: Die BBU ist bei fast jedem Controller optional. Sie ist bei aktiviertem Cache dringend empfohlen, aber auch da nicht nötig, da eine USV vor dem Server effektiv das gleiche bewirkt.
Moin,
Wir Vision2015 schon schrieb.
Fahre alles sauber herunter. Die Bibi dient tatsächlich nur dazu, die Daten, die im Cache liegen, bei einer (kurzen) Stromunterbrechung, nicht verloren gehen zu lassen.
Die RaidConfig selbst wird im ROM/ persistenten Speicher des Controllers UND bei den meisten Controllern auch zusätzlich auf den Platten geschrieben. Dadurch ist gewährleistet, dass beim Tausch des Controllers das RAID intakt bleibt (sofern nicht gleichzeitig alle Platten durchgetauscht werden).
Würde die BBU den Erhalt der Config verantworten zu haben, wäre bei (geplanten) längeren Stromunterbrechungen ja ein heilloses Chaos da…
Wir Vision2015 schon schrieb.
Fahre alles sauber herunter. Die Bibi dient tatsächlich nur dazu, die Daten, die im Cache liegen, bei einer (kurzen) Stromunterbrechung, nicht verloren gehen zu lassen.
Die RaidConfig selbst wird im ROM/ persistenten Speicher des Controllers UND bei den meisten Controllern auch zusätzlich auf den Platten geschrieben. Dadurch ist gewährleistet, dass beim Tausch des Controllers das RAID intakt bleibt (sofern nicht gleichzeitig alle Platten durchgetauscht werden).
Würde die BBU den Erhalt der Config verantworten zu haben, wäre bei (geplanten) längeren Stromunterbrechungen ja ein heilloses Chaos da…
Zitat von @joh316:
...Offenbar kommt es daher, dass die Battery Backup Unit des RAID Controllers tot ist und damit ein Write-Through stattfindet...
Das kann gut sein. Viele Controller erlauben die Nutzung des Caches für Schreiboperationen nur wenn man eine BBU hat. Wenn der Controller der Meinung ist, dass Deine BBU nicht mehr funktioniert wechselt er den Cache zu Nur-Lese-Modus....Offenbar kommt es daher, dass die Battery Backup Unit des RAID Controllers tot ist und damit ein Write-Through stattfindet...
Hinweis: Eine BBU besteht aus 2 Componenten. Einmal dem Cachemodus und einmal einem Akku.
Häufig ist das eine Einheit. Bei Fujitsu konnte/musste man das früher seperat bestellen. Heute sind das meist Flash-Module.
Sonst wie besprochen.
Sauber runterfahren, alte BBU ab, neue BBU dran und fertig.
Stefan
Zitat von @joh316:
Normalerweise würde ich einen Server ja immer stromlos machen, wenn ich ihn öffne, aber in diesem Fall bin ich mir nicht sicher, ob das klug ist. Wenn die BBU bzw. Der Akku tot ist, dann kommt doch die Stromversorgung für das Verfügbar halten der Controller-Konfiguration über die Stromversorgung des Servers, oder?
Normalerweise würde ich einen Server ja immer stromlos machen, wenn ich ihn öffne, aber in diesem Fall bin ich mir nicht sicher, ob das klug ist. Wenn die BBU bzw. Der Akku tot ist, dann kommt doch die Stromversorgung für das Verfügbar halten der Controller-Konfiguration über die Stromversorgung des Servers, oder?
Moin,
Nein, die BBU ist nur für den Cache zuständig. Die Raid-Konfiguration steht i.d.R. im nichtflüchtigen Speicher.
Außerdem hast Du ja ein Backup.
lks
Backup, was ist Backup?
Das ist doch Neuland, oder so....
Gruss Penny.
Das ist doch Neuland, oder so....
Gruss Penny.