jojo0411
Goto Top

Backup Konzept - Wahrscheinlichkeit für Serverausfall

Hallo Leute,

Kennt ihr eine Quelle oder eine Untersuchung für die Wahrscheinlichkeit eines Server ausfalls?

Die Standard Frage meiner Kunden ist bei jeder Risiko Analyse: Wie wahrscheinlich ist es das ein Server, Switch etc. ausfällt?

Über Google habe ich nichts brauchbares gefunden... wie geht ihr damit um?

nice greetz jojo

Content-ID: 186482

Url: https://administrator.de/contentid/186482

Ausgedruckt am: 22.11.2024 um 07:11 Uhr

BekkZter
BekkZter 14.06.2012 um 12:46:18 Uhr
Goto Top
Moin

Und was würde das im Zweifelsfalle bringen ... !?
Statisktiken sind doch nur "Zahlen" ...

Angenommen die Warscheinlichkeit wäre 95 % das nix passiert und der Switch kackt ab ...
Was kann man sich denn dafür kaufen, wenn man nicht zu den glücklichen 5 % gehört !?

Ich finde man sollte an Ausfallsicherheit nicht sparen und immer einen "Notfallplan" im Schrank haben.

Du könntest aber als Argumentation die Kosten versuchen aufzuführen, was ein Stillstand des Netzwerkes, am Tag, für das
Unternehmen kosten würde. Mache Geldgeber werden dannach meißt sehr nachdenklich.

Wir hatten bei uns auch mal ausgerechnet, wenn unser SAP 3 Tag stillstehen würde, wäre das Unternehmen pleite !


Gruß
Edi.Pfisterer
Edi.Pfisterer 14.06.2012 um 13:35:16 Uhr
Goto Top
Hallo!
Wie BekkZter richtig geschrieben hat:

Auf die Frage der Wahrscheinlichkeit kontert man am Besten mit der Gegenfrage, welche Probleme für den Kunden damit verbunden sind, wenn

a) seine Infrastruktur für die Zeit xy ausfällt (die davon abhängt, wie lange es dauert, das System wieder herzustellen bzw. Ersatzteile zu besorgen)

b) er seine Daten (oder Teile davon) verliert

Es ist ja auch tatsächlich denkbar, dass ein Datenverlust / Stillstand der Infrastruktur kein großes Problem darstellt...

btw würde ich empfehlen, solche Dinge zu verschriftlichen, damit Du bei einem Desaster dem Kunden vorlegen kannst, dass Du ihn auf das Risiko hingewiesen hast...
(im Problemfall wird gerne vergessen, dass anno dazumal ein vernünftiges Backupmanagement bzw. Redundanz empfohlen wurde - und dass diese aus Konstengründen abgelehnt wurde...
warum? weil im Fall eines Desasters die Aufwändungen für ein NAS / ein redundantes Netz / vernünftige Netzwerkkomponenten / eine USV / ordentliche Server mit Hotspare, etc... sogar dem Kunden lächerlich erscheinen.... und dann kann er sich natürlich nicht vorstellen, dass er darauf wegen der "paar Kröten" verzichtet hat...)

lg
brammer
brammer 14.06.2012 um 13:36:14 Uhr
Goto Top
Hallo,

rein theoretische Frage...

Das ist bei jeder Maschine anders.

Wenn du anstelle von Wahrscheinnlichkeiten mit MTBF argumentierst und das ganze ein bisschen mit Murphys Law und ein paar Gruselgeschichten beim verkaufen anbringst wird es vielleicht einfacher..

brammer
catachan
catachan 14.06.2012 um 13:52:21 Uhr
Goto Top
Hi

zwar etwas theoretisch, aber vielleicht gibt dir das einen Anstoß
www.it-audit.de/assets/artikel/iec/Vorgehensmodell-Risikoanalyse.pdf

LG
StefanKittel
StefanKittel 14.06.2012 um 14:02:22 Uhr
Goto Top
Hallo,

wie die Anderen schon geschrieben haben ist diese Frage nur dann relevant um die Menge kalkulieren zu können.
Also wenn der Kunde 50 Switch im Einsatz hat, wieviele sollte man vorhalten.

Sonst gilt primär die Frage was für ein Schaden entstehen könnte (Reparatur, Ausfallzeiten, Produkteionsausfall) und was man vorbeigend dagegen tun kann zu welchen Kosten.

Stefan
DerWoWusste
DerWoWusste 14.06.2012 um 14:11:13 Uhr
Goto Top
Hi.

Du kannst für jedes Bauteil eine MBTF angeben, aber für "Server" als Ganzes? Das müsste sich dann aus der Verkettung der MBTF der Einzelteile ergeben. Somit ist die Frage maximal dann sinnvoll, wenn immer von gleichen Servermodellen die Rede ist.

Auch ist doch ganz klar, dass dies eigentlich nicht interessiert, sondern vielmehr, wie lange ein Server maximal ausfallen darf und wie lange es maximal dauern wird, bis Ihr ihn mit Euren Möglichkeiten verlässlich ersetzt habt.
Penny.Cilin
Penny.Cilin 14.06.2012 um 15:18:17 Uhr
Goto Top
Auf Wikipedia gibt es einen Artikel welcher die Verfügbarkeitsberechnung beschreibt.

Wikipedia

Klar ist, je höher die Verfügbarkeit sein soll, desto höher sind die Kosten und zwar progressiv.

Wie schon mehrfach erwähnt sind die Fragen die man stellen muß:

Wie lange kann/darf ein System ausfallen?
Wie lange kann/darf ein Standort ausfallen/offline sein?

usw.

Anhand von diesen Entscheidungskriterien wählt man die Komponenten (Hardware, Leitungen, usw) aus.

Um es zu vereinfachen kann man das sogenannte 3 Klassensystem verwenden. Dazu teilt man die System in drei Kategorien ein: High, Medium, Low.

High: Kritische Systeme welche eine Redundanz benötigen (Bei Servern entspricht dies Clustersysteme)
Medium: Systeme, welche über einen per SLA definierten Zeitraum (z. B. 4 bis 8 Std) ausfallen können.
Low: Systeme, welche ggf. etwas länger ausfallen können (z. B. Testsysteme)
jojo0411
jojo0411 15.06.2012 um 09:42:20 Uhr
Goto Top
Hallo Leute,

Danke für die rege Diskussion. Natürlich habt ihr Recht mit allem was ihr sagt. Sehe ich genauso und das muss auch die Basis sein.

Ich denke es wäre nur interessant zu wissen was eben die MTBF eines Systems ist. Zum Beispiel sind in meiner bisherigen Laufbahn etliche Festplatten, Netzteile und Server eingegangen. Firewalls oder Switche dagegen sehr sehr selten.

Eben bei Netzteilen oder Festplatten wird dieser Wert ja auch angegeben. Aber bei Mainboards, Firewalls, Switches etc. habe ich das noch nicht gesehen.

Somit ist es klar das ich Festplatten und Netzteile bei Servern immer redundant auslege obwohl das natürlich mehr kostet, nur weil ich genau weiss das diese Komponenten mit einer hohen Wahrscheinlichkeit ausfallen können.

Aber nachdem keiner von euch eine solche Information hat, kann man davon ausgehen das es keine gibt. Ich denke die Hersteller lassen sich mit solchen Auswertungen wahrscheinlich auch nicht aus dem Fenster.

Danke auf jeden Fall für eure Infos.

nice greetz jojo
Edi.Pfisterer
Edi.Pfisterer 15.06.2012 um 10:08:22 Uhr
Goto Top
Aber bei Mainboards, Firewalls, Switches etc. habe ich das noch nicht gesehen

Hier wäre eine Auflistung zu finden - zumindest für Cisco Catalyst:

http://www.cisco.com/en/US/prod/collateral/switches/ps5718/ps5023/produ ...

Was ich - und die meinsten anderen - sagen wollten ist, dass Dir diese Angaben nichts helfen.

Als Vergleich:
Die Wahrscheinlichkeit, dass eine 25jährige Frau ein Kind gebärt,das an Trisomie 21 erkrankt ist, liegt bei 0,1 %. Das klingt nun recht wenig, wird den betroffenen aber kaum helfen.

Statistiken sind Schall und Rauch - und das wurde bereits in der erste Antwort von BekkZter erwähnt.

lg