alexdroid
Goto Top

Ultrahohe Verfügbarkeit eines IT-Systems

Ich soll mich über die ultrahohe Verfügbarkeit eines IT-Systems informieren

In meiner Firma behandeln wir gerade das Thema Ultrahohe Verfügbarkeit.
Bis jetzt habe ich folgende Punkte ausgearbeitet, denke jedoch das es nicht alles sein kann und bitte deshalb hier um Unterstützung...


Support:

-Schnelles Fachpersonal
-Hohe Ersatzteilverfügbarkeit
-Vorbeugende Wartungen
-Qualifizierte Fehlermeldungs- und schnelle Kommunikationssysteme (eigenständige Fehlermeldung an den Hersteller mit aussagekräftiger Fehlermeldung)
-Antiviren Software ( Schutz gegen Viren usw.)
-Firewall-Lösungen ( Schutz gegen Eindringen von außen)

Komponenten:

-USV / UPS
-->Absicherung bei Verlust der Netzspannung
-Redundante Komponenten
-->Doppelte Netzteile/Festplatten/Netzwerkkarten/Server/Router/Switches
-Cluster
-Raidsysteme
-ECC-Speicher (Speicher mit Fehlerkorrektur)

Wenn euch noch relevante Punkte einfallen, welche man noch berücksichtigen sollte, schreibt sie bitte in diesen Thread..

Vielen Dank im Voraus

alex-1337

Content-ID: 180279

Url: https://administrator.de/contentid/180279

Printed on: November 5, 2024 at 16:11 o'clock

clSchak
clSchak Feb 09, 2012 at 09:08:29 (UTC)
Goto Top
Hi

- 2 Rechnezentren in zwei Brandabschnitten -> noch besser: 2 andere Orte
- USV ->> Notstromaggregate als Erweiterung
- Brandmeldesystem
- Einbruchmeldeanlagen
- Schutz EMV/EMP
- Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)



man kann das bis ins unendliche weiterführen, das BSI hat da Dokumente zu wie man das Risiko einschätzen kann und was man dagegen machen könnte
alexdroid
alexdroid Feb 09, 2012 at 09:18:45 (UTC)
Goto Top
danke für die schnelle antwort. Gute Aspekte die du da ansprichst.
sind notiert. gibts es noch mehr?
djfflow
djfflow Feb 09, 2012 at 09:33:54 (UTC)
Goto Top
Hallo,

folgende Themen kann ich noch anbieten:

- Backup
- Schutz vor physikalischem Eindringen (Zugangskontrolle/Videoüberwachung)
- Schutz des Netzwerks vor Eindringlingen von innen
Haumiblau
Haumiblau Feb 09, 2012 at 09:44:01 (UTC)
Goto Top
Hallo,

Ja da gibt es noch mehr, dein Storage sollte auf jeden Fall auch redundant sein, also nicht nur auf eine SAN verlassen, sonst hast Du dort einen Single Point of Failure.
Auch solltest Du dir Gedanken machen, was passiert wenn einer der Server ausfällt. Wie schnell muss ein anderer dann dessen Aufgaben übernehmen und hat er dann auch genügend Resourcen um die Aufgaben beider Server auszuführen (Stichwort: VMWare Version).

Was die Ersatzteilverfügbarkeit angeht, so bietet dir fast jeder namhafte Hersteller inzwischen eine Wiederherstellungsgarantie innerhalb von einem bestimmten Zeitraum an. Welchen Du dir dann aussuchst hängt dann ganz von Deinen Anforderungen ab (wir haben von Fujitsu eine Wiederherstellungsgarantie innerhalb von 4 Stunden für die Dauer von 5 Jahren gekauft).

Grüße
-s-v-o-
-s-v-o- Feb 09, 2012 at 09:50:27 (UTC)
Goto Top
Tach auch

Was mir spontan noch einfällt wäre:

- CO² Löschanlge (aber danach würde ich ohne PA nicht in den Raum face-wink
- Hard-Software überwachung z.Bs. System Center oder MOM (nicht nur Hardware - wenn die Software probleme macht bringt das den Usern auch nichts)
- Schutz von außen kommt noch ein Mailgatewy + Proxy dazu die auf Viren prüfen. - Astaro all-in-one
- redundante Kühlung

Ergänzung zu - Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)
Bringt auch nur was wenn die Leitungen auch an andere Knoten des Anbieters laufen.
Wäre überflüssig wenn nach 100m die Kabel wieder zusammen an einen Knoten verlaufen.

Ich denke das kann man bis in das unendliche treiben. Schlussendlich ist es nur noch eine kostensache.

Mfg
-s-v-o-
brammer
brammer Feb 09, 2012 at 09:55:06 (UTC)
Goto Top
Hallo,

wo setzt ihr den "Ultrahoch" an?
Welche Prozentzahl schwebt euch denn davor?

brammer
alexdroid
alexdroid Feb 09, 2012 at 10:11:52 (UTC)
Goto Top
Zitat von @-s-v-o-:
Ergänzung zu - Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)
Bringt auch nur was wenn die Leitungen auch an andere Knoten des Anbieters laufen.
Wäre überflüssig wenn nach 100m die Kabel wieder zusammen an einen Knoten verlaufen.

Ich denke das kann man bis in das unendliche treiben. Schlussendlich ist es nur noch eine kostensache.

Mfg
-s-v-o-

danke für die nachricht. ich denke die nord und süd konstruktion ist sinnvoll, denn wenn auf dem Hof iwelche Bauarbeiten durchgeführt werden kann es vorkommen, dass unvosichtige Baggerfahrer schonmal die Leitung kappen. kein scherz ist hier schon passiert...
60730
60730 Feb 09, 2012 at 10:18:40 (UTC)
Goto Top
moinsen
Zitat von @brammer:
Hallo,

wo setzt ihr den "Ultrahoch" an?
Welche Prozentzahl schwebt euch denn davor?

brammer

Eben und als Zusatzfrage:
Welches Budget?

Denn das, was da oben (in der Frage) genannt ist, ist IMHO die minimalste Nummer, die man macht und nicht viel mehr.
Ich vermisse z.B die doppelte USV, denn einen Server mit 2 Netzteilen an einer USV anzuschliessen ist nix
SlainteMhath
SlainteMhath Feb 09, 2012 at 10:30:34 (UTC)
Goto Top
Moin,

uiui, hier ist ganz schön der Themenquirl am Werk face-smile

Hochverfügbarkeit hat *NICHTS* mit Backup, Wartungsverträgen usw zu tun - siehe http://de.wikipedia.org/wiki/Hochverf%C3%BCgbarkeit - sondern es geht rein um die Vermeidung von Single Point Of Failures.

Bei den Üblichen Verfügbarkeitsklassen:
99,9 % ≡ 43:48 min/Monat oder 8:45:58 Stunden/Jahr.
99,99 % ≡ 4:23 Minuten/Monat oder 52:36 Minuten/Jahr
99,999 % ≡ 26,3 Sekunden/Monat oder 5:16 Minuten/Jahr
99,9999 % ≡ 2,63 Sekunden/Monat oder 31,6 Sekunden/Jahr

Brauchst du nicht mit Backup oder 4h Servicevertägen anrücken face-smile

Natürlich muss zusätzlich zur Hochverfügbarkeit auch die Betriebssicherheit (Backup, Service/Supportverträge, Zugangs- und Brandschutz usw) sichergestellt sein.

lg,
Slainte
alexdroid
alexdroid Feb 09, 2012 at 10:42:20 (UTC)
Goto Top
Zitat von @60730:
moinsen
> Zitat von @brammer:
> ----
> Hallo,
>
> wo setzt ihr den "Ultrahoch" an?
> Welche Prozentzahl schwebt euch denn davor?
>
> brammer

Eben und als Zusatzfrage:
Welches Budget?

Denn das, was da oben (in der Frage) genannt ist, ist IMHO die minimalste Nummer, die man macht und nicht viel mehr.
Ich vermisse z.B die doppelte USV, denn einen Server mit 2 Netzteilen an einer USV anzuschliessen ist nix



hallo timobeil,
es soll hier erstmal nicht ums Geld gehen.
Die frage soll sein was gibt es für möglichkeiten um das System so hochverfügbar wie möglich zu machen.

Die Geldfrage wird erst im Anschluss besprochen..
danke trotzdem
brammer
brammer Feb 09, 2012 at 10:49:25 (UTC)
Goto Top
Hallo,

nun so langsam kommen wir doch in konkrete Gefilde....

Mit 99,99 %, also unter einer Stunde Ausfall pro Jahr kann man von Hochverfügbar reden...
Obwohl, mathematisch ja sch mehr als 50 % Hochverfügbar sind.

Oder sind die Ziele noch höher gesteckt.
Dazu gab es mal eine nette Aussage eines Vertrieblers, jede 9 hinter dem Komma kostet das doppelte....

Ich glaube zuerst muss der TO noch mal in sich gehen und Daten sammeln was er den möchte.

brammer
SlainteMhath
SlainteMhath Feb 09, 2012 at 10:51:55 (UTC)
Goto Top
"Ultrahoch" würde ich persönlich mit 4-5 9ern hinter dem Komma assozieren face-smile
alexdroid
alexdroid Feb 09, 2012 at 10:59:27 (UTC)
Goto Top
irgendwie macht mich diese ganze sache sehr skeptisch...wie soll man folgendes denn erreichen können?

99,999 % ≡ 26,3 Sekunden/Monat oder 5:16 Minuten/Jahr
99,9999 % ≡ 2,63 Sekunden/Monat oder 31,6 Sekunden/Jahr

wenn der server ein Update haben muss dauert das sicher länger als 31,6 sec. für das eine Update inkl. neustart..
und die Prozentzahlen sind dann noch auf das ganze System bezogen, in dem sicherlich mehr als ein Server vorhanden ist...
wie soll sowas realisiert werden?
brammer
brammer Feb 09, 2012 at 11:13:21 (UTC)
Goto Top
Hallo,

ein Neustart wegen UPdate ist doch kein Problem.
Du hast deswegenja 2 redundant laufende Server.
Wenn du beide Server parallel neustartest, dann hast du ein Problem...

brammer
60730
60730 Feb 09, 2012 at 11:23:35 (UTC)
Goto Top
Zitat von @alexdroid:
hallo timobeil,
es soll hier erstmal nicht ums Geld gehen.
Die frage soll sein was gibt es für möglichkeiten um das System so hochverfügbar wie möglich zu machen.

Die Geldfrage wird erst im Anschluss besprochen..
danke trotzdem
Zitat von @alexdroid:
irgendwie macht mich diese ganze sache sehr skeptisch...wie soll man folgendes denn erreichen können?


und mich auch...

Angenommen, die Firma hat normale Arbeitszeiten, ohne durchgehenden Schichtbetrieb und mit Feiertagen
Und eine Stunde ausfall im Monat geht "unter", dann macht es überhaupt keinen Sinn irgendwas zu planen, wo die Ausfallszeiten < 1 Stunde/Monat ist.

Zuerst recherchieren, dann planen.
wie soll sowas realisiert werden?
ganz einfach redundante Systeme und Testsysteme, bei denen man überprüft, ob die Updates laufen oder Probleme verursachen.....

Mir scheint "wir" reden von Profi zu Azubi?

Wo soll die Reise hingehen?
edit
Da das Wort Ultra aus 5 Buchstaben besteht, vermute ich auch 5 Stellen hinterm Komma und das passt nun wirklich nicht mit den Antworten des Fragestellers zusammen.
Ich bin draussen und hab mich mit einem face-sad verewigt.
/edit
-s-v-o-
-s-v-o- Feb 09, 2012 at 11:24:30 (UTC)
Goto Top
Tach auch


danke für die nachricht. ich denke die nord und süd konstruktion ist sinnvoll, denn wenn auf dem Hof iwelche Bauarbeiten
durchgeführt werden kann es vorkommen, dass unvosichtige Baggerfahrer schonmal die Leitung kappen. kein scherz ist hier schon
passiert...

Ich kenne zwar eure Umgebung nicht aber ich denke das die wenigsten Meter bei euch auf dem Grundstück verlaufen. Lass mal ein Baggerfahrer fröhlich außerhalb rum Baggern
und erweischen gleichzeitig beide Kabel. Dann bringt Nor/Süd auch nichts. Bis dann ein Techniker Vor-Ort ist dauert dies schon ein paar Stunden/Tage.
Solche Ausfälle deckt normalerweise ein Vertrag nicht ab, oder????
Zudem lass mal ein Problem am Knoten sein (defkt router, Brand, Stromausfall, Wasserschaden,.....)
Wenn ihr nur bei euch auf dem Hof trennt aber beide Kabel an einem Knoten hängen haste auch wieder einen kompletten Ausfall der Leitung.

Mf
-s-v-o-
SlainteMhath
SlainteMhath Feb 09, 2012 at 12:14:40 (UTC)
Goto Top
Zitat von @alexdroid:
wenn der server ein Update haben muss dauert das sicher länger als 31,6 sec. für das eine Update inkl. neustart..
und die Prozentzahlen sind dann noch auf das ganze System bezogen, in dem sicherlich mehr als ein Server vorhanden ist...
wie soll sowas realisiert werden?
Mir scheint ihr seid euch überhaupt nicht im Klaren was "Ultrahochverfügbarkeit" überhaupt bedeutet. Besorgt euch ein bischen Literatur, arbeitet sie durch und stellt dann nochmal ein paar Fragen face-smile

@Timo
Mir scheint "wir" reden von Profi zu Azubi?
YMMD face-smile

Ich bin draussen
ditto.
alexdroid
alexdroid Feb 09, 2012 at 12:39:17 (UTC)
Goto Top
Zitat von @-s-v-o-:
Tach auch


> danke für die nachricht. ich denke die nord und süd konstruktion ist sinnvoll, denn wenn auf dem Hof iwelche
Bauarbeiten
> durchgeführt werden kann es vorkommen, dass unvosichtige Baggerfahrer schonmal die Leitung kappen. kein scherz ist hier
schon
> passiert...

Ich kenne zwar eure Umgebung nicht aber ich denke das die wenigsten Meter bei euch auf dem Grundstück verlaufen. Lass mal ein
Baggerfahrer fröhlich außerhalb rum Baggern
und erweischen gleichzeitig beide Kabel. Dann bringt Nor/Süd auch nichts. Bis dann ein Techniker Vor-Ort ist dauert dies
schon ein paar Stunden/Tage.
Solche Ausfälle deckt normalerweise ein Vertrag nicht ab, oder????
Zudem lass mal ein Problem am Knoten sein (defkt router, Brand, Stromausfall, Wasserschaden,.....)
Wenn ihr nur bei euch auf dem Hof trennt aber beide Kabel an einem Knoten hängen haste auch wieder einen kompletten Ausfall
der Leitung.

Mf
-s-v-o-

Bei uns müssen auch solche Ausfälle innerhalb von 4 Stunden erledigt sein. Ist vertraglich abgesichert da es eine CompanyConnect-Leitung ist
alexdroid
alexdroid Feb 09, 2012 at 12:58:04 (UTC)
Goto Top
nein kein azubi...
Sorry wenn dir meine Fragestellung nicht anspruchsvoll genug war...
Ich bin jetzt aber auch nicht in einem riesigen Unternehmen, in dem redundante Serversysteme laufen, und erstrecht nicht im hot-standby.
Ich habe dir Frage ja extra deswegen gestellt, damit ich mit dem Thema näher beschäftigen kann
ihr habt mich ein wenig weiter gebracht. danke dafür face-smile
schlimm man darf nicht mal mehr was nachfragen ohne als *** abgestempelt zu werden...
Solarius
Solarius Feb 09, 2012 at 15:01:46 (UTC)
Goto Top
Auch Tach,

auch die 4 Stunden CompanyConnect könnt Ihr euch abschminken.
Wenn da eine Knotenvermittlungsstelle einen Total-Crash (abgesoffen durch Dacheinbruch bei Tauwetter) hat - gab es in einem Schwesterunternehmen von uns im Januar 2011 - geht da 5 Tage gar nix. Und die Verträge sind dann so, dass Ihr einen konkreten Schaden nachweisen müsst.
Jetzt weiß mir mal eine nach wie viele Aufträge Ihr nicht bekommen habt, weil eure IT von außen nicht erreichbar war und was daraus für ein Schaden entstanden ist.

Alles Theoretiker hier. tztztztztz.

Schönen Tag noch

Solarius
clSchak
clSchak Feb 11, 2012 at 12:45:50 (UTC)
Goto Top
wir haben es bei uns so gelöst das wir die Abteilungen befragt haben wie lange diese ohne entsprechende Dienst (ERP, Mail, Telefon) auskommen und haben das dann als Maß der Verfügbarkeit genommen, was bringt dir eine Ausfallzeit weniger wie 1h die nur maßlos viel Geld kostet aber die "schnellste" Abteilung auch 4-5h ohne die Sachen auskommt.

Richtiges HA ist in meinen Augen nur Notwendig wenn da Menschenleben von abhängig sind, alles andere (die Börsenjuppies mal ausgenommen oder andere "Finanzexperten") kann in den meisten Fällen eine kleine "Auszeit" verkraften. unser Chef hat auch am Anfang rumgemosert wenn mal ein System 2h ausgefallen ist, nachdem wir aber konkrete Preise für eine HA Lösung hatten die max 1h Ausfallzeit hatte, waren 4h vollkommen in Ordnung (und der größte Ausfalll den wir bisher hatten war 23h und es war "nur" die Buchhaltung betroffen was zwar bescheiden ist - aber niemanden runiniert).

Was bei uns wichtige ist, ist eigentlich das wir absehen können wann es wieder läuft und eine passenden "Notfallplan" hat um ggf. Dienste anderwertig bereitzustellen, wenn auch mit einigen Einschränkungen.