Ultrahohe Verfügbarkeit eines IT-Systems
Ich soll mich über die ultrahohe Verfügbarkeit eines IT-Systems informieren
In meiner Firma behandeln wir gerade das Thema Ultrahohe Verfügbarkeit.
Bis jetzt habe ich folgende Punkte ausgearbeitet, denke jedoch das es nicht alles sein kann und bitte deshalb hier um Unterstützung...
Support:
-Schnelles Fachpersonal
-Hohe Ersatzteilverfügbarkeit
-Vorbeugende Wartungen
-Qualifizierte Fehlermeldungs- und schnelle Kommunikationssysteme (eigenständige Fehlermeldung an den Hersteller mit aussagekräftiger Fehlermeldung)
-Antiviren Software ( Schutz gegen Viren usw.)
-Firewall-Lösungen ( Schutz gegen Eindringen von außen)
Komponenten:
-USV / UPS
-->Absicherung bei Verlust der Netzspannung
-Redundante Komponenten
-->Doppelte Netzteile/Festplatten/Netzwerkkarten/Server/Router/Switches
-Cluster
-Raidsysteme
-ECC-Speicher (Speicher mit Fehlerkorrektur)
Wenn euch noch relevante Punkte einfallen, welche man noch berücksichtigen sollte, schreibt sie bitte in diesen Thread..
Vielen Dank im Voraus
alex-1337
In meiner Firma behandeln wir gerade das Thema Ultrahohe Verfügbarkeit.
Bis jetzt habe ich folgende Punkte ausgearbeitet, denke jedoch das es nicht alles sein kann und bitte deshalb hier um Unterstützung...
Support:
-Schnelles Fachpersonal
-Hohe Ersatzteilverfügbarkeit
-Vorbeugende Wartungen
-Qualifizierte Fehlermeldungs- und schnelle Kommunikationssysteme (eigenständige Fehlermeldung an den Hersteller mit aussagekräftiger Fehlermeldung)
-Antiviren Software ( Schutz gegen Viren usw.)
-Firewall-Lösungen ( Schutz gegen Eindringen von außen)
Komponenten:
-USV / UPS
-->Absicherung bei Verlust der Netzspannung
-Redundante Komponenten
-->Doppelte Netzteile/Festplatten/Netzwerkkarten/Server/Router/Switches
-Cluster
-Raidsysteme
-ECC-Speicher (Speicher mit Fehlerkorrektur)
Wenn euch noch relevante Punkte einfallen, welche man noch berücksichtigen sollte, schreibt sie bitte in diesen Thread..
Vielen Dank im Voraus
alex-1337
Please also mark the comments that contributed to the solution of the article
Content-ID: 180279
Url: https://administrator.de/contentid/180279
Printed on: November 5, 2024 at 16:11 o'clock
21 Comments
Latest comment
Hi
- 2 Rechnezentren in zwei Brandabschnitten -> noch besser: 2 andere Orte
- USV ->> Notstromaggregate als Erweiterung
- Brandmeldesystem
- Einbruchmeldeanlagen
- Schutz EMV/EMP
- Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)
man kann das bis ins unendliche weiterführen, das BSI hat da Dokumente zu wie man das Risiko einschätzen kann und was man dagegen machen könnte
- 2 Rechnezentren in zwei Brandabschnitten -> noch besser: 2 andere Orte
- USV ->> Notstromaggregate als Erweiterung
- Brandmeldesystem
- Einbruchmeldeanlagen
- Schutz EMV/EMP
- Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)
man kann das bis ins unendliche weiterführen, das BSI hat da Dokumente zu wie man das Risiko einschätzen kann und was man dagegen machen könnte
Hallo,
Ja da gibt es noch mehr, dein Storage sollte auf jeden Fall auch redundant sein, also nicht nur auf eine SAN verlassen, sonst hast Du dort einen Single Point of Failure.
Auch solltest Du dir Gedanken machen, was passiert wenn einer der Server ausfällt. Wie schnell muss ein anderer dann dessen Aufgaben übernehmen und hat er dann auch genügend Resourcen um die Aufgaben beider Server auszuführen (Stichwort: VMWare Version).
Was die Ersatzteilverfügbarkeit angeht, so bietet dir fast jeder namhafte Hersteller inzwischen eine Wiederherstellungsgarantie innerhalb von einem bestimmten Zeitraum an. Welchen Du dir dann aussuchst hängt dann ganz von Deinen Anforderungen ab (wir haben von Fujitsu eine Wiederherstellungsgarantie innerhalb von 4 Stunden für die Dauer von 5 Jahren gekauft).
Grüße
Ja da gibt es noch mehr, dein Storage sollte auf jeden Fall auch redundant sein, also nicht nur auf eine SAN verlassen, sonst hast Du dort einen Single Point of Failure.
Auch solltest Du dir Gedanken machen, was passiert wenn einer der Server ausfällt. Wie schnell muss ein anderer dann dessen Aufgaben übernehmen und hat er dann auch genügend Resourcen um die Aufgaben beider Server auszuführen (Stichwort: VMWare Version).
Was die Ersatzteilverfügbarkeit angeht, so bietet dir fast jeder namhafte Hersteller inzwischen eine Wiederherstellungsgarantie innerhalb von einem bestimmten Zeitraum an. Welchen Du dir dann aussuchst hängt dann ganz von Deinen Anforderungen ab (wir haben von Fujitsu eine Wiederherstellungsgarantie innerhalb von 4 Stunden für die Dauer von 5 Jahren gekauft).
Grüße
Tach auch
Was mir spontan noch einfällt wäre:
- CO² Löschanlge (aber danach würde ich ohne PA nicht in den Raum
- Hard-Software überwachung z.Bs. System Center oder MOM (nicht nur Hardware - wenn die Software probleme macht bringt das den Usern auch nichts)
- Schutz von außen kommt noch ein Mailgatewy + Proxy dazu die auf Viren prüfen. - Astaro all-in-one
- redundante Kühlung
Ergänzung zu - Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)
Bringt auch nur was wenn die Leitungen auch an andere Knoten des Anbieters laufen.
Wäre überflüssig wenn nach 100m die Kabel wieder zusammen an einen Knoten verlaufen.
Ich denke das kann man bis in das unendliche treiben. Schlussendlich ist es nur noch eine kostensache.
Mfg
-s-v-o-
Was mir spontan noch einfällt wäre:
- CO² Löschanlge (aber danach würde ich ohne PA nicht in den Raum
- Hard-Software überwachung z.Bs. System Center oder MOM (nicht nur Hardware - wenn die Software probleme macht bringt das den Usern auch nichts)
- Schutz von außen kommt noch ein Mailgatewy + Proxy dazu die auf Viren prüfen. - Astaro all-in-one
- redundante Kühlung
Ergänzung zu - Redudante Internetanbindung (Zuleitung von Nord UND Süd z.B.)
Bringt auch nur was wenn die Leitungen auch an andere Knoten des Anbieters laufen.
Wäre überflüssig wenn nach 100m die Kabel wieder zusammen an einen Knoten verlaufen.
Ich denke das kann man bis in das unendliche treiben. Schlussendlich ist es nur noch eine kostensache.
Mfg
-s-v-o-
moinsen
Eben und als Zusatzfrage:
Welches Budget?
Denn das, was da oben (in der Frage) genannt ist, ist IMHO die minimalste Nummer, die man macht und nicht viel mehr.
Ich vermisse z.B die doppelte USV, denn einen Server mit 2 Netzteilen an einer USV anzuschliessen ist nix
Zitat von @brammer:
Hallo,
wo setzt ihr den "Ultrahoch" an?
Welche Prozentzahl schwebt euch denn davor?
brammer
Hallo,
wo setzt ihr den "Ultrahoch" an?
Welche Prozentzahl schwebt euch denn davor?
brammer
Eben und als Zusatzfrage:
Welches Budget?
Denn das, was da oben (in der Frage) genannt ist, ist IMHO die minimalste Nummer, die man macht und nicht viel mehr.
Ich vermisse z.B die doppelte USV, denn einen Server mit 2 Netzteilen an einer USV anzuschliessen ist nix
Moin,
uiui, hier ist ganz schön der Themenquirl am Werk
Hochverfügbarkeit hat *NICHTS* mit Backup, Wartungsverträgen usw zu tun - siehe http://de.wikipedia.org/wiki/Hochverf%C3%BCgbarkeit - sondern es geht rein um die Vermeidung von Single Point Of Failures.
Bei den Üblichen Verfügbarkeitsklassen:
99,9 % ≡ 43:48 min/Monat oder 8:45:58 Stunden/Jahr.
99,99 % ≡ 4:23 Minuten/Monat oder 52:36 Minuten/Jahr
99,999 % ≡ 26,3 Sekunden/Monat oder 5:16 Minuten/Jahr
99,9999 % ≡ 2,63 Sekunden/Monat oder 31,6 Sekunden/Jahr
Brauchst du nicht mit Backup oder 4h Servicevertägen anrücken
Natürlich muss zusätzlich zur Hochverfügbarkeit auch die Betriebssicherheit (Backup, Service/Supportverträge, Zugangs- und Brandschutz usw) sichergestellt sein.
lg,
Slainte
uiui, hier ist ganz schön der Themenquirl am Werk
Hochverfügbarkeit hat *NICHTS* mit Backup, Wartungsverträgen usw zu tun - siehe http://de.wikipedia.org/wiki/Hochverf%C3%BCgbarkeit - sondern es geht rein um die Vermeidung von Single Point Of Failures.
Bei den Üblichen Verfügbarkeitsklassen:
99,9 % ≡ 43:48 min/Monat oder 8:45:58 Stunden/Jahr.
99,99 % ≡ 4:23 Minuten/Monat oder 52:36 Minuten/Jahr
99,999 % ≡ 26,3 Sekunden/Monat oder 5:16 Minuten/Jahr
99,9999 % ≡ 2,63 Sekunden/Monat oder 31,6 Sekunden/Jahr
Brauchst du nicht mit Backup oder 4h Servicevertägen anrücken
Natürlich muss zusätzlich zur Hochverfügbarkeit auch die Betriebssicherheit (Backup, Service/Supportverträge, Zugangs- und Brandschutz usw) sichergestellt sein.
lg,
Slainte
Hallo,
nun so langsam kommen wir doch in konkrete Gefilde....
Mit 99,99 %, also unter einer Stunde Ausfall pro Jahr kann man von Hochverfügbar reden...
Obwohl, mathematisch ja sch mehr als 50 % Hochverfügbar sind.
Oder sind die Ziele noch höher gesteckt.
Dazu gab es mal eine nette Aussage eines Vertrieblers, jede 9 hinter dem Komma kostet das doppelte....
Ich glaube zuerst muss der TO noch mal in sich gehen und Daten sammeln was er den möchte.
brammer
nun so langsam kommen wir doch in konkrete Gefilde....
Mit 99,99 %, also unter einer Stunde Ausfall pro Jahr kann man von Hochverfügbar reden...
Obwohl, mathematisch ja sch mehr als 50 % Hochverfügbar sind.
Oder sind die Ziele noch höher gesteckt.
Dazu gab es mal eine nette Aussage eines Vertrieblers, jede 9 hinter dem Komma kostet das doppelte....
Ich glaube zuerst muss der TO noch mal in sich gehen und Daten sammeln was er den möchte.
brammer
Zitat von @alexdroid:
hallo timobeil,
es soll hier erstmal nicht ums Geld gehen.
Die frage soll sein was gibt es für möglichkeiten um das System so hochverfügbar wie möglich zu machen.
Die Geldfrage wird erst im Anschluss besprochen..
danke trotzdem
Zitat von @alexdroid:
irgendwie macht mich diese ganze sache sehr skeptisch...wie soll man folgendes denn erreichen können?
hallo timobeil,
es soll hier erstmal nicht ums Geld gehen.
Die frage soll sein was gibt es für möglichkeiten um das System so hochverfügbar wie möglich zu machen.
Die Geldfrage wird erst im Anschluss besprochen..
danke trotzdem
Zitat von @alexdroid:
irgendwie macht mich diese ganze sache sehr skeptisch...wie soll man folgendes denn erreichen können?
und mich auch...
Angenommen, die Firma hat normale Arbeitszeiten, ohne durchgehenden Schichtbetrieb und mit Feiertagen
Und eine Stunde ausfall im Monat geht "unter", dann macht es überhaupt keinen Sinn irgendwas zu planen, wo die Ausfallszeiten < 1 Stunde/Monat ist.
Zuerst recherchieren, dann planen.
wie soll sowas realisiert werden?
ganz einfach redundante Systeme und Testsysteme, bei denen man überprüft, ob die Updates laufen oder Probleme verursachen.....Mir scheint "wir" reden von Profi zu Azubi?
Wo soll die Reise hingehen?
edit
Da das Wort Ultra aus 5 Buchstaben besteht, vermute ich auch 5 Stellen hinterm Komma und das passt nun wirklich nicht mit den Antworten des Fragestellers zusammen.
Ich bin draussen und hab mich mit einem verewigt.
/edit
Tach auch
Ich kenne zwar eure Umgebung nicht aber ich denke das die wenigsten Meter bei euch auf dem Grundstück verlaufen. Lass mal ein Baggerfahrer fröhlich außerhalb rum Baggern
und erweischen gleichzeitig beide Kabel. Dann bringt Nor/Süd auch nichts. Bis dann ein Techniker Vor-Ort ist dauert dies schon ein paar Stunden/Tage.
Solche Ausfälle deckt normalerweise ein Vertrag nicht ab, oder????
Zudem lass mal ein Problem am Knoten sein (defkt router, Brand, Stromausfall, Wasserschaden,.....)
Wenn ihr nur bei euch auf dem Hof trennt aber beide Kabel an einem Knoten hängen haste auch wieder einen kompletten Ausfall der Leitung.
Mf
-s-v-o-
danke für die nachricht. ich denke die nord und süd konstruktion ist sinnvoll, denn wenn auf dem Hof iwelche Bauarbeiten
durchgeführt werden kann es vorkommen, dass unvosichtige Baggerfahrer schonmal die Leitung kappen. kein scherz ist hier schon
passiert...
durchgeführt werden kann es vorkommen, dass unvosichtige Baggerfahrer schonmal die Leitung kappen. kein scherz ist hier schon
passiert...
Ich kenne zwar eure Umgebung nicht aber ich denke das die wenigsten Meter bei euch auf dem Grundstück verlaufen. Lass mal ein Baggerfahrer fröhlich außerhalb rum Baggern
und erweischen gleichzeitig beide Kabel. Dann bringt Nor/Süd auch nichts. Bis dann ein Techniker Vor-Ort ist dauert dies schon ein paar Stunden/Tage.
Solche Ausfälle deckt normalerweise ein Vertrag nicht ab, oder????
Zudem lass mal ein Problem am Knoten sein (defkt router, Brand, Stromausfall, Wasserschaden,.....)
Wenn ihr nur bei euch auf dem Hof trennt aber beide Kabel an einem Knoten hängen haste auch wieder einen kompletten Ausfall der Leitung.
Mf
-s-v-o-
Zitat von @alexdroid:
wenn der server ein Update haben muss dauert das sicher länger als 31,6 sec. für das eine Update inkl. neustart..
und die Prozentzahlen sind dann noch auf das ganze System bezogen, in dem sicherlich mehr als ein Server vorhanden ist...
wie soll sowas realisiert werden?
Mir scheint ihr seid euch überhaupt nicht im Klaren was "Ultrahochverfügbarkeit" überhaupt bedeutet. Besorgt euch ein bischen Literatur, arbeitet sie durch und stellt dann nochmal ein paar Fragen wenn der server ein Update haben muss dauert das sicher länger als 31,6 sec. für das eine Update inkl. neustart..
und die Prozentzahlen sind dann noch auf das ganze System bezogen, in dem sicherlich mehr als ein Server vorhanden ist...
wie soll sowas realisiert werden?
@Timo
Mir scheint "wir" reden von Profi zu Azubi?
YMMD Ich bin draussen
ditto.
Auch Tach,
auch die 4 Stunden CompanyConnect könnt Ihr euch abschminken.
Wenn da eine Knotenvermittlungsstelle einen Total-Crash (abgesoffen durch Dacheinbruch bei Tauwetter) hat - gab es in einem Schwesterunternehmen von uns im Januar 2011 - geht da 5 Tage gar nix. Und die Verträge sind dann so, dass Ihr einen konkreten Schaden nachweisen müsst.
Jetzt weiß mir mal eine nach wie viele Aufträge Ihr nicht bekommen habt, weil eure IT von außen nicht erreichbar war und was daraus für ein Schaden entstanden ist.
Alles Theoretiker hier. tztztztztz.
Schönen Tag noch
Solarius
auch die 4 Stunden CompanyConnect könnt Ihr euch abschminken.
Wenn da eine Knotenvermittlungsstelle einen Total-Crash (abgesoffen durch Dacheinbruch bei Tauwetter) hat - gab es in einem Schwesterunternehmen von uns im Januar 2011 - geht da 5 Tage gar nix. Und die Verträge sind dann so, dass Ihr einen konkreten Schaden nachweisen müsst.
Jetzt weiß mir mal eine nach wie viele Aufträge Ihr nicht bekommen habt, weil eure IT von außen nicht erreichbar war und was daraus für ein Schaden entstanden ist.
Alles Theoretiker hier. tztztztztz.
Schönen Tag noch
Solarius
wir haben es bei uns so gelöst das wir die Abteilungen befragt haben wie lange diese ohne entsprechende Dienst (ERP, Mail, Telefon) auskommen und haben das dann als Maß der Verfügbarkeit genommen, was bringt dir eine Ausfallzeit weniger wie 1h die nur maßlos viel Geld kostet aber die "schnellste" Abteilung auch 4-5h ohne die Sachen auskommt.
Richtiges HA ist in meinen Augen nur Notwendig wenn da Menschenleben von abhängig sind, alles andere (die Börsenjuppies mal ausgenommen oder andere "Finanzexperten") kann in den meisten Fällen eine kleine "Auszeit" verkraften. unser Chef hat auch am Anfang rumgemosert wenn mal ein System 2h ausgefallen ist, nachdem wir aber konkrete Preise für eine HA Lösung hatten die max 1h Ausfallzeit hatte, waren 4h vollkommen in Ordnung (und der größte Ausfalll den wir bisher hatten war 23h und es war "nur" die Buchhaltung betroffen was zwar bescheiden ist - aber niemanden runiniert).
Was bei uns wichtige ist, ist eigentlich das wir absehen können wann es wieder läuft und eine passenden "Notfallplan" hat um ggf. Dienste anderwertig bereitzustellen, wenn auch mit einigen Einschränkungen.
Richtiges HA ist in meinen Augen nur Notwendig wenn da Menschenleben von abhängig sind, alles andere (die Börsenjuppies mal ausgenommen oder andere "Finanzexperten") kann in den meisten Fällen eine kleine "Auszeit" verkraften. unser Chef hat auch am Anfang rumgemosert wenn mal ein System 2h ausgefallen ist, nachdem wir aber konkrete Preise für eine HA Lösung hatten die max 1h Ausfallzeit hatte, waren 4h vollkommen in Ordnung (und der größte Ausfalll den wir bisher hatten war 23h und es war "nur" die Buchhaltung betroffen was zwar bescheiden ist - aber niemanden runiniert).
Was bei uns wichtige ist, ist eigentlich das wir absehen können wann es wieder läuft und eine passenden "Notfallplan" hat um ggf. Dienste anderwertig bereitzustellen, wenn auch mit einigen Einschränkungen.