Wartungsplan und Notfalllager
Hallo und guten Abend liebe Gemeinde,
ich bin neu hier und falls mein Beitrag an dieser Stelle falsch ist bitte ich ihn in den richtigen bereich zu verschieben.
Vielen Dank.
Ich habe einen neuen Job in der Systemverwaltung angefangen. Meine Aufgabe besteht nun darin einen EDV Wartungsplan und einen Plan für ein EDV Notfalllager zu erstellen.
Es ist so das wir mehrere Standorte haben und im "Normalfall" sämtliche Wartungen usw. von der Hauptstelle aus erledigen. Aber was muss/sollte ständig an den anderen Standorten vorrätig sein um im Notfall schnell handeln zu können (Vorgabe für das Notfalllager).
Für den EDV Wartungsplan habe ich keine vorgaben bekommen, ich hoffe ich kann hier auf Zahlreiche Tipps und Vorschläge hoffen.
Vielen Dank
Nordyeti
ich bin neu hier und falls mein Beitrag an dieser Stelle falsch ist bitte ich ihn in den richtigen bereich zu verschieben.
Vielen Dank.
Ich habe einen neuen Job in der Systemverwaltung angefangen. Meine Aufgabe besteht nun darin einen EDV Wartungsplan und einen Plan für ein EDV Notfalllager zu erstellen.
Es ist so das wir mehrere Standorte haben und im "Normalfall" sämtliche Wartungen usw. von der Hauptstelle aus erledigen. Aber was muss/sollte ständig an den anderen Standorten vorrätig sein um im Notfall schnell handeln zu können (Vorgabe für das Notfalllager).
Für den EDV Wartungsplan habe ich keine vorgaben bekommen, ich hoffe ich kann hier auf Zahlreiche Tipps und Vorschläge hoffen.
Vielen Dank
Nordyeti
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 131180
Url: https://administrator.de/contentid/131180
Ausgedruckt am: 25.11.2024 um 11:11 Uhr
5 Kommentare
Neuester Kommentar
Hallo,
Nee, was erwartest du für eine Antwort? Wir haben doch keine Ahnung, wie euer Business aussieht.
Was man gerne vergisst ist eine lokale Kopie der Dokumentation "liegt doch alles tagesaktuell auf dem zentralen Share" - schlecht nur, wenn man in der Doku nachlesen will, wie man das Netzwerk zu konfigurieren hat, um an den zentralen Share drannzukommen. Ähnliches gilt für Software (aktuelle OS-Images, Recovery-Client...). Wichtig ist auch, für alle Systeme (Server, Netzwerkkomponenten etc) Admin-Accounts bei der Hand zu haben. Und wenn die Domäne nicht mehr verfügbar ist sind Domänen-Accounts nicht ausreichend.
Gruß
Filipp
Aber was muss/sollte ständig an den anderen Standorten vorrätig sein um im Notfall schnell handeln zu
können
Das, was du im Notfall brauchst.können
Nee, was erwartest du für eine Antwort? Wir haben doch keine Ahnung, wie euer Business aussieht.
Was man gerne vergisst ist eine lokale Kopie der Dokumentation "liegt doch alles tagesaktuell auf dem zentralen Share" - schlecht nur, wenn man in der Doku nachlesen will, wie man das Netzwerk zu konfigurieren hat, um an den zentralen Share drannzukommen. Ähnliches gilt für Software (aktuelle OS-Images, Recovery-Client...). Wichtig ist auch, für alle Systeme (Server, Netzwerkkomponenten etc) Admin-Accounts bei der Hand zu haben. Und wenn die Domäne nicht mehr verfügbar ist sind Domänen-Accounts nicht ausreichend.
Gruß
Filipp
Moin,
also was wir versuchen (auch wenns nicht immer klappt): Immer mind. 1 kompletten PC/Arbeitsplatz (je nach größe auch 2) am Standort stehen haben - so das dieser im Notfall nur eben lokal vor Ort ausgetauscht wird.
Weiterhin haben wir vor Ort (zumindest in unserem grösseren Standort) eine Person die zwar kein EDV-Mensch ist - die aber uneingeschränkt Vertrauenswürdig ist und die daher das Admin-PW selbst für die Domäne kennt. Hintergrund ist ganz einfach - bei der Person wissen wir das die Anruft und fragt bevor die irgendwas versucht (und wenn keiner Erreichbar ist - pech, dann muss man warten). Und so können wir im Zweifelsfall per Telefon vieles erledigen. Und die Person fragt glücklicherweise erstmal nach - d.h. wenn ich sage "da kommt nen Feld da ist Ja/Nein" - und im Feld steht "OK/Abbrechen" - dann wird erstmal nachgefragt ob ich wirklich DAS Feld meine! Sofern du eine solche Person bekommst (selbst wenn du das Admin-PW in nem verschlossenen Briefumschlag hinterlegst und das nicht gleich bekannt gibst) dann ist das m.E. die BESTE Notfallplanung überhaupt. Denn: Egal wieviel Technik ich dir vor Ort hinstelle: Spätestens wenn die Reinigungskraft meint das man nen Rechner auch mal aus der Steckdose ziehen kann bzw. das Netzwerkkabel im Weg ist und man es deshalb aus der Dose zieht bringt dir das alles nichts. Denn dann musst du etwas physikalisch anfassen können - und da ist eine Person vor Ort der man die EDV ein wenig näher bringt dann einfach noch die beste Hilfe.
Der Rest kommt dann natürlich aufs vorhandene Geld und auf die gewünschte Sicherheit an. Hier kannst du natürlich neben der Spare-Platte auch noch für jeden Server ne Reserve-Platte vor Ort legen - bis hin zum reserve USV-Akku. Allerdings halte ich es für wichtiger hier nen guten Kontakt zum Lieferranten zu haben - das ist das beste Notfalllager überhaupt. Wir arbeiten aus genau dem Grund praktisch immer mit demselben Systemhaus zusammen - da ich weiss das ich dort auch mal anrufen kann wenns brennt und der Mann vom Systemhaus sich dreht um das nötige Teil zu beschaffen. Selbstverständlich muss man dafür auch mal bei den 08/15-Aufträgen (nen PC hier oder mal eben nen kleinen Drucker dort) auch akzeptieren das es ggf. mal 5 Euro mehr kostet -> irgendwie muss sich der Service ja auch finanzieren...
also was wir versuchen (auch wenns nicht immer klappt): Immer mind. 1 kompletten PC/Arbeitsplatz (je nach größe auch 2) am Standort stehen haben - so das dieser im Notfall nur eben lokal vor Ort ausgetauscht wird.
Weiterhin haben wir vor Ort (zumindest in unserem grösseren Standort) eine Person die zwar kein EDV-Mensch ist - die aber uneingeschränkt Vertrauenswürdig ist und die daher das Admin-PW selbst für die Domäne kennt. Hintergrund ist ganz einfach - bei der Person wissen wir das die Anruft und fragt bevor die irgendwas versucht (und wenn keiner Erreichbar ist - pech, dann muss man warten). Und so können wir im Zweifelsfall per Telefon vieles erledigen. Und die Person fragt glücklicherweise erstmal nach - d.h. wenn ich sage "da kommt nen Feld da ist Ja/Nein" - und im Feld steht "OK/Abbrechen" - dann wird erstmal nachgefragt ob ich wirklich DAS Feld meine! Sofern du eine solche Person bekommst (selbst wenn du das Admin-PW in nem verschlossenen Briefumschlag hinterlegst und das nicht gleich bekannt gibst) dann ist das m.E. die BESTE Notfallplanung überhaupt. Denn: Egal wieviel Technik ich dir vor Ort hinstelle: Spätestens wenn die Reinigungskraft meint das man nen Rechner auch mal aus der Steckdose ziehen kann bzw. das Netzwerkkabel im Weg ist und man es deshalb aus der Dose zieht bringt dir das alles nichts. Denn dann musst du etwas physikalisch anfassen können - und da ist eine Person vor Ort der man die EDV ein wenig näher bringt dann einfach noch die beste Hilfe.
Der Rest kommt dann natürlich aufs vorhandene Geld und auf die gewünschte Sicherheit an. Hier kannst du natürlich neben der Spare-Platte auch noch für jeden Server ne Reserve-Platte vor Ort legen - bis hin zum reserve USV-Akku. Allerdings halte ich es für wichtiger hier nen guten Kontakt zum Lieferranten zu haben - das ist das beste Notfalllager überhaupt. Wir arbeiten aus genau dem Grund praktisch immer mit demselben Systemhaus zusammen - da ich weiss das ich dort auch mal anrufen kann wenns brennt und der Mann vom Systemhaus sich dreht um das nötige Teil zu beschaffen. Selbstverständlich muss man dafür auch mal bei den 08/15-Aufträgen (nen PC hier oder mal eben nen kleinen Drucker dort) auch akzeptieren das es ggf. mal 5 Euro mehr kostet -> irgendwie muss sich der Service ja auch finanzieren...
Hi,
Ich schließe mich meinen Vorrednern mal auf jeden Fall an, will Dir aber noch einen kleinen Denkanstoß geben, mit dem ich mal angefangen habe:
Was kann kaputt gehen und was ist in dem Fall zu tun?
Alle Antworten auf diese Frage schreibst Du auf einen Zettel / in eine Tabelle (ich fange meist auf Papier an zu scribbeln) und die Antworten dazu. Eine gute Sache für sowas ist ein Mindmapping-Tool, entweder ein großes Plakat (DIN A 1 oder 0) oder zum Beispiel FreeMind, wenn Du nicht ohnehin schon ein vergleichbares Programm am Start hast. Wenn Du damit fertig bist, hast Du ein schönes, dickes Buch, was Dein Notfallkonzept ist. Ein Mini-Beispiel:
Internetzugang geht nicht.
ToDo: Bei wem, nur ein User oder eine bestimmte Gruppe oder ein Netzwerkzweig oder alle....? (Also Eingrenzung)
Antwort: Nur 1 User -> PC und Profil checken, Browser, DNS, Routen/Gateway, Cookies + temp. Internetfiles löschen, lokale Firewall usw...
Antwort: Eine bestimmte Gruppe: Was hat diese Gruppe gemeinsam? -> Dort den Fehler weitersuchen (z.B. Proxy-Server oder feste IP und DNS, DNS hat sich aber geändert oder sowas)
Antwort: Netzwerkzweig (Subnetz, VPN, alle an einem bestimmten Switch...) -> siehe vorige Antwort
So gehst Du jeden einzelnen Punkt durch und schreibst auf, was zu tun ist. Angefangen von der OS-Installation, Konfiguration, alle Geräte, alle Anwendungen, alle Funktionen. Ist eine ganze Menge Arbeit.
Was das Notfalllager angeht: In dem Standort, wo die Server stehen, sollten natürlich Festplatten nicht fehlen, ein Switch ist nie eine schlechte Idee, Kabel natürlich (entweder lang genug, um etwas zu überbrücken oder Adapter zum Verlängern). RAM und Prozessoren halte ich für eine überflüssige Investition, da macht es mehr Sinn, einen Ersatzrechner da zu haben. Der muss nicht unbedingt die volle Leistung haben, dann ist es für eine Weile eben langsamer, geht aber immerhin. Wenn Ihr Virtuelle Server einsetzt, macht es Sinn, die Auslastung so zu wählen, dass bei Ausfall eines Hosts die Auslastung der anderen noch keine 100% erreicht, dann hast Du Luft.
Der Rest ist so, wie Filipp und Maretz schon geschrieben haben: Stell Dir vor, was alles passieren kann, frage Dich, wie schlimm das ist und wie schnell Du das beheben musst und entscheide dann, was Du dazu in welcher Zeit brauchst. Wenn Du eigens für diesen Job eingestellt wurdest, hört sich das so an, als wenn es rund um die Uhr keinen Ausfall geben sollte. In dem Fall ist natürlich der Gedanke an vollständige Redundanz nicht weit. Der Spaß kostet einen Haufen Geld, beantwortet aber Deine Frage mit "alles doppelt". Einschließlich Sicherungslaufwerk, E-Mail-Sicherungsserver, komplettes SAN, funktionierendes Shadow-System fürs SAP, alle Kabel, alle Switches, Datenbankserver... alles eben. Und wenn es wirklich keinen Ausfall geben soll, sollte natürlich auch alles doppelt laufen. Wenn eine Stunde Ausfall des Fileservers niemanden umbringt, kannst Du zwei Stufen zurückschalten. Wenn der Ausfall eines VPN-Standortes für einen halben Tag kein Problem ist, bleib einfach locker.
Ich denke also, Deine erste Tat sollte sein, zu gewichten (Prio vergeben), was wie wichtig ist und wie schnell reagiert werden muss.
Viel Erfolg!
Ich schließe mich meinen Vorrednern mal auf jeden Fall an, will Dir aber noch einen kleinen Denkanstoß geben, mit dem ich mal angefangen habe:
Was kann kaputt gehen und was ist in dem Fall zu tun?
Alle Antworten auf diese Frage schreibst Du auf einen Zettel / in eine Tabelle (ich fange meist auf Papier an zu scribbeln) und die Antworten dazu. Eine gute Sache für sowas ist ein Mindmapping-Tool, entweder ein großes Plakat (DIN A 1 oder 0) oder zum Beispiel FreeMind, wenn Du nicht ohnehin schon ein vergleichbares Programm am Start hast. Wenn Du damit fertig bist, hast Du ein schönes, dickes Buch, was Dein Notfallkonzept ist. Ein Mini-Beispiel:
Internetzugang geht nicht.
ToDo: Bei wem, nur ein User oder eine bestimmte Gruppe oder ein Netzwerkzweig oder alle....? (Also Eingrenzung)
Antwort: Nur 1 User -> PC und Profil checken, Browser, DNS, Routen/Gateway, Cookies + temp. Internetfiles löschen, lokale Firewall usw...
Antwort: Eine bestimmte Gruppe: Was hat diese Gruppe gemeinsam? -> Dort den Fehler weitersuchen (z.B. Proxy-Server oder feste IP und DNS, DNS hat sich aber geändert oder sowas)
Antwort: Netzwerkzweig (Subnetz, VPN, alle an einem bestimmten Switch...) -> siehe vorige Antwort
So gehst Du jeden einzelnen Punkt durch und schreibst auf, was zu tun ist. Angefangen von der OS-Installation, Konfiguration, alle Geräte, alle Anwendungen, alle Funktionen. Ist eine ganze Menge Arbeit.
Was das Notfalllager angeht: In dem Standort, wo die Server stehen, sollten natürlich Festplatten nicht fehlen, ein Switch ist nie eine schlechte Idee, Kabel natürlich (entweder lang genug, um etwas zu überbrücken oder Adapter zum Verlängern). RAM und Prozessoren halte ich für eine überflüssige Investition, da macht es mehr Sinn, einen Ersatzrechner da zu haben. Der muss nicht unbedingt die volle Leistung haben, dann ist es für eine Weile eben langsamer, geht aber immerhin. Wenn Ihr Virtuelle Server einsetzt, macht es Sinn, die Auslastung so zu wählen, dass bei Ausfall eines Hosts die Auslastung der anderen noch keine 100% erreicht, dann hast Du Luft.
Der Rest ist so, wie Filipp und Maretz schon geschrieben haben: Stell Dir vor, was alles passieren kann, frage Dich, wie schlimm das ist und wie schnell Du das beheben musst und entscheide dann, was Du dazu in welcher Zeit brauchst. Wenn Du eigens für diesen Job eingestellt wurdest, hört sich das so an, als wenn es rund um die Uhr keinen Ausfall geben sollte. In dem Fall ist natürlich der Gedanke an vollständige Redundanz nicht weit. Der Spaß kostet einen Haufen Geld, beantwortet aber Deine Frage mit "alles doppelt". Einschließlich Sicherungslaufwerk, E-Mail-Sicherungsserver, komplettes SAN, funktionierendes Shadow-System fürs SAP, alle Kabel, alle Switches, Datenbankserver... alles eben. Und wenn es wirklich keinen Ausfall geben soll, sollte natürlich auch alles doppelt laufen. Wenn eine Stunde Ausfall des Fileservers niemanden umbringt, kannst Du zwei Stufen zurückschalten. Wenn der Ausfall eines VPN-Standortes für einen halben Tag kein Problem ist, bleib einfach locker.
Ich denke also, Deine erste Tat sollte sein, zu gewichten (Prio vergeben), was wie wichtig ist und wie schnell reagiert werden muss.
Viel Erfolg!
was vorhanden sein sollte: eine 2. kaffeemaschiene. denke mal das ist des wichtigste was noch fehlt wenn du dich an die oben genannten dinge hältst.
gibt nichts schlimmeres wenn du in der früh in die firma kommst, alle heulen und jammern weil das internet gerade in der früh nicht geht. alle stehen in der "kaffeeküche" und saufen den kaffee bzw. blockieren die kaffeemaschiene und als du wieder kommst ist die nächste kane leer...
aber wie gesagt:
mindmap erstellen erspart nachdenken, zur not kannst auch mal den azubi los schicken um gewisse dinge zu checken und den fehler einzuschränken.
auch mal den Worst Case durchlaufen ob das was in der docu steht wirklich funktioniert. (nicht auf der produktions kiste sondern in VM) dann die docu anpassen: wenn dieses oder jenes problem auftritt dann muss man so vorgehen usw.
eine Knowlegebase anlegen diese auch wirklich pflegen (falls noch nicht vorhanden)
wenn du diese tips alle berücksichtigs kannst ganz entspannt dein 1. ausfall entgegen schauen.
Wartungsplan:
Wie dein System halt so aussieht:
kontrolle der Sicherungen.
Pflege der Computer, Defrag, Tmp, Updates usw.
das alles schön aufschreiben wann wer was gemacht hat mit den PC. den wenn "fremde" dran waren an den pc und die Wartung gemacht haben will nie einer was gewesen sein. also jeder kiste einen Wartungszettel verpassen.
gibt nichts schlimmeres wenn du in der früh in die firma kommst, alle heulen und jammern weil das internet gerade in der früh nicht geht. alle stehen in der "kaffeeküche" und saufen den kaffee bzw. blockieren die kaffeemaschiene und als du wieder kommst ist die nächste kane leer...
aber wie gesagt:
mindmap erstellen erspart nachdenken, zur not kannst auch mal den azubi los schicken um gewisse dinge zu checken und den fehler einzuschränken.
auch mal den Worst Case durchlaufen ob das was in der docu steht wirklich funktioniert. (nicht auf der produktions kiste sondern in VM) dann die docu anpassen: wenn dieses oder jenes problem auftritt dann muss man so vorgehen usw.
eine Knowlegebase anlegen diese auch wirklich pflegen (falls noch nicht vorhanden)
wenn du diese tips alle berücksichtigs kannst ganz entspannt dein 1. ausfall entgegen schauen.
Wartungsplan:
Wie dein System halt so aussieht:
kontrolle der Sicherungen.
Pflege der Computer, Defrag, Tmp, Updates usw.
das alles schön aufschreiben wann wer was gemacht hat mit den PC. den wenn "fremde" dran waren an den pc und die Wartung gemacht haben will nie einer was gewesen sein. also jeder kiste einen Wartungszettel verpassen.