Netzwerkausfall Samstag nach DASI
Hallo liebe Community,
ich habe ein kleines Problem, bei einem Kunden und verstehe nicht, woher das Problem kommt!
Erst mal zur Hardwareumgebung
Server: Fujitsu Primegy RX2520M1
- Xeon E5-2420v2
- 96Gb RAM
- 6 X HD Sas 1.2Tb 10K 2,5" im RAID 5
Installiert ESX aktuelles Image von Fujitsu
Konfiguration des Server:
- 5 X Gigabit Netzwerk Port auf vSwitch mit IP-HASH, kein Failover und nur Teaming
SWITCH ist eine DLINK DGS-1210-48 (aktuelle Firmeware installiert!)
- FESTE IP vergeben
- SNTP eingerichtet
- Passwort neu vergeben
- Cable Length Detection abgeschaltet
- Safeguard Engine deaktiviert
Virtuelle Maschinen :
DC
FS(FileServer)
WAWI
MAIL(EXCHANGE)
Service-PC (Win10) mach auch Veeam
Eset Appliance
vsphere Server appliance
Anmerkung: Paravirtualisierte Netzwerkkarten aber kein Paravirtualisiert Festplattencontroller
Jetzt kommt das Problem,
wir fahren jeden Abend inkrementelle Sicherungen per VEEAM auf eine RS816 (4*4TB HDD verbaut), diese Sicherungen laufen auch anstandslos, die NAS schriebt per Tunnel die Sicherungen zu einer anderen NAS (DS-418 4*4TB) im anderen ORT! Am Samstag wird immer ein VOLLBACKUP gefahren und immer Samstag fällt das Netzwerk aus und Montags muss dann die Switch per ziehen des Stromkabels neugestartet werden!
Ich kann nicht herrausfinden warum und wieso!
Kann mir vll jemand ein Tipp geben
ich habe ein kleines Problem, bei einem Kunden und verstehe nicht, woher das Problem kommt!
Erst mal zur Hardwareumgebung
Server: Fujitsu Primegy RX2520M1
- Xeon E5-2420v2
- 96Gb RAM
- 6 X HD Sas 1.2Tb 10K 2,5" im RAID 5
Installiert ESX aktuelles Image von Fujitsu
Konfiguration des Server:
- 5 X Gigabit Netzwerk Port auf vSwitch mit IP-HASH, kein Failover und nur Teaming
SWITCH ist eine DLINK DGS-1210-48 (aktuelle Firmeware installiert!)
- FESTE IP vergeben
- SNTP eingerichtet
- Passwort neu vergeben
- Cable Length Detection abgeschaltet
- Safeguard Engine deaktiviert
Virtuelle Maschinen :
DC
FS(FileServer)
WAWI
MAIL(EXCHANGE)
Service-PC (Win10) mach auch Veeam
Eset Appliance
vsphere Server appliance
Anmerkung: Paravirtualisierte Netzwerkkarten aber kein Paravirtualisiert Festplattencontroller
Jetzt kommt das Problem,
wir fahren jeden Abend inkrementelle Sicherungen per VEEAM auf eine RS816 (4*4TB HDD verbaut), diese Sicherungen laufen auch anstandslos, die NAS schriebt per Tunnel die Sicherungen zu einer anderen NAS (DS-418 4*4TB) im anderen ORT! Am Samstag wird immer ein VOLLBACKUP gefahren und immer Samstag fällt das Netzwerk aus und Montags muss dann die Switch per ziehen des Stromkabels neugestartet werden!
Ich kann nicht herrausfinden warum und wieso!
Kann mir vll jemand ein Tipp geben
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 362722
Url: https://administrator.de/contentid/362722
Ausgedruckt am: 23.11.2024 um 00:11 Uhr
60 Kommentare
Neuester Kommentar
Hallo,
fällt das Netzwerk immer genau dann aus, wenn die Sicherung läuft?
Reicht es, den Switch neu zu starten oder weitere Geräte auch? Wir hatten mal ein ähnliches Problem, ein Switch kam mit der Datenmenge einfach nicht klar.
Verlege doch die Sicherung testweise auf einen anderen Tag, wandert der Fehler weiter, könnte es ein ähnliches Problem sein.
Gibt es irgendwo Einträge in Logdateien?
fällt das Netzwerk immer genau dann aus, wenn die Sicherung läuft?
Reicht es, den Switch neu zu starten oder weitere Geräte auch? Wir hatten mal ein ähnliches Problem, ein Switch kam mit der Datenmenge einfach nicht klar.
Verlege doch die Sicherung testweise auf einen anderen Tag, wandert der Fehler weiter, könnte es ein ähnliches Problem sein.
Gibt es irgendwo Einträge in Logdateien?
Ist wohl ein ein Timeoutprob. jeder Task ( Backup z.b. ) der länger als 15 Min. läuft , wird automatisch abgebrochen. kann man aber ändern
https://kb.vmware.com/s/article/1017253
https://kb.vmware.com/s/article/1017253
Moin,
ich tippe auch auf den Switch. Du könntest ja mal schauen, ob du während das Backup anläuft dir den Verlauf der CPU mal auf dem D-Link anschauen kannst (kennen den genaue CLI-Befehl nicht, sollte aber im Manual bzw. via help sich eruieren lassen).
je nach Budget könnte man den D-Link 1:1 gegen einen SG350X-48 von Cisco austauschen:Beispiel. Der hätte dann zumindest schon mal 4x 10GBit mit an Board
Oder aber, einen SG350X-24 und man hängt den D-Link als Access-Switch "darunter". Für Drucker und PCs sollte der ja ausreichend sein...
@StefanHalstenbach:
Gruß
em-pie
ich tippe auch auf den Switch. Du könntest ja mal schauen, ob du während das Backup anläuft dir den Verlauf der CPU mal auf dem D-Link anschauen kannst (kennen den genaue CLI-Befehl nicht, sollte aber im Manual bzw. via help sich eruieren lassen).
je nach Budget könnte man den D-Link 1:1 gegen einen SG350X-48 von Cisco austauschen:Beispiel. Der hätte dann zumindest schon mal 4x 10GBit mit an Board
Oder aber, einen SG350X-24 und man hängt den D-Link als Access-Switch "darunter". Für Drucker und PCs sollte der ja ausreichend sein...
@StefanHalstenbach:
Ein gutes Verkaufsargument bei deinem Chef wäre, das er die Kosten für neue Hardware, dir vom Gehalt abziehen kann
das würde bedeuten, er belässt alles so wie es ist, wenn er (der TO) sein aktuelles Gehalt behalten möchte Gruß
em-pie
naja ich bestelle ja nicht, ich baue nur das ein was mir auf den tisch geknallt wird
Dann würde ich das ab jetzt mal schnell überdenken, du musst dich ja dann auch mit dem Zeug rumschlagen?!
Der Cisco sieht nicht schlecht aus
Aussehen tun die alle gut, es geht da mehr um die Funktionen die ihr benötigt.Hi,
deshalb kannst du einem eigentlich nur Leid tun.
Fass mal zusammen:
- Du weißt eindeutig, am welchem Gerät das Problem liegt
- Ihr setzt produktiv einen Switch von einem Consumer-Hersteller ein, der so unterirdisch ist, dass ich (oder andere Admins) den nicht mal bei mir daheim einsetzen will und auch werde
Frag deinen Chef doch einfach, ob es ihm wert ist, jeden Montagmorgen auch wie einen Montagmorgen starten zu lassen und zusätzlich du 52 Wochen im Jahr 15 Minuten damit verbringst, zum Serverraum zu laufen und den Switch zu rebooten. Das kann jeder Grundschüler ausrechnen, ob das oder ein neuer, tauglicher Switch günstiger ist.
Ich würde ihn auch mal fragen, ob ihm eigentlich bewusst ist, was das für eure Datensicherung und den Fall eines Ausfalles bedeutet, ob er dann damit leben kann, am falschen Ende gespart zu haben und ggf. Überlebenswichtige Dateien zu verlieren.
Das würde ich mir auch gegen zeichnen lassen, dann bist du im schlimmsten Fall wenigstens raus, weil er Bescheid wusste und nicht weiter gehandelt hat, sonst kann dein Job da dran hängen.
Das würde ich mir auch gegen zeichnen lassen, dann bist du im schlimmsten Fall wenigstens raus, weil er Bescheid wusste und nicht weiter gehandelt hat, sonst kann dein Job da dran hängen.
Moin,
in der Tat bist du eine arme Socke
Mache es doch mal umgekehrt. "Lösche" einer seiner wichtigsten Excel Sheets (oder einen ganzen Ordner), sodass du auf die DaSi zurückgreifen musst. Da diese aber nicht läuft (aufgrund minderwertiger Hardware) wird er alles neu erstellen dürfen.
Und das "Löschen" beinhaltet erstmal nur das Verschieben an einen Ort, an den er nicht drankommt.
Gruß
em-pie
in der Tat bist du eine arme Socke
Mache es doch mal umgekehrt. "Lösche" einer seiner wichtigsten Excel Sheets (oder einen ganzen Ordner), sodass du auf die DaSi zurückgreifen musst. Da diese aber nicht läuft (aufgrund minderwertiger Hardware) wird er alles neu erstellen dürfen.
Und das "Löschen" beinhaltet erstmal nur das Verschieben an einen Ort, an den er nicht drankommt.
Gruß
em-pie
Moin
Das ist für mich der wichtige Punkt.
Es ist ja nicht so, dass der Switch einfach keine Daten mehr transportiert, sondern dass die Links alle down sind.
Ich habe ja schon vieles gesehen. Auch Netzwerkkomponten die unter Last ein merkwürdiges Verhalten zeigen, aber nicht so etwas .
Das der Switch ja schon einmal gegen ein gleiches Modell getauscht wurde, bleibt ja eigentlich nur eine Unverträglichkeit. Bzw. ein Softwarefehler im Switch. Denn egal was man dem zu tun gibt, er dürfte maximal den Port abschalten von dem die Daten kommen. Aber nicht alle Ports. Auch die Verwaltung muss weiter funktionieren (was ohne Link natürlich schwierig ist).
<geraten>Der Server oder das NAS verschicken Datenpakete bei denen der Switch völlig durchdreht. Super-Jumbo-Frames z.B.</geraten>
Ich würde es auch mal mit einem SG200/SG300 probieren.
So etwas kann man von einem guten IT-Systemhaus auch mal leihen.
Stefan
Das ist für mich der wichtige Punkt.
Es ist ja nicht so, dass der Switch einfach keine Daten mehr transportiert, sondern dass die Links alle down sind.
Ich habe ja schon vieles gesehen. Auch Netzwerkkomponten die unter Last ein merkwürdiges Verhalten zeigen, aber nicht so etwas .
Das der Switch ja schon einmal gegen ein gleiches Modell getauscht wurde, bleibt ja eigentlich nur eine Unverträglichkeit. Bzw. ein Softwarefehler im Switch. Denn egal was man dem zu tun gibt, er dürfte maximal den Port abschalten von dem die Daten kommen. Aber nicht alle Ports. Auch die Verwaltung muss weiter funktionieren (was ohne Link natürlich schwierig ist).
<geraten>Der Server oder das NAS verschicken Datenpakete bei denen der Switch völlig durchdreht. Super-Jumbo-Frames z.B.</geraten>
Ich würde es auch mal mit einem SG200/SG300 probieren.
So etwas kann man von einem guten IT-Systemhaus auch mal leihen.
Stefan
Zitat von @SlainteMhath:
Dann besorg dir einfach eine Zeitschaltuhr die Montags um 06:30 den Switch aus- und wieder einschaltet
Dadurch funktioniert die Vollsicherung ja trotzdem nicht.Dann besorg dir einfach eine Zeitschaltuhr die Montags um 06:30 den Switch aus- und wieder einschaltet
Deaktiviere doch mal alle Leistungssteigernden Maßnahmen wie Jumboframes & Co.
Vieleicht auch ein getrenntes VLAN und Server-NIC-Ports für die Sicherung.
Besser langsam und zuverlässig.
Testhalber ein kleiner TP-Link-Switch mit 8xGBit direkt zwischen Server und NAS.
Ja, ist nicht schön, aber zum testen....
Langsam vs Geld ist meist auch ein Punkt wo verantwortliche besser mit umgehen können
Stefan
Boah du tust mir echt Leid. Nichtmals das darfst du :D Bleibt wohl nur der Marsch zum Switch. Habe ich das überlesen oder steht hier eigentlich nirgends was der Switch genau macht?
Switch mal komplett auf Werkseinstellung resettet? Ich werfe hier mal noch was ganz anderes in den Raum: Die Spannungsversorgung. Handelt es sich um eine industrielle Umgebung? Hängt der Switch an einer USV? Gibt es große Nachbarfirmen?
Moin,
Das hängt davon ab, in welchem Zustand der Switch ist. Wenn der über Netzwerk nichts mehr annimmt, bliebe ja nur die console.... Das müsste man mal testen, ob man automatisieren (putty?) was reißen kann und ob der Switch überhaupt mitspielt...
Aber frage mal deine Chefs, ob die sich auch freuen, wenn die stets ihr Auto neustarten lassen wollen, wenn alles blockiert oder ob die ein neues Auto (anderer Hersteller) kaufen?
Das hängt davon ab, in welchem Zustand der Switch ist. Wenn der über Netzwerk nichts mehr annimmt, bliebe ja nur die console.... Das müsste man mal testen, ob man automatisieren (putty?) was reißen kann und ob der Switch überhaupt mitspielt...
Aber frage mal deine Chefs, ob die sich auch freuen, wenn die stets ihr Auto neustarten lassen wollen, wenn alles blockiert oder ob die ein neues Auto (anderer Hersteller) kaufen?
Macht doch aber kein Sinn?
Das wäre so, als wenn du, bevor du in den Feierabend und somit den Feierabendstau fährst, vorher nochmal rechts ran fähsrt, das Auto aus und wieder anmachst. Mag sein, dass das in deinem Fall klappt, aber verlassen würde ich mich da nicht drauf...
Wenn du des dennoch so vorhast: Kaufe eine 5€ Zeitschaltuhr und starte so den Switch neu...
Mal im Ernst (was aber nicht gegen dich geht, da du die arme Socke bei euch bist):
Rechne mal aus, wieviele Stunden du dich bisher mit der Thematik beschäftigt hast.
Multipliziere das mit deinem Stundenlohn (inkl. der AG-Anteile)
schaue, wieviele Stunden ihr bisher aufgrund dieses Problems nicht arbeiten konntet...
wenn es z.B. 3h in SUmme bisher waren, und ihr 15 MA seit, sind das schon mal 30h, die ihr nicht arbeiten konntet. Das mal die Brutto-Löhne
Und du glaubst gar nicht, wie viele brauchbare, wenig sehr gute Switche man dafür bereits hätte kaufen können...
Vielleicht funktioniert das Argument ja bei deinen Chefs.
Ansonsten soll der das Problem lösen, der die Switche gekauft/ empfohlen hat. Denn scheinbar hat er ja Ahnung von den Geräten, sonst hätte er die ja nicht gekauft
Das wäre so, als wenn du, bevor du in den Feierabend und somit den Feierabendstau fährst, vorher nochmal rechts ran fähsrt, das Auto aus und wieder anmachst. Mag sein, dass das in deinem Fall klappt, aber verlassen würde ich mich da nicht drauf...
Wenn du des dennoch so vorhast: Kaufe eine 5€ Zeitschaltuhr und starte so den Switch neu...
Mal im Ernst (was aber nicht gegen dich geht, da du die arme Socke bei euch bist):
Rechne mal aus, wieviele Stunden du dich bisher mit der Thematik beschäftigt hast.
Multipliziere das mit deinem Stundenlohn (inkl. der AG-Anteile)
schaue, wieviele Stunden ihr bisher aufgrund dieses Problems nicht arbeiten konntet...
wenn es z.B. 3h in SUmme bisher waren, und ihr 15 MA seit, sind das schon mal 30h, die ihr nicht arbeiten konntet. Das mal die Brutto-Löhne
Und du glaubst gar nicht, wie viele brauchbare, wenig sehr gute Switche man dafür bereits hätte kaufen können...
Vielleicht funktioniert das Argument ja bei deinen Chefs.
Ansonsten soll der das Problem lösen, der die Switche gekauft/ empfohlen hat. Denn scheinbar hat er ja Ahnung von den Geräten, sonst hätte er die ja nicht gekauft
Zitat von @Finchen961988:
es kommt da nu eine Zeitschaltuhr zwischen habe da schon mit dem Kunden drüber gesprochen,
der war zwasr nicht begeistert abe nun ja
es kommt da nu eine Zeitschaltuhr zwischen habe da schon mit dem Kunden drüber gesprochen,
der war zwasr nicht begeistert abe nun ja
Subjektiv hilft an deinem Punkt eigentlich nur noch die Rasur des Kunden... Symptom- vs. Ursachen-Bekämpfung und so :/
Ich bekomms nicht ganz in meine Birne rein, der Kunde hat so einen großen Server, große NAS, einige VMs etc. und hat keine gottverdammte 800€ für einen guten Switch übrig.
Frei nach dem Motto "Geile Soundanlage im Auto, drölftausend PS aber Fahrwerk, Lenkrad und Bremsen brauch ich doch nicht".
Zitat von @Finchen961988:
Der Kunde würde das bezahlen mit einem Switch von 800€, kenne sein Kontostand, aber mein Chef ist der Meinung es liegt nicht am Switch!
Und wenn dein Kunde urplötzlich einen anderen Switch (nicht über euch erworben) hat? Kannst du dich ja nicht gegen wären, wenn er mit einemmal was vernünftiges kauft...Der Kunde würde das bezahlen mit einem Switch von 800€, kenne sein Kontostand, aber mein Chef ist der Meinung es liegt nicht am Switch!
Vemrutlich hält dein Chef euren Kunden aber für eine CashCow, da er immer fleißig zahlt, statt mal auf den Tisch zu hauen...
Habe mit D-Schrott telefoniert und habe eine neue 1210-48 geschickt bekommen, allerdings in einer neuen HardwareRevision, mal schauen!
Viel erfolg!ICh habe mir aber geschworen, sollte das nicht gehen oder immer noch ausfallen, werde ich die Kündigung schreiben, denn dann bin ich als Techniker im IT - Bereich nicht geeignet!
Och, zweifle nicht an dir, du würdest es ja direkt (wirtschaftlich) richtig/ besser machen.Gibt ja noch genügend andere potenzielle Arbeitgeber der IT-Branche...
Zitat von @Finchen961988:
Der Kunde würde das bezahlen mit einem Switch von 800€, kenne sein Kontostand, aber mein Chef ist der Meinung es liegt nicht am Switch!
Der Kunde würde das bezahlen mit einem Switch von 800€, kenne sein Kontostand, aber mein Chef ist der Meinung es liegt nicht am Switch!
Erinnert mich glatt an meinen letzten Chef. Alles besser wissen und lieber 20 Wochen dran rummurksen und Jugend forscht betreiben, anstatt direkt die offensichtliche Lösung auszuführen und Ruhe zu haben.
Denn dann muss der Kunde ja keine Rechnungen mehr zahlen, wenn die IT auf einmal stabil läuft. Ist wieder ziemlich typisch, dass eigener Geldbeutel >>>> Kundenzufriedenheit zählt.
Ich denke ich gehe ganz raus aus der IT!
Wärst leider nicht der erste, ich kenne ein paar, die in komplett andere Berufe umgeschult haben.
Was hält dich denn davon ab, den Job als DIenstleister in Systemhäusern an den Nagel zu hängen und stattdessen auf Seite deiner Kunden zu wechseln?
Wenn dir der Job als ITler selbst noch Spaß bringt, du bisher aber nur Griffe in die altebakannte Schüssel hattest...
Gerade KMUs sind da mehr an schnellen Lösungen denn anlangen Bastelaktionen interessiert...
Wenn dir der Job als ITler selbst noch Spaß bringt, du bisher aber nur Griffe in die altebakannte Schüssel hattest...
Gerade KMUs sind da mehr an schnellen Lösungen denn anlangen Bastelaktionen interessiert...