kamelle01
Goto Top

DFSR - Dateireplikationseinstellung - Festplattenauslastung zu hoch - optimale Einstellungsfrage

Hallo liebe Mitglieder,

ich habe einen Windows Server 2016 mit 4TB 7200U 256MB SATA Festplatten in RAID10 und einem Raidcontroller H730 im Einsatz. Wir haben mehrere Server die in der Replikation verbunden sind und dazu kommen noch ca. 100 User die auf dem Server arbeiten und auch in Dateien live gleichzeitig arbeiten. Momentan sind knapp 240 Replikationsgruppe aktiv, also leider eine ganze Menge.

Aktuell sind die aktiven Projekte so eingestellt, dass die 24/7 mit voller Bandbreite arbeiten können und die kleineren Projekte sind auf 2MBit/s begrenzt. Dieser Mix ist glaube ich nicht sehr vorteilhaft.

Anbei sieht ihr meine Festplattenauslastung auf dem Server. Der Datenträgerdruchsatz ist gering, also dümpelt so bei 50-120MB/s, aber dafür ist der ständig bei 100% Zeit mit max. Aktivität.

Jetzt zu meinen Fragen:

Was ist sinnvoller?
1. Alle Replikationsordner mit "Vollständig" in der Bandbreitenauslastung und 24/7 einzustellen?
(Hier ist mein Grundgedanke, zwar höhere Datenübertragung, aber dafür schneller und nur kurzzeitige Last. In der Hoffnung, dass sich das so nicht staut und alles schnell durch repliziert wird.)
oder
2. Bandbreitenauslastung während der Arbeitszeiten auf zB. 2MBit/s zu begrenzen?


Hier fehlen mir etwas die Erfahrungswerte, weshalb ich auf euer NowHow setzte.


Vielen Dank für eure Hilfe!

Liebe Grüße
a
a

Content-Key: 419215

Url: https://administrator.de/contentid/419215

Ausgedruckt am: 19.03.2024 um 02:03 Uhr

Mitglied: emeriks
emeriks 18.02.2019 aktualisiert um 11:06:20 Uhr
Goto Top
Hi,
240 Replikationsgruppen?!
Wir haben hier Server mit ähnlicher Größe, ca. 1-2 Mio Dateien und dass mit nur einer Replikationsgruppe für alles, bei ähnlicher Anzahl Benutzer.
Welchen Grund habt Ihr für diese vielen Gruppen? Repliziert Ihr nur partiell?

E.
Mitglied: Kamelle01
Kamelle01 18.02.2019 aktualisiert um 11:16:57 Uhr
Goto Top
Hi,

leider ja... Habe ich so übernommen. Hat aber auch ein wenig seine Gründe.

Kann man so sagen. Wir haben zB. Standort A der nur nach Standort B was schickt aber C komplett außer acht lässt, weil es dort nicht benötigt wird und dort auch leider nicht die gleiche Kapazität an TB vorhanden ist, wie auf unseren Haupt-Fileserver.

Auch arbeiten wir hier in Projekten mit mehreren Abteilungen, wo es immer der Fall ist, dass nicht jede Abteilung in dem Projekt involviert ist.

Der Grundgedanke war wohl (habe das System so übernommen), die Last auf dem Server so geringer zu halten, statt zB. ganz D:\ zu replizieren.
Aber ich bin hier für Meinungen offen. Ist es vielleicht besser einfach komplett D:\ zu replizieren? Nur dann weiß ich nicht, wie ich das mit der Datenmenge hin bekomme, da wir in einigen kleinen Außenstellen mit kleineren Server mit wenig Kapazität arbeiten.
Mitglied: keine-ahnung
keine-ahnung 18.02.2019 um 11:47:56 Uhr
Goto Top
Moin,

eigenartiges Konstrukt ... aber egal. Über was reden wir hier eigentlich? SATA? SAS? Was für ein RAID-controller?

Insgesamt scheinen mir schon die 7,2k-HDD etwas schwachbrüstig dimensioniert zu sein, trotzdem macht es IMHO Sinn, mal deren Zustand zu kontrollieren ...

LG, Thomas
Mitglied: emeriks
emeriks 18.02.2019 um 11:50:46 Uhr
Goto Top
Nein, natürlich sollte man nur das replizieren an die Aussenstandorte replizieren, was dort auch benötigt wird.
Ist das Full-Mesh oder Hub-Spoke?
Aus meiner Erfahrung:
  1. So wenig Replikationsgruppen pro Server wie möglich. (bzw. replizierte Ordner-Paare)
  2. Wenn eh ein zentraler Server dabei ist, welcher alle Replikate hält, z.B. wegen der Datensicherung, dann Hub-Spoke vor Full-Mesh. Mal abgesehen davon, dass man dafür weniger bzw. keine Verbindungen zwischen den Standorten benötigt.
Bzgl. Punkt 1
Das kann man schwer pauschalisieren. Das hängt von der Anzahl und Datenmenge der Änderungen ab, der verfügbaren Bandbreite, usw. Das muss man halt austesten. Aber es ist manchmal besser, die Ordnerstruktur nicht nur nach der Verwendung zu optimieren sondern auch, ob repliziert oder nicht.
Wieviel Standorte sind das denn?
Mitglied: Kamelle01
Kamelle01 18.02.2019 um 12:02:59 Uhr
Goto Top
Momentan noch Full-Mesh, aber wollen Richtung Hub-Spoke.

Und zwar wie folgt gedacht: Hauptfileserver repliziert nur mit 1:1 identischen Server, den wir als Replikationsserver nutzen werden (gleichzeitig Ausfall-Ersatzserver) > der Replikationsserver kommuniziert mit allen anderen Standorten, sodass wir versuchen, die Last vom Fileserver zu entfernen, indem er der Fileserver nur mit dem Repli-Server kommuniziert und keinem weiteren Standort.

Momentan sind es 6 Standort über die Welt verteilt :/

---

Also wie eigentlich schon gedacht:
1. Die Masse an Gruppen so weit wie möglich reduzieren und gering halten.
2 Ggf. Gruppen zusammenfassen.
3. Schnellstmöglich in Richtung Hub-Spoke (so ähnlich habe ich es ja vorgesehen).

P.S.: Ich werde es testen. Ich setzte alle gruppen auf volle Bandbreite 24/7, in der Hoffnung, dass es so zu keinem Stau durch Bandbreitenreduzierung kommt.

Richtig zusammengefasst?
Mitglied: Kamelle01
Kamelle01 18.02.2019 aktualisiert um 12:09:50 Uhr
Goto Top
Zitat von @keine-ahnung:

Moin,

eigenartiges Konstrukt ... aber egal. Über was reden wir hier eigentlich? SATA? SAS? Was für ein RAID-controller?

Insgesamt scheinen mir schon die 7,2k-HDD etwas schwachbrüstig dimensioniert zu sein, trotzdem macht es IMHO Sinn, mal deren Zustand zu kontrollieren ...

LG, Thomas


SATA und ein Dell PowerEdge RAID Controller H730.

Das dachte ich anfangs auch! Ggf. kommt die Platte nicht hinterher, weil die zB. kein 15000U hat, aber wenn ich Dateien während der hohen dfsr.exe Auslastung kopiere oder einen Speedtest mache, ist alles OK... Das ist mir noch nicht ganz klar...

Spiele mit dem Gedanken, notfalls den Server in zwei zu teilen, und die Abteilungen mit der höchsten Last/Dateigrößen auf einen kleinen Server mit SSDs zu packen.
Mitglied: emeriks
emeriks 18.02.2019 um 12:21:48 Uhr
Goto Top
Zitat von @Kamelle01:
Momentan sind es 6 Standort über die Welt verteilt :/
Doch so viele ... face-wink
Das ist nun wirklich nicht viel.

Richtig zusammengefasst?
Im Wesentlichen schon, ja.
Mitglied: emeriks
emeriks 18.02.2019 aktualisiert um 12:25:53 Uhr
Goto Top
Bzgl. Platten
Das kann man doch ganz einfach mit Perfmon messen und überwachen.

z.B.
Windows Performance Monitor Disk Counters Explained
Mitglied: Kamelle01
Kamelle01 18.02.2019 um 12:39:27 Uhr
Goto Top
Danke! Habe ich gleich mal eingestellt.
Zwar veraltet, aber die Basis stimmt ja: Anleitung

Ich gebe die Tage nach dem Check Beschied!
Mitglied: Kamelle01
Kamelle01 18.02.2019 um 13:40:49 Uhr
Goto Top
Laut LOG ist die Platte bei der Warteschlange bei 100%. In Verbindung mit Lese und Schreibzugängen.

Das bekräftigt mich in meiner Annahme, dass sich zu viel staut. Das muss ich jetzt irgendwie entlasten...

Bei weiteren Ideen lese ich gern nochmal rein, sonst gibts Zeitnah eine Meldung.

Danke erstmal bis hier hin! Ich werde es zur gegebenen Zeit als gelöst markieren.
a
Mitglied: emeriks
emeriks 18.02.2019 um 14:15:54 Uhr
Goto Top
Bytes/s sind irrelevant. (nicht vordergründig)
Schau mal "physischer Datenträger" --> "Schreibvorgänge/s", "Lesevorgänge/s"
Das in Summe sind die IOpS. Und dann vergleiche mit dem, was die HDD bzw. das RAID theoretisch kann.
Mitglied: Kamelle01
Kamelle01 18.02.2019 aktualisiert um 14:59:47 Uhr
Goto Top
Habe beides geprüft.
Auch mal Diskspd bemüht. Quelle
b

Alles TOP...

Mal mit Acronis Doctor D:\ geprüft. Dort gibt es auch die Meldung, das D:\ zu beschäftigt ist. Sobald ich den DFSR Dienst abstelle, ist alles OK und im Grünen Bereich. Es kann nur am DFSR liegen. Es ist wahrscheinlich einfach zu viel :/
c
Mitglied: emeriks
emeriks 19.02.2019 um 12:47:02 Uhr
Goto Top
Wenn Du das DFS-R ab- und wiederanstellst, dann beschäftigst Du den Server erst recht, das ist Dir klar? Er muss dann u.U. die gesamten Datenbestände der einzelnen Replikationsgruppen komplett vergleichen, bis er weiß, dass er wieder synchron ist
Mitglied: Kamelle01
Kamelle01 19.02.2019 um 16:46:09 Uhr
Goto Top
Also mein größtes Problem ist, dass die Backups mit Acronis wegen der zu hohen "Last" einfach nicht anspringen. Sobald ich das DFSR deaktiviere, laufen diese super durch.

Ich priorisiere die Backups und habe es heute so eingestellt, dass die Replikation abends automatisch bis morgens nicht läuft. Habe es im Zeitplan so eingestellt. Ich werde dann morgen sehen, wie gut das geklappt hat und berichten.

Bis ich die Gruppen reduziert habe und etwas näher an einem Hub-Spoke bin, fällt mir nichts besseres ein.
Mitglied: emeriks
emeriks 20.02.2019 um 08:16:47 Uhr
Goto Top
Zitat von @Kamelle01:
Ich priorisiere die Backups und habe es heute so eingestellt, dass die Replikation abends automatisch bis morgens nicht läuft. Habe es im Zeitplan so eingestellt. Ich werde dann morgen sehen, wie gut das geklappt hat und berichten.
Bis ich die Gruppen reduziert habe und etwas näher an einem Hub-Spoke bin, fällt mir nichts besseres ein.
So etwa hätte ich Dir das auch als Workaround vorgeschlagen.
Mitglied: Kamelle01
Kamelle01 21.02.2019 aktualisiert um 09:21:22 Uhr
Goto Top
Moin moin,

wollte ja nur kurz eine Rückmeldung geben.

1. Es hat schon ein wenig etwas gebracht, die anzahl der in der Replikation befindlichen Server zu reduzieren. Somit ist der Hauptserver weniger belastet.

2. Wir reduzieren die Anzahl der Gruppe, was sich auch positiv auswirkt.

3. Der dritte Schritt wird noch die Verbindung zwischen den Standorten zu optimieren sein. Danach werden wir weiter sehen. Das dauert aber leider noch etwas.

---

Momentanes Hauptproblem:
Es klappt ganz gut, dass die Replikation Abends aufhört zu replizieren. Nur springt das Backup trotzdem nicht sauber an. Irgendwo kracht es noch zwischen dfsrs.exe und den Schattenkopien (VSS). Ich bin mal auf der Suche und werde weiterhin berichten. Ggf. mit neuem Thema, da meine Hauptfrage ja beantwortet ist.

Ich bedanke mich recht herzlich bei allen für die Unterstützung und frohes Schaffen noch allen!