Backup über WAN - sinnvolle Lösung zur Synchronisation von großen Datenmengen?
Hallo zusammen,
folgende Situation (privat, kein Produktivsystem o.Ä.):
Standort A: ESXi Server, mehrere Win 2008 Installationen. Daten liegen auf einem NDAS, RAID1, ~ 1TB, Dateien haben sehr unterschiedliche Größen (von Word-Dokumenten bis Archiven mit einigen GB ist alles dabei)
Standort B: Ein noch anzuschaffendes, kleines, kostengünstiges NAS-System.
Zwischen den beiden Standorten existiert eine VPN Verbindung, Standort A verfügt über einen DSL16k-Anschluss, Standort B ist mit VDSL25 angebunden.
Die Grundidee war, über Nacht die veränderten Dateien von A nach B zu spiegeln (im Grunde würde diese Richtung reichen, in beide Richtungen wäre eher nice-to-have).
Klassische Synchronisations-Tools würden ja nun hingehen und jedes mal alle Ordner auch in Standort B durchgehen - eher ungünstig über WAN.
Gibt es andere Lösungen, die schauen, welche Dateien sich in A geändert haben und dann diese Änderungen stumpf nach B übertragen?
Was haltet ihr für praktikabel?
Den ersten Datenabgleich kann ich auch "Offline" per externer Fesplatte durchführen.
Bin für Ideen dankbar.
folgende Situation (privat, kein Produktivsystem o.Ä.):
Standort A: ESXi Server, mehrere Win 2008 Installationen. Daten liegen auf einem NDAS, RAID1, ~ 1TB, Dateien haben sehr unterschiedliche Größen (von Word-Dokumenten bis Archiven mit einigen GB ist alles dabei)
Standort B: Ein noch anzuschaffendes, kleines, kostengünstiges NAS-System.
Zwischen den beiden Standorten existiert eine VPN Verbindung, Standort A verfügt über einen DSL16k-Anschluss, Standort B ist mit VDSL25 angebunden.
Die Grundidee war, über Nacht die veränderten Dateien von A nach B zu spiegeln (im Grunde würde diese Richtung reichen, in beide Richtungen wäre eher nice-to-have).
Klassische Synchronisations-Tools würden ja nun hingehen und jedes mal alle Ordner auch in Standort B durchgehen - eher ungünstig über WAN.
Gibt es andere Lösungen, die schauen, welche Dateien sich in A geändert haben und dann diese Änderungen stumpf nach B übertragen?
Was haltet ihr für praktikabel?
Den ersten Datenabgleich kann ich auch "Offline" per externer Fesplatte durchführen.
Bin für Ideen dankbar.
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 134809
Url: https://administrator.de/forum/backup-ueber-wan-sinnvolle-loesung-zur-synchronisation-von-grossen-datenmengen-134809.html
Ausgedruckt am: 22.12.2024 um 17:12 Uhr
21 Kommentare
Neuester Kommentar
Hi
ich habe sowas im Einsatz bei einer Firma bei der am Backup alles gespart wurde. Ich nutze rsync, da es nur veränderte Daten überträgt (dumm nur bei großen DBs wie Exchange oder SQL, da hilft nur eine Deduplizierung) da es kostenlos verfügbar ist und Archiv Snapshots (rsync) damit machbar sind und uns der Online Speicher nichts kostet. Wichtig dabei ist klar der Upliunk von deinem Standort A. Da uns (ist ein Internetprovider) der Uplink nichts kostet gehts (=2*34M), aber wenn du bei dem 16M nur 1M uplink hast (=110kB/s) dann nützt die zweite Seite nichts und ein 10GB Pro Tag dauert dann auch mal ein wenig (=85k s=1d)... Modernere rsync Versionen nutzen mittlerweile auch die VSS vom Windows wodurch dies entspannter ist; der Uplink ist aber Dreh- und Angelpunkt.
Gruß
Sam
ich habe sowas im Einsatz bei einer Firma bei der am Backup alles gespart wurde. Ich nutze rsync, da es nur veränderte Daten überträgt (dumm nur bei großen DBs wie Exchange oder SQL, da hilft nur eine Deduplizierung) da es kostenlos verfügbar ist und Archiv Snapshots (rsync) damit machbar sind und uns der Online Speicher nichts kostet. Wichtig dabei ist klar der Upliunk von deinem Standort A. Da uns (ist ein Internetprovider) der Uplink nichts kostet gehts (=2*34M), aber wenn du bei dem 16M nur 1M uplink hast (=110kB/s) dann nützt die zweite Seite nichts und ein 10GB Pro Tag dauert dann auch mal ein wenig (=85k s=1d)... Modernere rsync Versionen nutzen mittlerweile auch die VSS vom Windows wodurch dies entspannter ist; der Uplink ist aber Dreh- und Angelpunkt.
Gruß
Sam
Hi Osterhase,
Du kannst hierfür auch kostenlose Tools von Microsoft nutzen:
Robocopy
SyncToy (mit GUI)
Dann kannst Du Dir auch noch PowerFolder ansehen. http://www.powerfolder.com/
Gruß,
Volker
Du kannst hierfür auch kostenlose Tools von Microsoft nutzen:
Robocopy
SyncToy (mit GUI)
Dann kannst Du Dir auch noch PowerFolder ansehen. http://www.powerfolder.com/
Gruß,
Volker
Hi
bei 200MB/d soltle das super damit gehen. Die NDAS werden typisch (FC/iSCSI ist eigentlich auch nichts anderes) über treiber wie eine lokale HD eingebunden; das passt da auch. Gegenüber den üblichen 1:1 Kopien mit Incrementen unterstützt rsync halt Snapshots, also diue Möglichkeit nur mit den Unterschieden einen beliebigen Stand wieder herstellen zu können mit einem einfachen "Klick". Praktisch kann das aber auch nahezu jedes Backup Programm (da ist es aber wesentlich mehr aufwand einen beliebigen Stand zurück zu ziehen). Wir nutzen eben rsync über SSL.
Gruß
Sam
bei 200MB/d soltle das super damit gehen. Die NDAS werden typisch (FC/iSCSI ist eigentlich auch nichts anderes) über treiber wie eine lokale HD eingebunden; das passt da auch. Gegenüber den üblichen 1:1 Kopien mit Incrementen unterstützt rsync halt Snapshots, also diue Möglichkeit nur mit den Unterschieden einen beliebigen Stand wieder herstellen zu können mit einem einfachen "Klick". Praktisch kann das aber auch nahezu jedes Backup Programm (da ist es aber wesentlich mehr aufwand einen beliebigen Stand zurück zu ziehen). Wir nutzen eben rsync über SSL.
Gruß
Sam
Moin,
ich verwende SyncBack für sowas. Hat den Vorteil das es auch direkt ne Backup und ne Restore-Funktion kennt. Ebenfalls kannst du notfalls auf nen FTP-Server sichern.
Rsync nutze ich nur unter Linux in Verbindung mit SSH. Unter Windows war mir das bisher noch zuviel Tipperei für Dinge die ich nicht benötige ;)
ich verwende SyncBack für sowas. Hat den Vorteil das es auch direkt ne Backup und ne Restore-Funktion kennt. Ebenfalls kannst du notfalls auf nen FTP-Server sichern.
Rsync nutze ich nur unter Linux in Verbindung mit SSH. Unter Windows war mir das bisher noch zuviel Tipperei für Dinge die ich nicht benötige ;)
Das neue NAS N4200 von Thecus.
Spricht rsync zur Datensyncronisation und kann zum "Festplatten ein bisschen schonen" die Festplatten zu festen Zeiten schlafen legen und wieder aufwecken..oder auch das gesamte NAS. Ein Aufwecken "außer der Reihe" macht dann z.B. WoL. Das wäre dann die eierlegende Wollmilchsau für dich !
Spricht rsync zur Datensyncronisation und kann zum "Festplatten ein bisschen schonen" die Festplatten zu festen Zeiten schlafen legen und wieder aufwecken..oder auch das gesamte NAS. Ein Aufwecken "außer der Reihe" macht dann z.B. WoL. Das wäre dann die eierlegende Wollmilchsau für dich !
Backup Exec führt log dazu; welches Sync Toy meinst du (=Robocopy?); Für Remote habe ich Drive Snapshot bisher benutzt aber durch Exchange war die Tagesänderung größer als wir pro Tag durch bekommen (bis wir richtig =16MBit Upload hatten). PST Dateien sind genau so ein Fall; ein Bit geändert und 1.4GB übertragen. DatenDeplizierung ist da der Einstiegspunkt; da werden nur die geänderten Blöcke übertragen; ZFS beherrscht sowas auch geht aber nur für NAS Systeme
Gruß
Sam
Gruß
Sam
Hi
bei dir dürfte es mit Programmen wie rsync am besten gehen da die beiderseitig eine Protokoll führen was bereits da ist und was noch fehlt (Damit sparst du dir intelligente Programme wie BE). Dein Problem ist bisher ja gar nicht die Datenmenge oder der Up/Downlink sondern die hohe Latenzzeit in der die Anfrage (hast du schon) zum Sender unterwegs ist. Praktisch 200ms pro Anfrage ist da normal mit standard ADSL. Mit meinem benutzten Drivesnapshot wird beim beginn einmal das Inventory gezogen und dann differentiell hinzukopiert. Das ging war aber am Anfang auch sehr störend bis mal was passierte. Wie gesagt würde sich entweder rsync oder subversion eignen da diese Versionierungen beherschen. Beide sind genau für solche Fernwartungen gedacht (und freeware).
Gruß
Sam
bei dir dürfte es mit Programmen wie rsync am besten gehen da die beiderseitig eine Protokoll führen was bereits da ist und was noch fehlt (Damit sparst du dir intelligente Programme wie BE). Dein Problem ist bisher ja gar nicht die Datenmenge oder der Up/Downlink sondern die hohe Latenzzeit in der die Anfrage (hast du schon) zum Sender unterwegs ist. Praktisch 200ms pro Anfrage ist da normal mit standard ADSL. Mit meinem benutzten Drivesnapshot wird beim beginn einmal das Inventory gezogen und dann differentiell hinzukopiert. Das ging war aber am Anfang auch sehr störend bis mal was passierte. Wie gesagt würde sich entweder rsync oder subversion eignen da diese Versionierungen beherschen. Beide sind genau für solche Fernwartungen gedacht (und freeware).
Gruß
Sam
Hi
Acronis, Ghost, Snapshot,.... arbeiten alle mit einem Inhaltsverzeichnis welches einmal geladen und verglichen wird. Die Dateien selbst geht er dazu nicht an da er eine eigene 2Do Liste daraus baut. Ein NAS auf Basis von FreeNAS wäre da anzuraten; im Preisbereich kommt es nur darauf an welches Mainboard (vermutlich ein Embedded wie bei mir ein PicoPX10000 von Via), dazu ein Gehäuse, Netzteil, RAM, HDs, USB Stick (da residiert dann das OS) fertig; mit 300EUR habe ich da schon ein 2*1TB (=RAID1) NAS gebaut welches im Preis-Stromverbrauch-Nutzen jedem anderen NAS mit mehrere Einschüben mithalten und dank der x86 Plattform kann ich beliebig wechseln was ich will (zur Not käme da auch ein anderes Linux drauf um Web Server oder sonst was zu spielen; noch dazu ist mir wichtig die Komponenten wählen zu können, was bei einem fertigen nie geht (HDs von xy, Netzteil von xy, Mainboard je nach Gewichtsklasse); im NAS Bereich hier im Board habe ich da mal drei Szenarien beschrieben von einer 1HD Lösung bis hin zu 16 mit Fibrechannel und GBX. Der Erstaufwand ist erst mal höher, aber du kannst halt an allen Schrauben was drehen ohne wieder neu investieren zu müssen.
Gruß
Sam
Beispiel:
1*kleiner ATOM230 60EUR
1*Min Netzteil 120W 30EUR
1*1GB RAM 15EUR
2*1TB HD 120EUR
1*64MB USB Stick 10EUR
Das selbe kann mit guten/Sparsamen Geräten auch schnell 400EUR verschlingen aber so zum Fühlen reicht das Beispiel mal
Acronis, Ghost, Snapshot,.... arbeiten alle mit einem Inhaltsverzeichnis welches einmal geladen und verglichen wird. Die Dateien selbst geht er dazu nicht an da er eine eigene 2Do Liste daraus baut. Ein NAS auf Basis von FreeNAS wäre da anzuraten; im Preisbereich kommt es nur darauf an welches Mainboard (vermutlich ein Embedded wie bei mir ein PicoPX10000 von Via), dazu ein Gehäuse, Netzteil, RAM, HDs, USB Stick (da residiert dann das OS) fertig; mit 300EUR habe ich da schon ein 2*1TB (=RAID1) NAS gebaut welches im Preis-Stromverbrauch-Nutzen jedem anderen NAS mit mehrere Einschüben mithalten und dank der x86 Plattform kann ich beliebig wechseln was ich will (zur Not käme da auch ein anderes Linux drauf um Web Server oder sonst was zu spielen; noch dazu ist mir wichtig die Komponenten wählen zu können, was bei einem fertigen nie geht (HDs von xy, Netzteil von xy, Mainboard je nach Gewichtsklasse); im NAS Bereich hier im Board habe ich da mal drei Szenarien beschrieben von einer 1HD Lösung bis hin zu 16 mit Fibrechannel und GBX. Der Erstaufwand ist erst mal höher, aber du kannst halt an allen Schrauben was drehen ohne wieder neu investieren zu müssen.
Gruß
Sam
Beispiel:
1*kleiner ATOM230 60EUR
1*Min Netzteil 120W 30EUR
1*1GB RAM 15EUR
2*1TB HD 120EUR
1*64MB USB Stick 10EUR
Das selbe kann mit guten/Sparsamen Geräten auch schnell 400EUR verschlingen aber so zum Fühlen reicht das Beispiel mal
Hi
der Index liegt fern wird aber in einem Stück runtergezogen (Thema Latenzzeit), sprich geht recht flott im Vergleich dazu das du bei 200ms Latenz nur 5 Dateien pro Sekunde überprüfen kannst via DSL direktaustausch. Rsync ist eher selten da es wenige Erfordern. Mußt du halt nachsehen, da SMB/CIFS manchmal auch NFS dominieren, der Rest eher per Zufall. Neuere haben nun eher Mediaprotokolle (Apple, MS, ....) mit dabei um den Home Entertainment Markt zu befüllen; hilft hier aber nicht.
der Index liegt fern wird aber in einem Stück runtergezogen (Thema Latenzzeit), sprich geht recht flott im Vergleich dazu das du bei 200ms Latenz nur 5 Dateien pro Sekunde überprüfen kannst via DSL direktaustausch. Rsync ist eher selten da es wenige Erfordern. Mußt du halt nachsehen, da SMB/CIFS manchmal auch NFS dominieren, der Rest eher per Zufall. Neuere haben nun eher Mediaprotokolle (Apple, MS, ....) mit dabei um den Home Entertainment Markt zu befüllen; hilft hier aber nicht.
Hi
wenn du iSCSI nutzt, dann kannst du nicht mit rsync dann von A nahc B replizieren, da rsync ein Datei Dienst ist, iSCSI aber ein Blocklevel Dienst, sprich er würde dir immer alles syncen, da er von den Veränderungen oben drüber nichts mitbekommt. Eine Erfahrung habe ich mittlerweile mal mit ZFS gemacht (auf Basis von FreeNAS mit ZFS_V13: da ist es möglich Offline Syncs zu erstellen UND er synced nur was sich verändert hat. Die Möglichkeit wird direkt im ZFS (sog zpool) organisiert und stellt bisher die Profilösungen durchaus von der Funktion her in den Schatten. Einer meiner Versuche war mit einem raidz+1 (=RAID5) welche ich auf einen zweiten Rechner verbunden habe, einen sog pool gebildet, welcher als Mirror oben drüber läuft. Wenn ich B abgeschalten habe und einen Tag später wieder angeschalten habe, hat er von den 480GB nur etwa 1GB transferriert/abgeglichen UND blieb auf B weiterhin Online und integer.
Nimm dir mal zwei Maschinen mit min je einer HD und probier's mal. Mit dem jetzigen mußt du wenn dann nur mit einem Dienst (also rsync) arbeiten von allen Stationen dort aus, sonst ziehen die keinen Vorteil von der Snapshot Funktion.
Gruß
Sam
wenn du iSCSI nutzt, dann kannst du nicht mit rsync dann von A nahc B replizieren, da rsync ein Datei Dienst ist, iSCSI aber ein Blocklevel Dienst, sprich er würde dir immer alles syncen, da er von den Veränderungen oben drüber nichts mitbekommt. Eine Erfahrung habe ich mittlerweile mal mit ZFS gemacht (auf Basis von FreeNAS mit ZFS_V13: da ist es möglich Offline Syncs zu erstellen UND er synced nur was sich verändert hat. Die Möglichkeit wird direkt im ZFS (sog zpool) organisiert und stellt bisher die Profilösungen durchaus von der Funktion her in den Schatten. Einer meiner Versuche war mit einem raidz+1 (=RAID5) welche ich auf einen zweiten Rechner verbunden habe, einen sog pool gebildet, welcher als Mirror oben drüber läuft. Wenn ich B abgeschalten habe und einen Tag später wieder angeschalten habe, hat er von den 480GB nur etwa 1GB transferriert/abgeglichen UND blieb auf B weiterhin Online und integer.
Nimm dir mal zwei Maschinen mit min je einer HD und probier's mal. Mit dem jetzigen mußt du wenn dann nur mit einem Dienst (also rsync) arbeiten von allen Stationen dort aus, sonst ziehen die keinen Vorteil von der Snapshot Funktion.
Gruß
Sam