majcho
Goto Top

Wget mehrere gleichlautende index.html von mehreren Unterverzeichnissen lesen umbennen und offline speichern

Moin moin,

habe bei Strato einen Online-Speicher auch Hidrive genannt. Strato Hidrive speichert in jedem Verzeichniss eine index.html mit dem jeweiligen Inhalt des Verzeichnisses ab. Jetzt möchte ich gerne mit wget diese index.html lesen um meine Daten abzugleichen. Dafür vewende ich folgenden code:

wget --mirror --no-directories --accept=index.html "https://bn:pw@webdav.hidrive.strato.com/users/Sicherung/"

--mirror (oder -m) lade ich mir die gesamte Seite herunter beschränke das jedoch mit
--accept=index.html auf die Datei "index.html", mit dem Befehl
--no-directories (oder -nd) speicher ich diese index.html offline in ein einziges Verzeichniss ab ohne offline mehrere Verzeichnisse zu erstellen (davon habe ich hunderte).

Leider finde ich keine Lösung wie ich diese index.html bei jedem Ladevorgang entweder umbenenne oder verbinde. Denn die index.html wird für jedes Unterverzeichni neu geschrieben und die alte überschrieben.
Kommentar vom Moderator Biber am 28.06.2011 um 19:56:10 Uhr
Wget mehrere gleichlautende index.html von mehreren Unterverzeichnissen lesen umbennen und offline speichern
Set /a rgc+=1
#766

Content-ID: 168729

Url: https://administrator.de/contentid/168729

Ausgedruckt am: 22.11.2024 um 21:11 Uhr

Lochkartenstanzer
Lochkartenstanzer 28.06.2011 um 13:37:46 Uhr
Goto Top
Mit -O kann man die Ausgabedatei angeben, nur wird Dir das so nichts nutzen, eil Du --mirror verwendest und nicht jedes index.html mit einem eigenen eigenen wget holst. Wenn Dir eine einzige Datei langt, in der alle index.html zusammengefaßt sind, sollte es also -O tun. ansonsten mußt Du Dir ein script schreiben, daß dir Verzeichnishierarchie nach index.htmls durchsucht und dann jedes einzeln holt und unter einen eigenen Namen ablegt.
majcho
majcho 28.06.2011 um 14:13:03 Uhr
Goto Top
Die Option -o überschreibt die index.html immer wieder von neuem. Geht es denn auch wenn das ganze wie im DOS mit >> oder in dem der Inhalt gesammelt und anschließend in eine .log Datei ausgegeben?
Lochkartenstanzer
Lochkartenstanzer 28.06.2011 um 14:34:54 Uhr
Goto Top
nicht
 -o 
sondern
 -O 


Du kannst natürlich mit
 wget -O zieldatei.txt  (weitere Optionen) xyz.z/index.html 
oder
 wget -O - (weitere Optionen) xyz.z/index.html | tee -a zieldatei.txt 
alles in eine Datei reinkippen.
majcho
majcho 28.06.2011 um 15:14:49 Uhr
Goto Top
Zitat von @Lochkartenstanzer:
nicht
 -o 
sondern
 -O 


Genau das was ich braucht!!!

 -O 

Danke auch für den Tipp mit
 tee -a zieldatei.txt  
Lochkartenstanzer
Lochkartenstanzer 28.06.2011 um 16:28:49 Uhr
Goto Top
Kommentar ignorieren. War falsches Fenster.
Lochkartenstanzer
Lochkartenstanzer 28.06.2011 um 20:47:51 Uhr
Goto Top
 
--no-clobber

wäre noch eine Option, falls Du nicht eine Datei, sondern viele einzelne Dateien haben willst. Diese werden dann durchnummeriert.
majcho
majcho 28.06.2011 um 21:26:25 Uhr
Goto Top
Zitat von @Lochkartenstanzer:
 
> --no-clobber
> 

wäre noch eine Option, falls Du nicht eine Datei, sondern viele einzelne Dateien haben willst. Diese werden dann
durchnummeriert.

Damit habe ich es auch schon probiert, die Kombination -m, -nd und -nc funktioniert nicht. Mit diesem Tee unter DOS (http://users.csc.calpoly.edu/~bfriesen/software/console.shtml) habe ich auch kein brauchbares Ergebnis erzielt. Somit blieb nur diese Variante:
 wget --no-check-certificate -O index.html -nd --mirror --accept=index.html 
Lochkartenstanzer
Lochkartenstanzer 28.06.2011 um 22:24:51 Uhr
Goto Top
Nimm cygwin von http://cygwin.com

Damit hast Du Deine gewohnte Unix/Linux/BSD-Umgebung.