Mit wget Website speichern per Linux script in der Form wie es mit Firefox Menu öffnen Seite speichern klappt
Hallo zusammen
Es dreht sich um die Website Fernsehserien.de
von dort möcht ich mir den Episoden guide downloaden.
per Linux shell script
Den besten erfolg habe ich halt nur manuell geschaft über Firefox und seite speichern (siehe Bild)
Das runter laden ist kein problem aber die richtigen Optionen in dem Befehl zu nehmen schon.
Ist das überhaupt möglich den download über wget zu machen so das ich das Firefoxergebniss bekomme?
Möcht nicht so viel "müll" dabei haben.
mit diesem Befehl
wget -r -k -E http://www.fernsehserien.de/arrow/episodenguide
wird mir ohne probleme ein Verzeichnis fernsehserien.de/arrow/episodenguide.html erstellt
nur ist halt das ergebniss nicht das was ich möchte. (siehe Bild)
Ich hoffe das es machbar ist, wenn nicht dann muss ich halt damit leben
Mit freundlichem Gruß
Jamesb10
Es dreht sich um die Website Fernsehserien.de
von dort möcht ich mir den Episoden guide downloaden.
per Linux shell script
Den besten erfolg habe ich halt nur manuell geschaft über Firefox und seite speichern (siehe Bild)
Das runter laden ist kein problem aber die richtigen Optionen in dem Befehl zu nehmen schon.
Ist das überhaupt möglich den download über wget zu machen so das ich das Firefoxergebniss bekomme?
Möcht nicht so viel "müll" dabei haben.
mit diesem Befehl
wget -r -k -E http://www.fernsehserien.de/arrow/episodenguide
wird mir ohne probleme ein Verzeichnis fernsehserien.de/arrow/episodenguide.html erstellt
nur ist halt das ergebniss nicht das was ich möchte. (siehe Bild)
Ich hoffe das es machbar ist, wenn nicht dann muss ich halt damit leben
Mit freundlichem Gruß
Jamesb10
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 315096
Url: https://administrator.de/forum/mit-wget-website-speichern-per-linux-script-in-der-form-wie-es-mit-firefox-menu-oeffnen-seite-speichern-315096.html
Ausgedruckt am: 06.05.2025 um 17:05 Uhr
10 Kommentare
Neuester Kommentar
Moin,
Versuch es do halt mal lynx oder elinks mit der Option -dump.
Du has das Probem, daß wget nicht wie einBrowser erstmal sich die komplette Seite reinzieht und dann alles zusammensetzt und ggf noch javascript interpretiert, sondern einfach nur die einzelnen Dateien zieht und speichert.
Wenn Du die html-datei im browser ansehen würdest, würdevsie vermutlich eher so aussehen, wie Du es willst.
lks
Versuch es do halt mal lynx oder elinks mit der Option -dump.
Du has das Probem, daß wget nicht wie einBrowser erstmal sich die komplette Seite reinzieht und dann alles zusammensetzt und ggf noch javascript interpretiert, sondern einfach nur die einzelnen Dateien zieht und speichert.
Wenn Du die html-datei im browser ansehen würdest, würdevsie vermutlich eher so aussehen, wie Du es willst.
lks

Powershell
You can pipe the results into export-csv and then you have an clean Excel-List 
Regards
$w = iwr -Uri "http://www.fernsehserien.de/arrow/episodenguide"
$rows = ($w.ParsedHtml.getElementsByTagName('table') | ?{$_.classname -eq 'episodenliste'}).getElementsByTagName('tr') | ?{$_.classname -like '*ep-hover*'}
$rows | %{
$cols = $_.getElementsByTagName('td')
$episodenumber = (($cols | ?{$_.classname -eq 'episodenliste-episodennummer'}).innerText)
$episodetitle = ($cols | ?{$_.classname -eq 'episodenliste-titel'}).innerText
$episodeEA = ($cols | ?{$_.classname -eq 'episodenliste-ea'}).innerText -replace '^(\d{2}\.\d{2}\.\d{4}).*','$1'
$episodeOriginal = ($cols | ?{$_.classname -eq 'episodenliste-originaltitel'}).innerText
$episodeOEA = ($cols | ?{$_.classname -eq 'episodenliste-oea'}).innerText
[pscustomobject] @{"Nummer" = $episodenumber;"Titel"=$episodetitle;"EA"=$episodeEA;"OriginalTitel"=$episodeOriginal;"OEA"=$episodeOEA}
}
Regards

This code can I use in a Linux shell script?
No, this is Powershell (Windows), no one knew that you wanted a bash script. You should change the category of your thread to Bash.I can write you a bash script for this, but not for free
Zitat von @129813:
This code can I use in a Linux shell script?
No, this is Powershell (Windows), no one knew that you wanted a bash script.PowerShell on Linux and Open Source!
lks

That's true but the above code has to be totally modified because of iwr.
Regards
Regards
Zitat von @129813:
That's true but the above code has to be totally modified because of iwr.
That's true but the above code has to be totally modified because of iwr.
Sorry, /me forgot the smiley.
lks

You can do this yourself. Edit the original post on the right side choose category.
wenn Du das dann geschickt mit head, tail und cut und gawk filterst, bekommst Du dann eine fertige CSV. (Bleibt Dir als Übung überlassen).
Full ackn.