derwowusste
Goto Top

Websites als site.mht abspeichern wie im "guten" alten IE

Servus.

Eine kleine, niedliche Frage für den Freitagnachmittag:
Wer wie ich öfter Anleitungen von Websites abspeichern möchte, kennt das Problem:

Speichert man die Site als PDF, so bekommt man Probleme bei größeren Codeblöcken.
Speichert man sie (in Chrome) als .mhtml, bekommt man nicht selten verkrüppeltes Layout, bei dem Text zum Beispiel über anderen Text rüberragt.

Perfekt geht es lediglich im IE11 (Speichern als Webarchiv (.mht)).

Frage: habt Ihr etwas am Start, das gut funktioniert? Ich sehe, dass es Erweiterungen für Chrome gibt, die als .mht speichern ermöglichen, habe diese aber noch nicht getestet.

Content-ID: 607663

Url: https://administrator.de/contentid/607663

Ausgedruckt am: 25.11.2024 um 04:11 Uhr

daswinimram
daswinimram 25.09.2020 um 14:26:28 Uhr
Goto Top
Gute Frage -> so könnte ich administrator.de als MEGA PDF mit 189344 Seiten abspeichern und jedesmal lesen, wenn es internetausfall hat face-smile *lächel

..diese Antwort soll lediglich aufs Wochenende anspielen und spiegelt weder ei noch iq des verfassers..
117471
117471 25.09.2020 um 14:43:43 Uhr
Goto Top
Hallo,

ich benutze das Add-On "Fireshot" für Firefox. Damit kann man Screenshots von (scrollenden) Webseiten machen und als PNG oder PDF speichern.

Keine Ahnung, ob es das auch für Chrome, Edge und Internet Explorer gibt - die habe ich noch nie installiert bzw. bewusst gestartet face-smile

Gruß,
Jörg
DerWoWusste
DerWoWusste 25.09.2020 um 14:51:08 Uhr
Goto Top
Moin altmetaller.

Nee, Screenshot ist nicht ausreichend, ich will auch Text rauskopieren können, ohne noch OCR machen zu müssen.
117471
117471 25.09.2020 aktualisiert um 14:57:22 Uhr
Goto Top
Hallo,

die Advanced-Version bietet auch ein "Capture and Edit": Get Fireshot

AFAIK gibt es auch einen kostenlosen Trial-Zeitraum und eine 30-Tage-Money-Back-Garantie.

Gruß,
Jörg
DerWoWusste
DerWoWusste 25.09.2020 um 15:06:14 Uhr
Goto Top
Es geht nicht ums Editieren, sondern ums rauskopieren von Text. Kann Fireshot nicht.
daswinimram
daswinimram 25.09.2020 aktualisiert um 15:11:49 Uhr
Goto Top
genügt dir hier evtl die Windows Druckfunktion XPS ? evtl noch mit dem alten ghostscript von annodazumal als interpreter?
AlRoDiSa
Lösung AlRoDiSa 25.09.2020 aktualisiert um 15:29:33 Uhr
Goto Top
Für CHROME und FIREFOX gibt es die Erweiterung "Save Page WE" - arbeite ich fast jeden Tag mit...

Webseite wird als .html gespeichert, durch verschiedene Optionen kann man fein abstimmen was und wie gespeichert wird.

Es gibt auch noch einige andere Erweiterungen wie diese...

Viel Erfolg
DerWoWusste
DerWoWusste 25.09.2020 um 15:30:18 Uhr
Goto Top
Nee, XPS hat die gleichen Probleme wie PDF: was nicht sichtbar ist (horizontaler Scrollbalken an Codeblöcken zum, Beispiel), wird nicht gedruckt.
daswinimram
daswinimram 25.09.2020 um 15:38:36 Uhr
Goto Top
Zitat von @DerWoWusste:

Nee, XPS hat die gleichen Probleme wie PDF: was nicht sichtbar ist (horizontaler Scrollbalken an Codeblöcken zum, Beispiel), wird nicht gedruckt.

hätte ich in der Schule damals aufgepassst, wäre ich jetzt ein ProgrammierGenie (müsste also nicht Netgear Genie Serie kaufen*lach) .. und könnte dem XPS dazu verhelfen ,zu erkennen, dass hier programmcodeblock startet, +inhalt als txt auslesen... hmm :/
Inf1d3l
Inf1d3l 25.09.2020 um 15:38:44 Uhr
Goto Top
Blöde Frage: Den IE11 gibt es noch und wird es noch lange geben. Warum was neues?
DerWoWusste
DerWoWusste 25.09.2020 aktualisiert um 15:46:53 Uhr
Goto Top
@AlRoDiSa
Sehr schön, läuft schon einmal besser als die beiden anderen Erweiterungen, die man findet, wenn man in Chromes Webstore nach "save as .mht" sucht. Allerdings heult er regelmäßig in den Tests rum, das gewisse Ressourcen noch nicht geladen wurden (obwohl durch die gesamte Site schon durchgescrollt wurde und alles da ist UND auch in der abgespeicherten Datei zu sehen ist). Aber damit kann ich leben.
Ich teste mal weiter.

@luci0815:
Der IE ist abgekündigt, ab nächstes Jahr endgültig kein Support mehr von MS.
145916
145916 25.09.2020 um 16:36:28 Uhr
Goto Top
C.R.S.
C.R.S. 25.09.2020 um 16:43:57 Uhr
Goto Top
Zitat von @DerWoWusste:

@AlRoDiSa
Sehr schön, läuft schon einmal besser als die beiden anderen Erweiterungen, die man findet, wenn man in Chromes Webstore nach "save as .mht" sucht.

Schau dir mal SingleFile bzw. SingleFileZ an (je nachdem, ob Du mit sonstigen Entpackern in das Archiv greifen willst), dasselbe Prinzip. Mit MHT beschäftigt sich kaum ein Addon-Entwickler noch, weil IE eben wegfällt.

Grüße
Richard
Inf1d3l
Inf1d3l 25.09.2020 aktualisiert um 17:40:21 Uhr
Goto Top
@DerWoWusste:

Zitat von @DerWoWusste:
@luci0815:
Der IE ist abgekündigt, ab nächstes Jahr endgültig kein Support mehr von MS.

https://www.heise.de/news/Microsoft-kuendigt-Support-Ende-fuer-den-Inter ...

Da einige Unternehmen ihre Geschäftsbereiche aber auf IE 11 aufgebaut haben, sollen diese auch weiterhin nutzbar sein. Legacy-IE-11-Apps laufen dann in einem Internet-Explorer-Mode in Edge. "Statt umständlich manche Anwendungen im alten Browser und andere in Edge öffnen zu müssen, geht das künftig in unterschiedlichen Tabs."

Wobei es den IE-Mode im neuen Edge schon gibt und problemlos geht. MS stellt nur den Office und Teams etc. - Support für den IE ein, aber nicht den IE selbst. So habe ich es verstanden.
DerWoWusste
DerWoWusste 25.09.2020, aktualisiert am 28.09.2020 um 09:22:47 Uhr
Goto Top
Hallo Richard.
Das we-save-Add-in speichert als HTML, das ist natürlich noch besser. Ich schau mir deinen Vorschlag Montag an, danke.
Henere
Henere 26.09.2020 um 01:01:48 Uhr
Goto Top
Servus. Schau mal in die aktuelle ct. S154

Grüße Henere
DerWoWusste
DerWoWusste 28.09.2020 um 09:16:51 Uhr
Goto Top
@Henere
Mit dem aktuellen wget (bezogen über chocolatey) funktioniert die Syntax der CT nicht. Habe auch wenig Lust, die Kommandozeile zu bemühen.
Ich teste We Save noch ein bisschen und werde wohl dabei bleiben.
DerWoWusste
DerWoWusste 28.09.2020 um 09:24:56 Uhr
Goto Top
Moin Richard.

SingleFilez funktioniert gut, aber der Anschauende muss es ebenso als Extension installiert haben - das ist ein Nachteil. Größenvorteile gegenüber We Save, das nichts weiter benötigt, hat es auch nicht (in meinen Tests), also gewinnt hier We Save.

@145916 wg. HTTrack - kenn ich. Ich finde eine Browserextension aber besser, zumindest die alte Version, die ich kenne hatte noch keine.