derwowusste
Goto Top

Websites als site.mht abspeichern wie im "guten" alten IE

Servus.

Eine kleine, niedliche Frage für den Freitagnachmittag:
Wer wie ich öfter Anleitungen von Websites abspeichern möchte, kennt das Problem:

Speichert man die Site als PDF, so bekommt man Probleme bei größeren Codeblöcken.
Speichert man sie (in Chrome) als .mhtml, bekommt man nicht selten verkrüppeltes Layout, bei dem Text zum Beispiel über anderen Text rüberragt.

Perfekt geht es lediglich im IE11 (Speichern als Webarchiv (.mht)).

Frage: habt Ihr etwas am Start, das gut funktioniert? Ich sehe, dass es Erweiterungen für Chrome gibt, die als .mht speichern ermöglichen, habe diese aber noch nicht getestet.

Content-Key: 607663

Url: https://administrator.de/contentid/607663

Printed on: April 25, 2024 at 05:04 o'clock

Member: daswinimram
daswinimram Sep 25, 2020 at 12:26:28 (UTC)
Goto Top
Gute Frage -> so könnte ich administrator.de als MEGA PDF mit 189344 Seiten abspeichern und jedesmal lesen, wenn es internetausfall hat face-smile *lächel

..diese Antwort soll lediglich aufs Wochenende anspielen und spiegelt weder ei noch iq des verfassers..
Mitglied: 117471
117471 Sep 25, 2020 at 12:43:43 (UTC)
Goto Top
Hallo,

ich benutze das Add-On "Fireshot" für Firefox. Damit kann man Screenshots von (scrollenden) Webseiten machen und als PNG oder PDF speichern.

Keine Ahnung, ob es das auch für Chrome, Edge und Internet Explorer gibt - die habe ich noch nie installiert bzw. bewusst gestartet face-smile

Gruß,
Jörg
Member: DerWoWusste
DerWoWusste Sep 25, 2020 at 12:51:08 (UTC)
Goto Top
Moin altmetaller.

Nee, Screenshot ist nicht ausreichend, ich will auch Text rauskopieren können, ohne noch OCR machen zu müssen.
Mitglied: 117471
117471 Sep 25, 2020 updated at 12:57:22 (UTC)
Goto Top
Hallo,

die Advanced-Version bietet auch ein "Capture and Edit": Get Fireshot

AFAIK gibt es auch einen kostenlosen Trial-Zeitraum und eine 30-Tage-Money-Back-Garantie.

Gruß,
Jörg
Member: DerWoWusste
DerWoWusste Sep 25, 2020 at 13:06:14 (UTC)
Goto Top
Es geht nicht ums Editieren, sondern ums rauskopieren von Text. Kann Fireshot nicht.
Member: daswinimram
daswinimram Sep 25, 2020 updated at 13:11:49 (UTC)
Goto Top
genügt dir hier evtl die Windows Druckfunktion XPS ? evtl noch mit dem alten ghostscript von annodazumal als interpreter?
Member: AlRoDiSa
Solution AlRoDiSa Sep 25, 2020 updated at 13:29:33 (UTC)
Goto Top
Für CHROME und FIREFOX gibt es die Erweiterung "Save Page WE" - arbeite ich fast jeden Tag mit...

Webseite wird als .html gespeichert, durch verschiedene Optionen kann man fein abstimmen was und wie gespeichert wird.

Es gibt auch noch einige andere Erweiterungen wie diese...

Viel Erfolg
Member: DerWoWusste
DerWoWusste Sep 25, 2020 at 13:30:18 (UTC)
Goto Top
Nee, XPS hat die gleichen Probleme wie PDF: was nicht sichtbar ist (horizontaler Scrollbalken an Codeblöcken zum, Beispiel), wird nicht gedruckt.
Member: daswinimram
daswinimram Sep 25, 2020 at 13:38:36 (UTC)
Goto Top
Zitat von @DerWoWusste:

Nee, XPS hat die gleichen Probleme wie PDF: was nicht sichtbar ist (horizontaler Scrollbalken an Codeblöcken zum, Beispiel), wird nicht gedruckt.

hätte ich in der Schule damals aufgepassst, wäre ich jetzt ein ProgrammierGenie (müsste also nicht Netgear Genie Serie kaufen*lach) .. und könnte dem XPS dazu verhelfen ,zu erkennen, dass hier programmcodeblock startet, +inhalt als txt auslesen... hmm :/
Member: Inf1d3l
Inf1d3l Sep 25, 2020 at 13:38:44 (UTC)
Goto Top
Blöde Frage: Den IE11 gibt es noch und wird es noch lange geben. Warum was neues?
Member: DerWoWusste
DerWoWusste Sep 25, 2020 updated at 13:46:53 (UTC)
Goto Top
@AlRoDiSa
Sehr schön, läuft schon einmal besser als die beiden anderen Erweiterungen, die man findet, wenn man in Chromes Webstore nach "save as .mht" sucht. Allerdings heult er regelmäßig in den Tests rum, das gewisse Ressourcen noch nicht geladen wurden (obwohl durch die gesamte Site schon durchgescrollt wurde und alles da ist UND auch in der abgespeicherten Datei zu sehen ist). Aber damit kann ich leben.
Ich teste mal weiter.

@luci0815:
Der IE ist abgekündigt, ab nächstes Jahr endgültig kein Support mehr von MS.
Mitglied: 145916
145916 Sep 25, 2020 at 14:36:28 (UTC)
Goto Top
Member: C.R.S.
C.R.S. Sep 25, 2020 at 14:43:57 (UTC)
Goto Top
Zitat von @DerWoWusste:

@AlRoDiSa
Sehr schön, läuft schon einmal besser als die beiden anderen Erweiterungen, die man findet, wenn man in Chromes Webstore nach "save as .mht" sucht.

Schau dir mal SingleFile bzw. SingleFileZ an (je nachdem, ob Du mit sonstigen Entpackern in das Archiv greifen willst), dasselbe Prinzip. Mit MHT beschäftigt sich kaum ein Addon-Entwickler noch, weil IE eben wegfällt.

Grüße
Richard
Member: Inf1d3l
Inf1d3l Sep 25, 2020 updated at 15:40:21 (UTC)
Goto Top
@DerWoWusste:

Zitat von @DerWoWusste:
@luci0815:
Der IE ist abgekündigt, ab nächstes Jahr endgültig kein Support mehr von MS.

https://www.heise.de/news/Microsoft-kuendigt-Support-Ende-fuer-den-Inter ...

Da einige Unternehmen ihre Geschäftsbereiche aber auf IE 11 aufgebaut haben, sollen diese auch weiterhin nutzbar sein. Legacy-IE-11-Apps laufen dann in einem Internet-Explorer-Mode in Edge. "Statt umständlich manche Anwendungen im alten Browser und andere in Edge öffnen zu müssen, geht das künftig in unterschiedlichen Tabs."

Wobei es den IE-Mode im neuen Edge schon gibt und problemlos geht. MS stellt nur den Office und Teams etc. - Support für den IE ein, aber nicht den IE selbst. So habe ich es verstanden.
Member: DerWoWusste
DerWoWusste Sep 25, 2020, updated at Sep 28, 2020 at 07:22:47 (UTC)
Goto Top
Hallo Richard.
Das we-save-Add-in speichert als HTML, das ist natürlich noch besser. Ich schau mir deinen Vorschlag Montag an, danke.
Member: Henere
Henere Sep 25, 2020 at 23:01:48 (UTC)
Goto Top
Servus. Schau mal in die aktuelle ct. S154

Grüße Henere
Member: DerWoWusste
DerWoWusste Sep 28, 2020 at 07:16:51 (UTC)
Goto Top
@Henere
Mit dem aktuellen wget (bezogen über chocolatey) funktioniert die Syntax der CT nicht. Habe auch wenig Lust, die Kommandozeile zu bemühen.
Ich teste We Save noch ein bisschen und werde wohl dabei bleiben.
Member: DerWoWusste
DerWoWusste Sep 28, 2020 at 07:24:56 (UTC)
Goto Top
Moin Richard.

SingleFilez funktioniert gut, aber der Anschauende muss es ebenso als Extension installiert haben - das ist ein Nachteil. Größenvorteile gegenüber We Save, das nichts weiter benötigt, hat es auch nicht (in meinen Tests), also gewinnt hier We Save.

@145916 wg. HTTrack - kenn ich. Ich finde eine Browserextension aber besser, zumindest die alte Version, die ich kenne hatte noch keine.