festus94
Goto Top

Webseite als PDF speichern

Hallo zusammen,

seit einiger Zeit versuche ich erfolglos, beliebige Webseiten 1:1 als PDF-Dokument abzuspeichern (zur Klarheit: Ich rede von einer einzelnen Seite, nicht von einem ganzen Online-Auftritt.). Vom Prinzip her ist das ja kein Problem. Zum Beispiel habe ich den Adobe PDF-Drucker installiert. Ich habe gerade mal Administrator.de damit gedruckt. Das Ergebnis ist wie immer mehr als beschämend:


99ada7e666d3fc913aac6a36092d16fb


Dass das Problem in der voreingestellten "Papiergröße" A4 liegt, ist mir einleuchtend, aber ich möchte, dass die PDF eben genau so breit und hoch ist, wie es die Homepage auch ist. Erstens weiß ich nicht, wie breit die Homepage tatsächlich ist, und zweitens habe ich keine Lust, jedes Mal die Einstellungen anpassen zu müssen.

Kennt Ihr ein Programm, was in der Lage ist, mein Vorhaben umzusetzen? Obwohl ich denke, dass mein Vorhaben nicht wirklich weltfremd ist, habe ich leider keine passende Software gefunden. Dass der Adobe PDF-Drucker nicht dafür entwickelt wurde, ist klar, aber es muss doch ein passendes Tool geben... face-smile

Für Vorschläge jeglicher Art wäre ich sehr dankbar.


Viele Grüße, und einen schönen letzten Weihnachtstag!

tbnwadm

Content-Key: 225340

Url: https://administrator.de/contentid/225340

Printed on: April 24, 2024 at 21:04 o'clock

Member: TheAndy
TheAndy Dec 25, 2013, updated at Dec 26, 2013 at 16:05:06 (UTC)
Goto Top
Das mit der Breite von einer Homepage ist so ne Sache, weil viele Webmaster ihre Seiten so erstellen, dass sie dynamisch an vielen Bildschirmauflösungen funktionieren. Wenn du die Breite in deinem Programm einstellen kannst, würde ich 1024px nehmen, die meisten Seiten sind darauf optimiert. Vielleicht hilft auch schon A4 Querformat, aber das ist mehr ein Walkaround und keine wirkliche Lösung für dein Problem.

Frohe Weihnachten,
Andy
Member: Festus94
Festus94 Dec 25, 2013 at 22:07:43 (UTC)
Goto Top
Hi Andy,

diesen Effekt habe ich auch schon beobachtet. Ich habe in der PDF dann die Handy-Version der Homepage gehabt. Dass die Webseitenbreite ein Problem ist, verstehe ich, aber im Prinzip muss man doch nur die Breite des äußersten Containers übernehmen. Klar kann ich einfach einen höheren Wert für die Breite eintragen, aber erstens muss ich das bei der Höhe dann auch machen (und die ist ja wirklich immer verschieden) und zweitens habe ich dann viel weiße Fläche.

Am Liebsten wäre mir tatsächlich 1:1. face-smile

Dir auch frohe Weihnachten!


tbnwadm
Member: colinardo
colinardo Dec 26, 2013 updated at 16:05:02 (UTC)
Goto Top
Hallo Andy,
ich nutze für solche Fälle SnagIt. Dort habe ich mir ein Profil angelegt welches die ganze Seite captured, die Seite auf die Seitenbreite von A4 skaliert und an den PDF-Drucker sendet. Das ganze geht vollautomatisch, nur die "Druck"-Taste betätigen, in die Seite klicken, fertig.
Frohe Weihnachten
Ebenso
Grüße Uwe
Member: Lochkartenstanzer
Solution Lochkartenstanzer Dec 26, 2013 updated at 16:04:53 (UTC)
Goto Top
Moin,

Im Prinzip kann man das Poblem mit Browser-Druckvorschau und PDF-Drucker erschlagen.

z.b. in Mozilla einfach ind er Druckvorschau die Skalierung passen wählen und dann soltle es einigermaße vernünftig aussehen.

buon natale

lks
Member: Driver401
Driver401 Dec 26, 2013 updated at 16:05:10 (UTC)
Goto Top
"Print Pages to PDF" ist ein Addon für Firefox - und es sollte genau Deine Wünsche erfüllen. Zumindest erstellt es die PDF's genauso wie sie am Bildschirm angezeigt werden - und es ist noch dazu einfach zu bedienen, so dass ich das sogar einigen meiner User schon installiert habe.
http://pp2pdf.tipido.net/index.php/en/convert_actual_page.html

Probiers aus.

Weihnachtsgruß
Jürgen
Member: Festus94
Festus94 Dec 26, 2013 updated at 12:32:09 (UTC)
Goto Top
Hallo zusammen,

danke für Eure Hilfe! face-smile

@ Uwe: SnagIt ist aber im Endeffekt nur ein Tools, welches Bildschirminhalte abknipst, oder habe ich das falsch verstanden? Ich möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet. Außerdem ist der Preis ziemlich happig für dieses Vorhaben.

@ LKS: Das wäre dann aber auch nur grob, und wenn die Seite eigene Style-Vorgaben für Drucker vorgibt, funktioniert es auch nicht, oder?

@ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs. Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?

Ich wünsche noch einen schönen Weihnachtstag! face-smile


Grüße
tbnwadm
Member: Driver401
Driver401 Dec 26, 2013 updated at 16:05:15 (UTC)
Goto Top
Zitat von @Festus94:
@ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs.

kein Kommentar dazu

Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die
ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?

da kann man schon einiges einstellen - aber das hat sich dann ja sowieso für Dich erübrigt face-wink


weihnachtliche Grüße
Jürgen
Member: Festus94
Festus94 Dec 26, 2013 at 12:37:25 (UTC)
Goto Top
Zitat von @Driver401:

> Zitat von @Festus94:
> @ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs.

kein Kommentar dazu

Seit Version 9 bin ich wieder beim IE, da der FF seit Version 14 immer langsamer wurde, und hinterher mehr Zeit gekostet, als Freude gebracht hat. Und bei Version 10/11 des IE kann man echt nicht meckern.

Zitat von @Driver401:

> Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?

da kann man schon einiges einstellen - aber das hat sich dann ja sowieso für Dich erübrigt face-wink


weihnachtliche Grüße
Jürgen

Danke trotzdem. face-wink


VG
tbnwadm
Member: colinardo
colinardo Dec 26, 2013 updated at 16:05:19 (UTC)
Goto Top
Zitat von @Festus94:
@ Uwe: SnagIt ist aber im Endeffekt nur ein Tools, welches Bildschirminhalte abknipst, oder habe ich das falsch verstanden? Ich
möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet. Außerdem ist der Preis ziemlich happig für dieses
Vorhaben.
Habe das genommen weil ich's sowieso auf meinem Rechner drauf hab. Bei Snagit lässt sich nur der eigentliche Inhalt der Webseite automatisch inklusive Scrolling aufnehmen, dabei bleibt die Webseite so wie sie dargestellt wird, der Rest des Desktop wird selbstverständlich ignoriert. Für den Preis bietet es halt noch wesentlich mehr, aber das muss jeder selber entscheiden. Testversion ziehen und selber eine Meinung bilden face-wink

Grüße Uwe
Member: Festus94
Festus94 Dec 26, 2013 at 12:51:57 (UTC)
Goto Top
Alles klar, dann werd' ich's mir mal ansehen, danke. face-wink

Aber trotzdem kann ich mich irgendwie nicht so ganz damit anfreunden, für so ein simples Vorhaben groß ein Programm kaufen zu müssen... face-sad


Grüße
tbnwadm
Member: Lochkartenstanzer
Solution Lochkartenstanzer Dec 26, 2013 updated at 16:05:25 (UTC)
Goto Top
Zitat von @Festus94:

Ich möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet.

Du unterliegst dem Irrtum, daß es sowas wie ein default-Ansicht einer Webseite gibt. Die gibt es nicht. weil jeder renderer (oder browser) seine eigene Sicht hat wie eine Webseite auszusehen hat, und das zusätzlich noch abhängigvon der Bildschirmgröße. Jedes Add-on kann das layout auch noch zusätzlich verändern, so daß im Endeffekt die Webseite zig verschiedene Darstellugen hat.

Woher soll ein programm XY nun wissen, welches die für Dich richtige einstellung ist?

Was Du brauchts ist im Prinzip ein programm, daß die Seite genau so rendert, wie sie Dein Browser darstellt udn das dann in ein PDF wandelt. Damit landen wir wieder genau beim Browser: Du brauchst also ein Add-on, daß den Render-Puffer des browsers ausliest und "druckt" oder du nimmst einfach die Druckfunktion Deines Drowsers, wenn Du nich tmirt Screenshots arbeiten willst. face-smile

lks
Member: Festus94
Festus94 Dec 26, 2013 at 14:11:31 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:

> Zitat von @Festus94:
>
> Ich möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet.

Du unterliegst dem Irrtum, daß es sowas wie ein default-Ansicht einer Webseite gibt. Die gibt es nicht. weil jeder renderer
(oder browser) seine eigene Sicht hat wie eine Webseite auszusehen hat, und das zusätzlich noch abhängigvon der
Bildschirmgröße. Jedes Add-on kann das layout auch noch zusätzlich verändern, so daß im Endeffekt die
Webseite zig verschiedene Darstellugen hat.

Hi LKS,

da hast Du Recht, aber ist es nicht so, dass es bei jeder Seite eine maximale Breite gibt? Wenn ich mit zum Beispiel eine Seite ansehe, die von mir aus mit Bootstrap erstellt wurde, dann ist die "größte Form" dieser Seite üblicherweise bei 1200px in der Breite. So eine "größte Variante" gibt es doch im Prinzip immer, oder irre ich da? Außerdem bliebe ja noch das Problem, dass die Höhe immer variiert.

Zitat von @Lochkartenstanzer:

Woher soll ein programm XY nun wissen, welches die für Dich richtige einstellung ist?

Was Du brauchts ist im Prinzip ein programm, daß die Seite genau so rendert, wie sie Dein Browser darstellt udn das dann in
ein PDF wandelt. Damit landen wir wieder genau beim Browser: Du brauchst also ein Add-on, daß den Render-Puffer des browsers
ausliest und "druckt" oder du nimmst einfach die Druckfunktion Deines Drowsers, wenn Du nich tmirt Screenshots arbeiten
willst. face-smile

Genau. In der Regel wird ja dann auf die IE-Engine zurückgegriffen, da sie den Programmierern die entsprechenden Schnittstellen bietet. Im Prinzip kann ich ja mit der Druckfunktion arbeiten, aber dann bräuchte ich eine Möglichkeit, genau Breite und Höhe der Seite auszulesen. Dann müsste ich zum Beispiel beim Adobe PDF-Drucker jedes Mal die Werte anpassen.

Gibt es denn eine einfache Möglichkeit, die "Maße" einer Seite auszulesen, ohne den halben Quelltext auseinanderzunehmen?

Danke für Eure Hilfe! face-smile


tbnwadm
Member: Lochkartenstanzer
Solution Lochkartenstanzer Dec 26, 2013 updated at 16:05:28 (UTC)
Goto Top
Zitat von @Festus94:
So eine "größte Variante" gibt es doch im Prinzip immer,

Nein (abhängig von der Webseite natürlich)

oder irre ich da?

Ja

Genau. In der Regel wird ja dann auf die IE-Engine zurückgegriffen, da sie den Programmierern die entsprechenden
Schnittstellen bietet.

Das Problem ist aber, welche Paramter (z.b. Darstellungsbreite) der Engine übergeben werden. Die kann aber durchaus von Deiner Bildschirmdarstellung abweichen.

Gibt es denn eine einfache Möglichkeit, die "Maße" einer Seite auszulesen, ohne den halben Quelltext
auseinanderzunehmen?

Eben nicht, wie ich oben schon erläutert habe.

lks
Member: Festus94
Festus94 Dec 26, 2013 at 14:40:59 (UTC)
Goto Top
Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung nicht mehr verändert. face-wink

Also unter'm Strich entweder grob oder gar nicht? face-sad


tbnwadm
Member: Lochkartenstanzer
Solution Lochkartenstanzer Dec 26, 2013 updated at 16:05:31 (UTC)
Goto Top
Zitat von @Festus94:

Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung nicht
mehr verändert. face-wink

Dann kann ich dir eine bauen, die egal wie große Du das Fenster horizontal oder vertikal machst, dieses immer voll uund ganz mit Text ausgefüllt wird. face-smile

Klar spätestens dann, wenn der ganze Content in "eine Zeile" paßt, wird da nichts mehr kommen. Das Probem ist aber, daß Du nie weißt, welche Größen der "Webseitenbauer" vorgesehen hat.

Im Endeffekt läuft es darauf hinaus, daß Du der rendering-engine sagen mußt, für welche Auflösung sie rendern soll und dementsprechend sieht es mal gut und mal nicht so gut aus.

Ich persönlich benutze einfach die Druckvorschau von Firefox mit manuell angepaßter Skalierung, wobei 60% bei A4-hoch und 80% bei A4-quer meistens gut passen.

lks
Member: Festus94
Festus94 Dec 26, 2013 at 16:04:28 (UTC)
Goto Top
Zitat von @Lochkartenstanzer:

> Zitat von @Festus94:
>
> Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung
nicht
> mehr verändert. face-wink

Dann kann ich dir eine bauen, die egal wie große Du das Fenster horizontal oder vertikal machst, dieses immer voll uund ganz
mit Text ausgefüllt wird. face-smile

Klar, das kann ich auch... face-big-smile

Zitat von @Lochkartenstanzer:

Klar spätestens dann, wenn der ganze Content in "eine Zeile" paßt, wird da nichts mehr kommen. Das Probem ist
aber, daß Du nie weißt, welche Größen der "Webseitenbauer" vorgesehen hat.

Im Endeffekt läuft es darauf hinaus, daß Du der rendering-engine sagen mußt, für welche Auflösung sie
rendern soll und dementsprechend sieht es mal gut und mal nicht so gut aus.

Ich persönlich benutze einfach die Druckvorschau von Firefox mit manuell angepaßter Skalierung, wobei 60% bei A4-hoch
und 80% bei A4-quer meistens gut passen.

Alles klar, dann werde ich es mal auf die Art versuchen. Danke für Deine Hilfe! face-smile

Noch einen schönen letzten Weihnachtsabend!

Grüße
tbnwadm
Member: hackbrett2014
hackbrett2014 Oct 23, 2014 at 08:05:01 (UTC)
Goto Top
Ihr Lieben!
Ich will die Diskussion nochmal befeueren. Nicht um IE oder FF, sondern um das Thema „Website zu pdf“: Screenshots, also das Sichern von Bildschirminhalten in Pixelgrafiken kommt für meinen Anwendungsbedarf nicht in Frage, da die finalen PDFs durchsuchbar sein sollen, der Text markiert und kopiert werden können soll.

Das von Jürgen vorgeschlagene „Print pages to pdf“ erstellt m.E. niemals das, was auch ich suche. Bei den englischsprachigen Online-Dienstleistern wird es als „one long page“ bezeichnet. Bei den „Print pages to pdf“-Einstellungen wird nicht nur die Breite des Ausgabeformates, sondern immer auch die Länge angegeben ):

Bei pdfmyurl.com und crowdpdf und vielen anderen Online-Dienstleistern sieht das mittlerweile anders aus. Sie bieten in der Bezahlvariante die Option „one long page“ an, also im Prinzip: nicht umsonst (finde ich unproblematisch) und super. Aber: Ich habe 400 Seiten in einer Exceltabelle, die ich gerne als batch von einem Programm oder einem Onlinedienst distillt hätte. Ob man bei Lletzteren eine Liste URLs einspeisen kann, versuche ich gerade herauszufinden. Aber an und für sich kann ich es immernoch nicht glauben, dass das ein derartiger Krampf ist.

Hat inzwischen jmd. eine bessere Lösung ?

PS: Auch eine fast gute Lösung: mit der congenialen Erweiterung "Grab them all" und per txt.-Import hunderte von Websites in jpg oder png ichern lassen (jawoll, mit Sroll und in one long page) und diese dann im Acrobat durch den OCR jagen und als "durchsuchbares Bild (exakt)" abspeichern. Geschätzte 87% der Buchstaben werden richtig erkannt, wegen der restlichen 13% kommt die Methode nicht in Frage, obwohl alle Prozesse als batch ratz-fatz gehen. Cooles Teil: http://rafal.zelazko.info/2008/06/23/easy-screenshot-of-many-sites/