Webseite als PDF speichern
Hallo zusammen,
seit einiger Zeit versuche ich erfolglos, beliebige Webseiten 1:1 als PDF-Dokument abzuspeichern (zur Klarheit: Ich rede von einer einzelnen Seite, nicht von einem ganzen Online-Auftritt.). Vom Prinzip her ist das ja kein Problem. Zum Beispiel habe ich den Adobe PDF-Drucker installiert. Ich habe gerade mal Administrator.de damit gedruckt. Das Ergebnis ist wie immer mehr als beschämend:
Dass das Problem in der voreingestellten "Papiergröße" A4 liegt, ist mir einleuchtend, aber ich möchte, dass die PDF eben genau so breit und hoch ist, wie es die Homepage auch ist. Erstens weiß ich nicht, wie breit die Homepage tatsächlich ist, und zweitens habe ich keine Lust, jedes Mal die Einstellungen anpassen zu müssen.
Kennt Ihr ein Programm, was in der Lage ist, mein Vorhaben umzusetzen? Obwohl ich denke, dass mein Vorhaben nicht wirklich weltfremd ist, habe ich leider keine passende Software gefunden. Dass der Adobe PDF-Drucker nicht dafür entwickelt wurde, ist klar, aber es muss doch ein passendes Tool geben...
Für Vorschläge jeglicher Art wäre ich sehr dankbar.
Viele Grüße, und einen schönen letzten Weihnachtstag!
tbnwadm
seit einiger Zeit versuche ich erfolglos, beliebige Webseiten 1:1 als PDF-Dokument abzuspeichern (zur Klarheit: Ich rede von einer einzelnen Seite, nicht von einem ganzen Online-Auftritt.). Vom Prinzip her ist das ja kein Problem. Zum Beispiel habe ich den Adobe PDF-Drucker installiert. Ich habe gerade mal Administrator.de damit gedruckt. Das Ergebnis ist wie immer mehr als beschämend:
Dass das Problem in der voreingestellten "Papiergröße" A4 liegt, ist mir einleuchtend, aber ich möchte, dass die PDF eben genau so breit und hoch ist, wie es die Homepage auch ist. Erstens weiß ich nicht, wie breit die Homepage tatsächlich ist, und zweitens habe ich keine Lust, jedes Mal die Einstellungen anpassen zu müssen.
Kennt Ihr ein Programm, was in der Lage ist, mein Vorhaben umzusetzen? Obwohl ich denke, dass mein Vorhaben nicht wirklich weltfremd ist, habe ich leider keine passende Software gefunden. Dass der Adobe PDF-Drucker nicht dafür entwickelt wurde, ist klar, aber es muss doch ein passendes Tool geben...
Für Vorschläge jeglicher Art wäre ich sehr dankbar.
Viele Grüße, und einen schönen letzten Weihnachtstag!
tbnwadm
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 225340
Url: https://administrator.de/contentid/225340
Ausgedruckt am: 24.11.2024 um 16:11 Uhr
17 Kommentare
Neuester Kommentar
Das mit der Breite von einer Homepage ist so ne Sache, weil viele Webmaster ihre Seiten so erstellen, dass sie dynamisch an vielen Bildschirmauflösungen funktionieren. Wenn du die Breite in deinem Programm einstellen kannst, würde ich 1024px nehmen, die meisten Seiten sind darauf optimiert. Vielleicht hilft auch schon A4 Querformat, aber das ist mehr ein Walkaround und keine wirkliche Lösung für dein Problem.
Frohe Weihnachten,
Andy
Frohe Weihnachten,
Andy
Hallo Andy,
ich nutze für solche Fälle SnagIt. Dort habe ich mir ein Profil angelegt welches die ganze Seite captured, die Seite auf die Seitenbreite von A4 skaliert und an den PDF-Drucker sendet. Das ganze geht vollautomatisch, nur die "Druck"-Taste betätigen, in die Seite klicken, fertig.
Grüße Uwe
ich nutze für solche Fälle SnagIt. Dort habe ich mir ein Profil angelegt welches die ganze Seite captured, die Seite auf die Seitenbreite von A4 skaliert und an den PDF-Drucker sendet. Das ganze geht vollautomatisch, nur die "Druck"-Taste betätigen, in die Seite klicken, fertig.
Frohe Weihnachten
EbensoGrüße Uwe
"Print Pages to PDF" ist ein Addon für Firefox - und es sollte genau Deine Wünsche erfüllen. Zumindest erstellt es die PDF's genauso wie sie am Bildschirm angezeigt werden - und es ist noch dazu einfach zu bedienen, so dass ich das sogar einigen meiner User schon installiert habe.
http://pp2pdf.tipido.net/index.php/en/convert_actual_page.html
Probiers aus.
Weihnachtsgruß
Jürgen
http://pp2pdf.tipido.net/index.php/en/convert_actual_page.html
Probiers aus.
Weihnachtsgruß
Jürgen
Zitat von @Festus94:
@ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs.
@ Jürgen: Danke, aber vom FF habe ich mich vor langer Zeit verabschiedet. Ich bin nur noch mit dem IE unterwegs.
kein Kommentar dazu
Außerdem sagst Du "genauso wie sie am Bildschirm angezeigt werden". Dann hätte ich aber links und rechts die
ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?
ganze ungenutzte Fläche, die nicht direkt zur Seite gehört, auch dabei, richtig?
da kann man schon einiges einstellen - aber das hat sich dann ja sowieso für Dich erübrigt
weihnachtliche Grüße
Jürgen
Zitat von @Festus94:
@ Uwe: SnagIt ist aber im Endeffekt nur ein Tools, welches Bildschirminhalte abknipst, oder habe ich das falsch verstanden? Ich
möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet. Außerdem ist der Preis ziemlich happig für dieses
Vorhaben.
Habe das genommen weil ich's sowieso auf meinem Rechner drauf hab. Bei Snagit lässt sich nur der eigentliche Inhalt der Webseite automatisch inklusive Scrolling aufnehmen, dabei bleibt die Webseite so wie sie dargestellt wird, der Rest des Desktop wird selbstverständlich ignoriert. Für den Preis bietet es halt noch wesentlich mehr, aber das muss jeder selber entscheiden. Testversion ziehen und selber eine Meinung bilden @ Uwe: SnagIt ist aber im Endeffekt nur ein Tools, welches Bildschirminhalte abknipst, oder habe ich das falsch verstanden? Ich
möchte ja, dass die PDF hinterher 1:1 die Webseite abbildet. Außerdem ist der Preis ziemlich happig für dieses
Vorhaben.
Grüße Uwe
Du unterliegst dem Irrtum, daß es sowas wie ein default-Ansicht einer Webseite gibt. Die gibt es nicht. weil jeder renderer (oder browser) seine eigene Sicht hat wie eine Webseite auszusehen hat, und das zusätzlich noch abhängigvon der Bildschirmgröße. Jedes Add-on kann das layout auch noch zusätzlich verändern, so daß im Endeffekt die Webseite zig verschiedene Darstellugen hat.
Woher soll ein programm XY nun wissen, welches die für Dich richtige einstellung ist?
Was Du brauchts ist im Prinzip ein programm, daß die Seite genau so rendert, wie sie Dein Browser darstellt udn das dann in ein PDF wandelt. Damit landen wir wieder genau beim Browser: Du brauchst also ein Add-on, daß den Render-Puffer des browsers ausliest und "druckt" oder du nimmst einfach die Druckfunktion Deines Drowsers, wenn Du nich tmirt Screenshots arbeiten willst.
lks
Nein (abhängig von der Webseite natürlich)
oder irre ich da?
Ja
Genau. In der Regel wird ja dann auf die IE-Engine zurückgegriffen, da sie den Programmierern die entsprechenden
Schnittstellen bietet.
Schnittstellen bietet.
Das Problem ist aber, welche Paramter (z.b. Darstellungsbreite) der Engine übergeben werden. Die kann aber durchaus von Deiner Bildschirmdarstellung abweichen.
Gibt es denn eine einfache Möglichkeit, die "Maße" einer Seite auszulesen, ohne den halben Quelltext
auseinanderzunehmen?
auseinanderzunehmen?
Eben nicht, wie ich oben schon erläutert habe.
lks
Zitat von @Festus94:
Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung nicht
mehr verändert.
Es gibt in dem Sinne eine "größte Variante", dass sich die Seite ab einer bestimmten Auflösung nicht
mehr verändert.
Dann kann ich dir eine bauen, die egal wie große Du das Fenster horizontal oder vertikal machst, dieses immer voll uund ganz mit Text ausgefüllt wird.
Klar spätestens dann, wenn der ganze Content in "eine Zeile" paßt, wird da nichts mehr kommen. Das Probem ist aber, daß Du nie weißt, welche Größen der "Webseitenbauer" vorgesehen hat.
Im Endeffekt läuft es darauf hinaus, daß Du der rendering-engine sagen mußt, für welche Auflösung sie rendern soll und dementsprechend sieht es mal gut und mal nicht so gut aus.
Ich persönlich benutze einfach die Druckvorschau von Firefox mit manuell angepaßter Skalierung, wobei 60% bei A4-hoch und 80% bei A4-quer meistens gut passen.
lks
Ihr Lieben!
Ich will die Diskussion nochmal befeueren. Nicht um IE oder FF, sondern um das Thema „Website zu pdf“: Screenshots, also das Sichern von Bildschirminhalten in Pixelgrafiken kommt für meinen Anwendungsbedarf nicht in Frage, da die finalen PDFs durchsuchbar sein sollen, der Text markiert und kopiert werden können soll.
Das von Jürgen vorgeschlagene „Print pages to pdf“ erstellt m.E. niemals das, was auch ich suche. Bei den englischsprachigen Online-Dienstleistern wird es als „one long page“ bezeichnet. Bei den „Print pages to pdf“-Einstellungen wird nicht nur die Breite des Ausgabeformates, sondern immer auch die Länge angegeben ):
Bei pdfmyurl.com und crowdpdf und vielen anderen Online-Dienstleistern sieht das mittlerweile anders aus. Sie bieten in der Bezahlvariante die Option „one long page“ an, also im Prinzip: nicht umsonst (finde ich unproblematisch) und super. Aber: Ich habe 400 Seiten in einer Exceltabelle, die ich gerne als batch von einem Programm oder einem Onlinedienst distillt hätte. Ob man bei Lletzteren eine Liste URLs einspeisen kann, versuche ich gerade herauszufinden. Aber an und für sich kann ich es immernoch nicht glauben, dass das ein derartiger Krampf ist.
Hat inzwischen jmd. eine bessere Lösung ?
PS: Auch eine fast gute Lösung: mit der congenialen Erweiterung "Grab them all" und per txt.-Import hunderte von Websites in jpg oder png ichern lassen (jawoll, mit Sroll und in one long page) und diese dann im Acrobat durch den OCR jagen und als "durchsuchbares Bild (exakt)" abspeichern. Geschätzte 87% der Buchstaben werden richtig erkannt, wegen der restlichen 13% kommt die Methode nicht in Frage, obwohl alle Prozesse als batch ratz-fatz gehen. Cooles Teil: http://rafal.zelazko.info/2008/06/23/easy-screenshot-of-many-sites/
Ich will die Diskussion nochmal befeueren. Nicht um IE oder FF, sondern um das Thema „Website zu pdf“: Screenshots, also das Sichern von Bildschirminhalten in Pixelgrafiken kommt für meinen Anwendungsbedarf nicht in Frage, da die finalen PDFs durchsuchbar sein sollen, der Text markiert und kopiert werden können soll.
Das von Jürgen vorgeschlagene „Print pages to pdf“ erstellt m.E. niemals das, was auch ich suche. Bei den englischsprachigen Online-Dienstleistern wird es als „one long page“ bezeichnet. Bei den „Print pages to pdf“-Einstellungen wird nicht nur die Breite des Ausgabeformates, sondern immer auch die Länge angegeben ):
Bei pdfmyurl.com und crowdpdf und vielen anderen Online-Dienstleistern sieht das mittlerweile anders aus. Sie bieten in der Bezahlvariante die Option „one long page“ an, also im Prinzip: nicht umsonst (finde ich unproblematisch) und super. Aber: Ich habe 400 Seiten in einer Exceltabelle, die ich gerne als batch von einem Programm oder einem Onlinedienst distillt hätte. Ob man bei Lletzteren eine Liste URLs einspeisen kann, versuche ich gerade herauszufinden. Aber an und für sich kann ich es immernoch nicht glauben, dass das ein derartiger Krampf ist.
Hat inzwischen jmd. eine bessere Lösung ?
PS: Auch eine fast gute Lösung: mit der congenialen Erweiterung "Grab them all" und per txt.-Import hunderte von Websites in jpg oder png ichern lassen (jawoll, mit Sroll und in one long page) und diese dann im Acrobat durch den OCR jagen und als "durchsuchbares Bild (exakt)" abspeichern. Geschätzte 87% der Buchstaben werden richtig erkannt, wegen der restlichen 13% kommt die Methode nicht in Frage, obwohl alle Prozesse als batch ratz-fatz gehen. Cooles Teil: http://rafal.zelazko.info/2008/06/23/easy-screenshot-of-many-sites/