Reparieren beschädigter PDF Dateien
Guten Morgen!
Gestern habe ich bereits gefragt, wie ich korrupte/beschädigte PDF-Dateien erkennen kann.
Die Lösung mittels der iText API funktioniert wunderbar.
Nun stehe ich vor dem Problem, diese PDF-Dateien zu reparieren!
Die Situation:
Ich bekomme via lokalem Netzwerk oder Internet eine Kopie einer PDF-Datei. Diese PDF-Datei-Kopie wird abgespeichert, um vom Programm aufgerufen werden zu können.
Einige dieser Dateien kommen allerdings korrupt an - es scheint als wäre das Problem zusätzliche bzw überflüssige Leerzeichen.
Mit IcePDF lassen sich besagte Dateien problemlos öffnen - allerdings bevorzuge ich eine einheitliche Lösung vorzugsweise mit dem Acrobat Reader.
Hinweis: Die originale PDF-Datei steht nicht zur Verfügung. Dadurch ist ein Binärvergleich und anschließende Korrektur nicht möglich. Auch eine Bearbeitung der Datei vor dem Kopieren und Versenden ist nicht möglich - fehlererkennende und fehlerkorrigierende Codes, die dies verlangen, wie etwa der Hamming-Code schließen sich also aus.
Mir stellt sich also die folgende Frage:
Cliffs
-ich habe eine korrupte bzw beschädigte pdf-Datei
-mit icepdf lässt sie sich öffnen, mit Acrobat-Reader nicht
-die Datei muss dahingehend repariert werden, dass sie mit dem Acrobat-Reader geöffnet werden kann
lg
JP aka Lonsdaleit
Gestern habe ich bereits gefragt, wie ich korrupte/beschädigte PDF-Dateien erkennen kann.
Die Lösung mittels der iText API funktioniert wunderbar.
Nun stehe ich vor dem Problem, diese PDF-Dateien zu reparieren!
Die Situation:
Ich bekomme via lokalem Netzwerk oder Internet eine Kopie einer PDF-Datei. Diese PDF-Datei-Kopie wird abgespeichert, um vom Programm aufgerufen werden zu können.
Einige dieser Dateien kommen allerdings korrupt an - es scheint als wäre das Problem zusätzliche bzw überflüssige Leerzeichen.
Mit IcePDF lassen sich besagte Dateien problemlos öffnen - allerdings bevorzuge ich eine einheitliche Lösung vorzugsweise mit dem Acrobat Reader.
Hinweis: Die originale PDF-Datei steht nicht zur Verfügung. Dadurch ist ein Binärvergleich und anschließende Korrektur nicht möglich. Auch eine Bearbeitung der Datei vor dem Kopieren und Versenden ist nicht möglich - fehlererkennende und fehlerkorrigierende Codes, die dies verlangen, wie etwa der Hamming-Code schließen sich also aus.
Mir stellt sich also die folgende Frage:
- -kann ich die erkannten Dateien intern mit icepdf (ohne für den User sichtbare Konsole) öffnen, reparieren, abspeichern und anschließend mit dem Acrobat Reader - für den User sichtbar - öffnen?
- -falls nein: gibt es andere (kostenfreie) Optionen diese pdf-Dateien zu reparieren?
Cliffs
-ich habe eine korrupte bzw beschädigte pdf-Datei
-mit icepdf lässt sie sich öffnen, mit Acrobat-Reader nicht
-die Datei muss dahingehend repariert werden, dass sie mit dem Acrobat-Reader geöffnet werden kann
lg
JP aka Lonsdaleit
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 217217
Url: https://administrator.de/contentid/217217
Ausgedruckt am: 14.11.2024 um 21:11 Uhr
21 Kommentare
Neuester Kommentar
Hallo,
von reparieren beschädigter PDF Dateien habe ich keine Ahnung, aber evtl. mit dem PDF-Creator über icepdf die Datei als PDF neu drucken? So erstellst du ja eine komplett neue PDF-Datei. Ich weiß aber nicht, wie es sich dann dort mit Inhaltsverzeichnissen oder Links hat. Glaub nicht, dass die dann noch funktionieren.
von reparieren beschädigter PDF Dateien habe ich keine Ahnung, aber evtl. mit dem PDF-Creator über icepdf die Datei als PDF neu drucken? So erstellst du ja eine komplett neue PDF-Datei. Ich weiß aber nicht, wie es sich dann dort mit Inhaltsverzeichnissen oder Links hat. Glaub nicht, dass die dann noch funktionieren.
Alles, was man anzeigen kann, kann man auch drucken.
Selbst geschütze PDFs kann man drucken.
Somit kann man aus jedem Programm den pdf-creator als Drucker aufrufen und damit ausdrucken.
Das Ergebnis ist wieder eine PDF Datei.
PDF Creator ist sogar scriptbar.
Gruß
Netman
Und Iccepdf ist wohl recht gut dokumentiert: http://www.icesoft.org/java/projects/ICEpdf/documentation.jsf
Selbst geschütze PDFs kann man drucken.
Somit kann man aus jedem Programm den pdf-creator als Drucker aufrufen und damit ausdrucken.
Das Ergebnis ist wieder eine PDF Datei.
PDF Creator ist sogar scriptbar.
Gruß
Netman
Und Iccepdf ist wohl recht gut dokumentiert: http://www.icesoft.org/java/projects/ICEpdf/documentation.jsf
Hi,
Hättest du ein Codebeispiel.
Leider scheint die icepdf-dokumentation etwas spärlich mit Informationen ausgestattet zu sein.
Ich habe also keine Vorstellung, wie ich mir in icepdf aus einer pdf datei eine neue datei erstelle.
Hättest du ein Codebeispiel.
Leider scheint die icepdf-dokumentation etwas spärlich mit Informationen ausgestattet zu sein.
Ich habe also keine Vorstellung, wie ich mir in icepdf aus einer pdf datei eine neue datei erstelle.
Also:
PDF Creator ist ein Programm was nichts mit dem icepdf zu tun hat. --> Wenn du das installierst hast du in deinem PC einen neuen Drucker der sich PDF Creator nennt.
Dann öffnest du deine "defekte" PDF mit dem icepdf und gehst auf drucken. Anstatt deinen Drucker zu Hause oder so auszuwählen wählst du den PDF-Creator. Es öffnet sich ein Fenster indem du nur noch sagen musst: Speichere mir bitte dieses neue PDF in dem und dem Pfad.
Näher kann ich es irgendwie nicht beschreiben
Warum willst du etwas übergeben?
Zum Glück gibt es auf dem PC so etwas wie wysiwyg.
Damit siehst du vorab in ice-pdf ob sich das Drucken lohnt.
GRuß Netman
- Hast du denn schon mal das normale Ausdrucken auf Papier probiert? Bei 10 Seiten wäre das ja nicht so schlimm und ausserdem kanst du weniger Seiten auch manuell auswählen.
- Hast du denn schon das ausdrucken mit dem pdf-creator probiert?
Zum Glück gibt es auf dem PC so etwas wie wysiwyg.
Damit siehst du vorab in ice-pdf ob sich das Drucken lohnt.
GRuß Netman
Gleiches Ergebnis?
Klappt das Drucken auf Papier?
Klappt das Drucken in den pdf-creator, der ja dann ein fertiges pdf erzeugt?
Oder sprichts du die ganze Zeit, wenn du über ice-pdf sprichst über den Konjunktiv?
Das Dokument sollte so aussehen, ist aber in ice-pdf statt 10 nun 6500 Seiten groß.
Dann würde ich ja sagen, dass ice-pdf das Dokument auch nicht öffnen oder bearbeiten kann. Oder du machst einen Textexport und löscht alle doppelten Leerzeichen.
Wenn ja, ist das schon scriptbar.
Klappt das Drucken auf Papier?
Klappt das Drucken in den pdf-creator, der ja dann ein fertiges pdf erzeugt?
Oder sprichts du die ganze Zeit, wenn du über ice-pdf sprichst über den Konjunktiv?
Das Dokument sollte so aussehen, ist aber in ice-pdf statt 10 nun 6500 Seiten groß.
Dann würde ich ja sagen, dass ice-pdf das Dokument auch nicht öffnen oder bearbeiten kann. Oder du machst einen Textexport und löscht alle doppelten Leerzeichen.
Wenn ja, ist das schon scriptbar.
Zitat von @Lonsdaleit:
Klappt das Drucken auf Papier?
Klappt das Drucken in den pdf-creator, der ja dann ein fertiges pdf erzeugt?
Klappt das Drucken auf Papier?
Klappt das Drucken in den pdf-creator, der ja dann ein fertiges pdf erzeugt?
Also: Das Drucken auf Papier hat funktioniert, das Drucken mit dem pdf-creator auch - allerdings war das pdf weiterhin korrupt.
Besser geht es nicht!
Wenn das Drucken klappt und das Drucken in pdf Creator.
Was denkst du denn, was dabei raus kommt?
ein PDF - Dokument
Das kannst du im Adobe Reader anzeigen oder wo auch immer.
Das kann auch gar nicht mehr korrupt sein, da es neu aufgebaut worden ist.
Aber das Urspungsdokument wird natürlich nicht repariert. Du hast ein neues mit dem kompletten Inhalt. Und alles scriptbar.
Gruß Netman
Aber das Ergebnis war: Zerstückelte, falsch angeordnete und teils abgeschnittene, 90° verdrehte (Images) Inhalte. Also
absolut unbrauchbar - bzw. "korrupt".
absolut unbrauchbar - bzw. "korrupt".
Ich glaube du solltest die Verwendung von dem Wort "korrupt" ein wenig einschränken, weil es nicht die Bedeutung hat, wofür du es verwendest.
Wie wurden die ursprünglichen PDFs erzeugt? Evtl. kann sind die Ursprungsdateien nicht "Korrupt" sondern fehlerhaft. (Falsche Bildformate etc. mit dem gewisse Programme nicht arbeiten können.
Und wenn du dich nicht auf das PDF, sondern auf die beteiligten Email-Programme konzentrierst?
Es liegt ja nicht am PDF selbst sondern an der Art des Anhangs.
Wenn also eines der Email-Porgramme oder der Attachment-Vorgang fehlerhaft ist.
Da gibt es ja noch historische Altlasten mit unterschiedlichen Zeichnesätzen und evtl sogar 7/8 Bit Kodierung.
Bist du Sender oder Empfänger des Emails?
Oder läuft das firmenintern über verschiedene Server?
Gruß
Netman
Es liegt ja nicht am PDF selbst sondern an der Art des Anhangs.
Wenn also eines der Email-Porgramme oder der Attachment-Vorgang fehlerhaft ist.
Da gibt es ja noch historische Altlasten mit unterschiedlichen Zeichnesätzen und evtl sogar 7/8 Bit Kodierung.
Bist du Sender oder Empfänger des Emails?
Oder läuft das firmenintern über verschiedene Server?
Gruß
Netman
Das Problem hatte ich auch einmal.
Da wurde ich nach einer Lösung gefragt.
Zwei man mit dem selben Handy im selben Raum und nur einer konnte eine bestimmte Funktion ausführen.
Nach etlichen Nachfragen habe ich mich auch nach der Häufigkeit erkundigt.
Antwort:"Ein Mal vor etwa einem halben Jahr."
Manche Dinge muss man eben wieder vergessen.
Du hast ja keine Chance an die Ursache oder an die Kette zu kommen.
Da wurde ich nach einer Lösung gefragt.
Zwei man mit dem selben Handy im selben Raum und nur einer konnte eine bestimmte Funktion ausführen.
Nach etlichen Nachfragen habe ich mich auch nach der Häufigkeit erkundigt.
Antwort:"Ein Mal vor etwa einem halben Jahr."
Manche Dinge muss man eben wieder vergessen.
Du hast ja keine Chance an die Ursache oder an die Kette zu kommen.
guck mal diese Anleitung:PDF reparieren