Ein PDF ohne Spezialsoftware bearbeiten
Benötige Infos zum Aufbau eines pdf
Hallo
ich suche nach einer Möglichkeit, ohne Spezialsoftware ein pdf zu verändern. Hintergrund ist, dass ich eine pdf - Vorlage mit den Inhalten eines HTML-Formulars bestücken möchte.
Gefunden habe ich dieses:
"Füll die Felder in dem PDF mit Platzhaltern und speicher es als Vorlage. Diese Vorlage kannst du mit z.B. file_get_contents in PHP einlesen und mit str_replace die Platzhalter ersetzen. Wichtig ist dabei nur das die eingesetzten Werte die selbe länge wie die Platzhalter haben. (Platzhalter also relativ lang machen und die Werte mit Leerzeichen auffüllen.)"
Das wär im Grunde genommen die Lösung für mich. Und hab dann das mal umgesetzt. Im Ergebnis wurde leider keine Ersetzung vorgenommen. Ich habe dann die pdf mit einem Hexeditor geöffnet und musste feststellen, dass ich den gesuchten Text nicht finden konnte, es gibt überhaupt keinen Klartext. Dann las ich was von einer Komprimierung, ohne was Genaues dazu.
Wer kann mir was zu den Hintergründen sagen?
Gruß Tom
Hallo
ich suche nach einer Möglichkeit, ohne Spezialsoftware ein pdf zu verändern. Hintergrund ist, dass ich eine pdf - Vorlage mit den Inhalten eines HTML-Formulars bestücken möchte.
Gefunden habe ich dieses:
"Füll die Felder in dem PDF mit Platzhaltern und speicher es als Vorlage. Diese Vorlage kannst du mit z.B. file_get_contents in PHP einlesen und mit str_replace die Platzhalter ersetzen. Wichtig ist dabei nur das die eingesetzten Werte die selbe länge wie die Platzhalter haben. (Platzhalter also relativ lang machen und die Werte mit Leerzeichen auffüllen.)"
Das wär im Grunde genommen die Lösung für mich. Und hab dann das mal umgesetzt. Im Ergebnis wurde leider keine Ersetzung vorgenommen. Ich habe dann die pdf mit einem Hexeditor geöffnet und musste feststellen, dass ich den gesuchten Text nicht finden konnte, es gibt überhaupt keinen Klartext. Dann las ich was von einer Komprimierung, ohne was Genaues dazu.
Wer kann mir was zu den Hintergründen sagen?
Gruß Tom
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 1386996838
Url: https://administrator.de/contentid/1386996838
Ausgedruckt am: 22.11.2024 um 14:11 Uhr
8 Kommentare
Neuester Kommentar
Mahlzeit!
Ich erzähle Dir mal aus meiner Erfahrung:
PDF-Dateien enthalten als primären Inhalt eigentlich immer mindestens ein Bild oder mehrere.
Darüber kommen Metadaten, wie Textoverlays. Eine nicht durchsuchbare PDF ist eine Bilderdatei in anderem Kuvert.
Lässt man eine Texterkennung darüber laufen, wird bei erkanntem Text ein unsichtbares Textoverlay über das jeweilige Bild gelegt mit entsprechenden Koordinaten, um den Text zu platzieren und speichert den erkannten Text passend ein.
Bei Feldern ist das ähnlich:
Ins Overlay kommen Felddiskriptoren (Feldbeschreiber), die an den entsprechenden Koordinaten ein Feld definieren mit entsprechenden Attributen (Länge, Feldart).
Du kannst, wenn Du mal rudimentär mit PDFs arbeiten willst, die LibreOffice-Suite ausprobieren. Das Pendant zu Microsoft PowerPoint (mir fällt der Name nicht ein), erlaubt meiner Kenntnis nach auch Felder zu setzen. Ob das für Dich geeignet ist, musst Du selbst bewerten.
VG
bdmvg
Ich erzähle Dir mal aus meiner Erfahrung:
PDF-Dateien enthalten als primären Inhalt eigentlich immer mindestens ein Bild oder mehrere.
Darüber kommen Metadaten, wie Textoverlays. Eine nicht durchsuchbare PDF ist eine Bilderdatei in anderem Kuvert.
Lässt man eine Texterkennung darüber laufen, wird bei erkanntem Text ein unsichtbares Textoverlay über das jeweilige Bild gelegt mit entsprechenden Koordinaten, um den Text zu platzieren und speichert den erkannten Text passend ein.
Bei Feldern ist das ähnlich:
Ins Overlay kommen Felddiskriptoren (Feldbeschreiber), die an den entsprechenden Koordinaten ein Feld definieren mit entsprechenden Attributen (Länge, Feldart).
Du kannst, wenn Du mal rudimentär mit PDFs arbeiten willst, die LibreOffice-Suite ausprobieren. Das Pendant zu Microsoft PowerPoint (mir fällt der Name nicht ein), erlaubt meiner Kenntnis nach auch Felder zu setzen. Ob das für Dich geeignet ist, musst Du selbst bewerten.
VG
bdmvg
Moin,
auch wichtig, die Textfelder bei einem Computererzeugtem PDF und die Bildelemente bei einem gescannten sind nicht in der "richtigen" Reihenfolge in der PDF gespeichert. Man kann also nicht mal alle Textfelder der Reihe rauskopieren um das Originaldokument als Text zu erhalten.
Die Elemente sind natürlich in einer logischen Reihenfolge. Aber nur für Computer.
Stefan
auch wichtig, die Textfelder bei einem Computererzeugtem PDF und die Bildelemente bei einem gescannten sind nicht in der "richtigen" Reihenfolge in der PDF gespeichert. Man kann also nicht mal alle Textfelder der Reihe rauskopieren um das Originaldokument als Text zu erhalten.
Die Elemente sind natürlich in einer logischen Reihenfolge. Aber nur für Computer.
Stefan
Hallo,
Du kannst auch ein neues "Inhalts"-PDF erstellen und mit dem Formular mergen.
z.B. mit https://www.pdflabs.com/tools/pdftk-server/
Du kannst auch ein neues "Inhalts"-PDF erstellen und mit dem Formular mergen.
z.B. mit https://www.pdflabs.com/tools/pdftk-server/