tomkrist
Goto Top

Ein PDF ohne Spezialsoftware bearbeiten

Benötige Infos zum Aufbau eines pdf

Hallo

ich suche nach einer Möglichkeit, ohne Spezialsoftware ein pdf zu verändern. Hintergrund ist, dass ich eine pdf - Vorlage mit den Inhalten eines HTML-Formulars bestücken möchte.

Gefunden habe ich dieses:
"Füll die Felder in dem PDF mit Platzhaltern und speicher es als Vorlage. Diese Vorlage kannst du mit z.B. file_get_contents in PHP einlesen und mit str_replace die Platzhalter ersetzen. Wichtig ist dabei nur das die eingesetzten Werte die selbe länge wie die Platzhalter haben. (Platzhalter also relativ lang machen und die Werte mit Leerzeichen auffüllen.)"

Das wär im Grunde genommen die Lösung für mich. Und hab dann das mal umgesetzt. Im Ergebnis wurde leider keine Ersetzung vorgenommen. Ich habe dann die pdf mit einem Hexeditor geöffnet und musste feststellen, dass ich den gesuchten Text nicht finden konnte, es gibt überhaupt keinen Klartext. Dann las ich was von einer Komprimierung, ohne was Genaues dazu.

Wer kann mir was zu den Hintergründen sagen?

Gruß Tom

Content-ID: 1386996838

Url: https://administrator.de/contentid/1386996838

Ausgedruckt am: 22.11.2024 um 14:11 Uhr

beidermachtvongreyscull
beidermachtvongreyscull 14.10.2021 aktualisiert um 08:31:41 Uhr
Goto Top
Mahlzeit!

Ich erzähle Dir mal aus meiner Erfahrung:

PDF-Dateien enthalten als primären Inhalt eigentlich immer mindestens ein Bild oder mehrere.
Darüber kommen Metadaten, wie Textoverlays. Eine nicht durchsuchbare PDF ist eine Bilderdatei in anderem Kuvert.

Lässt man eine Texterkennung darüber laufen, wird bei erkanntem Text ein unsichtbares Textoverlay über das jeweilige Bild gelegt mit entsprechenden Koordinaten, um den Text zu platzieren und speichert den erkannten Text passend ein.

Bei Feldern ist das ähnlich:
Ins Overlay kommen Felddiskriptoren (Feldbeschreiber), die an den entsprechenden Koordinaten ein Feld definieren mit entsprechenden Attributen (Länge, Feldart).

Du kannst, wenn Du mal rudimentär mit PDFs arbeiten willst, die LibreOffice-Suite ausprobieren. Das Pendant zu Microsoft PowerPoint (mir fällt der Name nicht ein), erlaubt meiner Kenntnis nach auch Felder zu setzen. Ob das für Dich geeignet ist, musst Du selbst bewerten.

VG
bdmvg
StefanKittel
StefanKittel 14.10.2021 um 08:39:41 Uhr
Goto Top
Moin,

auch wichtig, die Textfelder bei einem Computererzeugtem PDF und die Bildelemente bei einem gescannten sind nicht in der "richtigen" Reihenfolge in der PDF gespeichert. Man kann also nicht mal alle Textfelder der Reihe rauskopieren um das Originaldokument als Text zu erhalten.

Die Elemente sind natürlich in einer logischen Reihenfolge. Aber nur für Computer.

Stefan
floppy007
floppy007 14.10.2021 um 08:46:17 Uhr
Goto Top
bezüglich deiner Frage habe ich zwar bis jetzt keine Erfahrung gemacht. Versuch mal das PDF in die Word Datei zu konvertieren, per PHP script die Platzhalter bestücken und dann wieder ins PDF.
StefanKittel
StefanKittel 14.10.2021 um 08:51:42 Uhr
Goto Top
Moin,

"Ein PDF ohne Spezialsoftware bearbeiten" klingt ein bischen wir "Wie kann ich einen Uhr mit Mini-Torx-Schrauben mit einem großen Kreuz-Schraubendreher öffnen". Für jeder Arbeit gibt es halt richtige Werkzeuge.

Stefan
StefanKittel
StefanKittel 14.10.2021 um 08:53:26 Uhr
Goto Top
Zu Deiner Frage,

baue das Formular in HTML von Hand nach, füge Deine Infos hinzu und benutzt einen gekauften Dienst, oder investiere Zeit zum fummeln, um daraus ein PDF zu machen.

Du könntest auch Latex dafür verwenden wenn der Server so etwas erlaubt.

Stefan
TomKrist
TomKrist 14.10.2021 um 10:20:14 Uhr
Goto Top
Moin nochmal

ich hab ein Tool (mupdf) gefunden, das dekodiert pdfs.
Was in Adobe so aussieht:
pdf
sieht im Quellcode nach dem Dekodieren so aus:

[(jh)3(g)4(jkg)] TJ
...
[(_)9(_x)-3(x)9(xx)-3(x)9(__)7(9)-3(8)7(9)] TJ

Man findet zwar den Text irgendwie wieder, aber dann diesen Ersetzen mit was anderem, ohne die Syntax zu kennen, ist schwierig. Mein pdf danach war jedenfalls beschädigt face-sad

Ich frag mich, wie der von mir zitierte das gemacht hat, oder war das noch in der Steinzeit, als pdf noch einfacher aufgebaut war?

Übrigens, floppy, in Word sieht man auch keinen Klartext, das Ersetzen funktioniert ebenfalls nicht.

Auf alle Fälle danke für Euer Mittun.

Gruß Tom
StefanKittel
Lösung StefanKittel 14.10.2021 um 10:32:02 Uhr
Goto Top
Hallo,

Du kannst auch ein neues "Inhalts"-PDF erstellen und mit dem Formular mergen.
z.B. mit https://www.pdflabs.com/tools/pdftk-server/
TomKrist
TomKrist 15.10.2021 um 07:17:10 Uhr
Goto Top
Moin Stefan,
wird auf "Spezialsoftware" hinauslaufen ;)
Danke für die Tipps face-smile

Gruß Tom