Ein PDF ohne Spezialsoftware bearbeiten

Benötige Infos zum Aufbau eines pdf

Hallo

ich suche nach einer Möglichkeit, ohne Spezialsoftware ein pdf zu verändern. Hintergrund ist, dass ich eine pdf - Vorlage mit den Inhalten eines HTML-Formulars bestücken möchte.

Gefunden habe ich dieses:
"Füll die Felder in dem PDF mit Platzhaltern und speicher es als Vorlage. Diese Vorlage kannst du mit z.B. file_get_contents in PHP einlesen und mit str_replace die Platzhalter ersetzen. Wichtig ist dabei nur das die eingesetzten Werte die selbe länge wie die Platzhalter haben. (Platzhalter also relativ lang machen und die Werte mit Leerzeichen auffüllen.)"

Das wär im Grunde genommen die Lösung für mich. Und hab dann das mal umgesetzt. Im Ergebnis wurde leider keine Ersetzung vorgenommen. Ich habe dann die pdf mit einem Hexeditor geöffnet und musste feststellen, dass ich den gesuchten Text nicht finden konnte, es gibt überhaupt keinen Klartext. Dann las ich was von einer Komprimierung, ohne was Genaues dazu.

Wer kann mir was zu den Hintergründen sagen?

Gruß Tom

Content-Key: 1386996838

Url: https://administrator.de/contentid/1386996838

Ausgedruckt am: 19.10.2021 um 14:10 Uhr

Mitglied: beidermachtvongreyscull
beidermachtvongreyscull 14.10.2021 aktualisiert um 08:31:41 Uhr
Goto Top
Mahlzeit!

Ich erzähle Dir mal aus meiner Erfahrung:

PDF-Dateien enthalten als primären Inhalt eigentlich immer mindestens ein Bild oder mehrere.
Darüber kommen Metadaten, wie Textoverlays. Eine nicht durchsuchbare PDF ist eine Bilderdatei in anderem Kuvert.

Lässt man eine Texterkennung darüber laufen, wird bei erkanntem Text ein unsichtbares Textoverlay über das jeweilige Bild gelegt mit entsprechenden Koordinaten, um den Text zu platzieren und speichert den erkannten Text passend ein.

Bei Feldern ist das ähnlich:
Ins Overlay kommen Felddiskriptoren (Feldbeschreiber), die an den entsprechenden Koordinaten ein Feld definieren mit entsprechenden Attributen (Länge, Feldart).

Du kannst, wenn Du mal rudimentär mit PDFs arbeiten willst, die LibreOffice-Suite ausprobieren. Das Pendant zu Microsoft PowerPoint (mir fällt der Name nicht ein), erlaubt meiner Kenntnis nach auch Felder zu setzen. Ob das für Dich geeignet ist, musst Du selbst bewerten.

VG
bdmvg
Mitglied: StefanKittel
StefanKittel 14.10.2021 um 08:39:41 Uhr
Goto Top
Moin,

auch wichtig, die Textfelder bei einem Computererzeugtem PDF und die Bildelemente bei einem gescannten sind nicht in der "richtigen" Reihenfolge in der PDF gespeichert. Man kann also nicht mal alle Textfelder der Reihe rauskopieren um das Originaldokument als Text zu erhalten.

Die Elemente sind natürlich in einer logischen Reihenfolge. Aber nur für Computer.

Stefan
Mitglied: floppy007
floppy007 14.10.2021 um 08:46:17 Uhr
Goto Top
bezüglich deiner Frage habe ich zwar bis jetzt keine Erfahrung gemacht. Versuch mal das PDF in die Word Datei zu konvertieren, per PHP script die Platzhalter bestücken und dann wieder ins PDF.
Mitglied: StefanKittel
StefanKittel 14.10.2021 um 08:51:42 Uhr
Goto Top
Moin,

"Ein PDF ohne Spezialsoftware bearbeiten" klingt ein bischen wir "Wie kann ich einen Uhr mit Mini-Torx-Schrauben mit einem großen Kreuz-Schraubendreher öffnen". Für jeder Arbeit gibt es halt richtige Werkzeuge.

Stefan
Mitglied: StefanKittel
StefanKittel 14.10.2021 um 08:53:26 Uhr
Goto Top
Zu Deiner Frage,

baue das Formular in HTML von Hand nach, füge Deine Infos hinzu und benutzt einen gekauften Dienst, oder investiere Zeit zum fummeln, um daraus ein PDF zu machen.

Du könntest auch Latex dafür verwenden wenn der Server so etwas erlaubt.

Stefan
Mitglied: TomKrist
TomKrist 14.10.2021 um 10:20:14 Uhr
Goto Top
Moin nochmal

ich hab ein Tool (mupdf) gefunden, das dekodiert pdfs.
Was in Adobe so aussieht:
pdf
sieht im Quellcode nach dem Dekodieren so aus:

[(jh)3(g)4(jkg)] TJ
...
[(_)9(_x)-3(x)9(xx)-3(x)9(__)7(9)-3(8)7(9)] TJ

Man findet zwar den Text irgendwie wieder, aber dann diesen Ersetzen mit was anderem, ohne die Syntax zu kennen, ist schwierig. Mein pdf danach war jedenfalls beschädigt :( face-sad

Ich frag mich, wie der von mir zitierte das gemacht hat, oder war das noch in der Steinzeit, als pdf noch einfacher aufgebaut war?

Übrigens, floppy, in Word sieht man auch keinen Klartext, das Ersetzen funktioniert ebenfalls nicht.

Auf alle Fälle danke für Euer Mittun.

Gruß Tom
Mitglied: StefanKittel
Lösung StefanKittel 14.10.2021 um 10:32:02 Uhr
Goto Top
Hallo,

Du kannst auch ein neues "Inhalts"-PDF erstellen und mit dem Formular mergen.
z.B. mit https://www.pdflabs.com/tools/pdftk-server/
Mitglied: TomKrist
TomKrist 15.10.2021 um 07:17:10 Uhr
Goto Top
Moin Stefan,
wird auf "Spezialsoftware" hinauslaufen ;)
Danke für die Tipps :) face-smile

Gruß Tom
Heiß diskutierte Beiträge
question
Windows 11 Upgrade nicht möglichben1300Vor 1 TagFrageWindows 1114 Kommentare

Guten Morgen ! ich habe einen Gaming PC, mit folgende Spezifikationen: Leider kann ich diesen nicht auf Windows 11 upgraden: Welche Optionen bleiben mir, um ...

question
Was ich benötige ist ein guter Wechselrahmen 5,25"Lefty0815Vor 1 TagFrageFestplatten, SSD, Raid8 Kommentare

Hallo an alle, ich such mir noch einen Wolf :-) Was ich benötige ist ein Wechselrahmen 5,25" für eine zwei oder drei 3,5Zoll Festplatten (SATA ...

question
Exchange Server - Wege, anonymes Senden zu verbietenDerWoWussteVor 1 TagFrageExchange Server11 Kommentare

Ich grüße Euch! Ziel 1: Alle PCs sollen Warnmeldungen per E-Mail geskriptet und anonym versenden können. In diesen Skripten handelt das Computerkonto und im Skript ...

question
Neuinstallation NetzwerkBurQueVor 14 StundenFrageNetzwerkgrundlagen13 Kommentare

Hallo ich hab die Aufgabe bekommen ein Netzwerk in einem neuen Gebäude einzurichten bzw. mir dazu Gedanken zu machen. Raumsituation. Im Keller steht ein Serverschrank ...

question
WLAN Lösung für Gästehaus Vereinjohannes-meyerVor 1 TagFrageLAN, WAN, Wireless8 Kommentare

Hallo, ich betreue die IT eines Vereins, der zwei Gebäude mit Gästebetrieb betreibt. Es sind regelmäßig an die 30 bis 50 Geräte verbunden. Ich hab ...

question
SMTP Relay Server gelöst MacLeodVor 1 TagFrageExchange Server10 Kommentare

Hallo zusammen. Vorwort: Habe das hier bei Exchange eingeteilt, betrifft aber Mailserver Versand allgemein. Bei einem Kunden mit einem Kerio Mailserver werden neben dem üblichen ...

question
Multi-WAN-Netzwerk fürs StudentenwohnheimHutzeljaegerVor 8 StundenFrageLAN, WAN, Wireless17 Kommentare

Hallo allerseits. Für die Internetversorgung unseres Studentenwohnheims muss ich nun sehen, dass ich eine kostengünstige Lösung eines Multi-WAN Netzwerks hinbekomme, wohl am besten per Multi-WAN-Bonding. ...

question
Drei Fragen zum Internet Explorer gelöst UserUWVor 1 TagFrageWebbrowser4 Kommentare

1) Der IE lässt sich unter Windows 10 deaktivieren, aber nicht physisch deinstallieren. Heißt das, dass IE-Funktionalitäten "unter der Haube" auch von Windows 10 genutzt ...