103148
Goto Top

PDF Dokument auswerten bzw bearbeiten

Hallo,

wir haben ein PDF Dokument, welches ich auf Einträge prüfen möchte.
Genau gesagt, gibt es einen Eintrag in einer Zeile, wenn nicht muss ein Zähler hochlaufen.

Also jede Zeile prüfen, kein Eintrag, merken und am Ende benötige ich wieviele Zeile da keinen Eintrag haben.
Dieser Wert muss von einer Zahl im Dokument abgezogen werden.

zb links oben steht 189 dann minus der geprüften "nicht Einträge"...

Content-ID: 187515

Url: https://administrator.de/contentid/187515

Ausgedruckt am: 25.11.2024 um 17:11 Uhr

ratzla
ratzla 16.07.2012 um 22:15:12 Uhr
Goto Top
Vorausgesetzt Dein Dokument ist nicht verschlüsselt, kannst Du in erster Stufe dein Dokument mit pdftotext (Bestandteil der XPDF-Utils [Linux!]) in ein Textdokument umwandeln. Dieses kannst Du dann weiter analysieren (z.b. mit grep).
Sicherlich gibt's auch für Win ähnliche Programme.
Notfalls kannst Du mit Libre/OpenOffice das PDF importieren und darin weiterverarbeiten.

Direkt im PDF gehts prinzipiell auch, aber das ist ziemlich hässlich, da im Minimalfall mindestens der Zeichensatz dekodiert werden müsste (meist noch mehr).

Grüße
Ratzla