kkduke
Goto Top

Pdf nach inhalt splitten und benennen

hallo,

ich habe eine pdf datei in der sagen wir mal 10000 rechnungen drin sind (gescannt) und ocr-indexiert. die rechnungen sind alle nach dem gleichen schema aufgebaut. es gibt in einem bestimmten bereich das wort "belegnummer" und dahinter ist eine 10stellige zahl.

ziel ist es aus der einen großen pdf viele kleine zu machen. und zwar soll jede rechnung eine pdf datei bekommen und die pdf soll so heissen wie die rechnungsnummer für die entsprechende seite/datei lautet.

kennt jemand eine möglichkeit dies relativ einfach zu realisieren? bin für jeden tip dankbar.

danke und gruss
kai

Content-ID: 244329

Url: https://administrator.de/contentid/244329

Ausgedruckt am: 22.11.2024 um 15:11 Uhr

ko81ro
ko81ro 22.07.2014 um 11:08:47 Uhr
Goto Top
Hallo,

such mal nach pdf split and merge...

Grüße
veneue
kkduke
kkduke 22.07.2014 um 11:09:47 Uhr
Goto Top
das kann meines wissens nicht nach ocr-inhalt eine automatische trennung vornehmen. aber ich prüfe es nochmal.
Webfuchs
Webfuchs 22.07.2014 um 11:16:23 Uhr
Goto Top
Lochkartenstanzer
Lochkartenstanzer 22.07.2014 um 11:36:11 Uhr
Goto Top
Hat jede rechnung gelich viele Seiten oder sind diese unterschiedlich lang?

wenn die alle gleich sind, könnte man die einfgach durch die gängigen Splittools auseinanderdividieren udn dann nochmal OCR drüberjagen.

lks
Nr60730
Nr60730 25.07.2014 um 11:13:59 Uhr
Goto Top
Salü LKS,

Theologisch ist deine Frage doch Jacke wie Hose?

Ich würd da auf jeder seite mittels findstr nach belegnummer suchen und eine Variable setzen - greift das ins leere (weil seite x von y) sollte die Variable noch die Belegnummer der vorherigen Seite verweisen face-wink

Irgendwo hatten wir das doch schonmal mit pdftoolkit gelöst?

Gruß