max-powers-2014
Goto Top

Viele Scanner-PDFs in durchsuchbare OCR-PDFs umwandeln automatisch

Hallo,

ich habe mehr als 1000 PDFs hier in verschiedenen Ordnern die ich durchsuchbar machen will.
Nun könnte ich jede einzelne wählen und durch ein OCR Prog. jagen, das kostet aber zu viel Zeit.

Ich würde gerne etwas haben das das macht: "Nimm dir alle PDFs in C:/ vor und mach durchsuchbare PDFs drauß und überschreibe sie"

Gibt es da etwas? Es muss keine Freeware sein...
Danke.

Content-ID: 257921

Url: https://administrator.de/contentid/257921

Ausgedruckt am: 25.11.2024 um 03:11 Uhr

jhinrichs
jhinrichs 17.12.2014 um 16:05:50 Uhr
Goto Top
Moin,

OmniPage Ultimate kann so etwas.
Die Konkurrenz wahrscheinlich auch.

Viele Grüße
BirdyB
BirdyB 17.12.2014 um 19:32:46 Uhr
Goto Top
Hi,

ich habe soetwas mal unter Linux mit Tesseract-OCR kostenlos bewältigt. Hat ziemlich gut funktioniert...

Gruß!

Berthold
max-powers-2014
max-powers-2014 18.12.2014 um 15:30:19 Uhr
Goto Top
Hallo jhinrichs,

nach einigen Stunden gefühltem download einer 2 GB Datei und konfiguration geht es nun per Ordnerüberwachung, Danke. face-smile

ABER: Das Problem ist das er sich nur die neuen PDFs vornimmt die in den Ordner kommen, nicht die alten.
Da die alten in sehr vielen (über 1000) unterodnern sind kann ich diese leider unmöglich alle rauslöschen und neu einfügen.
kaiand1
kaiand1 19.12.2014 um 05:06:52 Uhr
Goto Top
Dann ein Script schreiben das in den Ordner nach PDFs sucht, diese in den Umwandlungsordner verschiebt, wartet bis Umwandlung erfolgt ist, zurückschiebt und in eine DB vermerkt das die Erledigt ist ??