emheonivek
Goto Top

Mehrere PDF-Dateien Wörtern durchsuchen

Liebe Community,

wir bekommen von einer externen Firma in wiederkehrenden Abständen viele PDF-Dateien in einem Arbeitsordner zur Verfügung gestellt.
Innerhalb dieses Arbeitsordners sollen alle PDF-Dateien mit einer Software-/Texterkennung automatisiert nach bestimmten Wörtern durchsucht werden.
Die PDF-Dateien mit den entsprechenden Treffern sollen anschließend aufgelistet werden, um auch später für Statistikzwecke weiter verwendet zu werden.

Gibt es für solch eine Aufgabe eine fertige Lösung oder muss hier etwas programmiert werden?

Vielen Dank für eure Tipps!

Content-ID: 347939

Url: https://administrator.de/contentid/347939

Ausgedruckt am: 25.11.2024 um 22:11 Uhr

ChriBo
ChriBo 01.09.2017 um 09:56:38 Uhr
Goto Top
Hi,
Vielleicht reicht Agent Ransack, ggf. die größere version: FileLocator pro.
Beides hier: https://mythicsoft.com


CH
Lochkartenstanzer
Lochkartenstanzer 01.09.2017 um 11:02:27 Uhr
Goto Top
Zitat von @Emheonivek:

Innerhalb dieses Arbeitsordners sollen alle PDF-Dateien mit einer Software-/Texterkennung automatisiert nach bestimmten Wörtern durchsucht werden.

Moin,

was für PDFs sind das denn? Normal aus "Word"-Dokumenten erzeugt PDFs oder irgendwelche zu PDF konvertierten Scans? Im ersteren Fall sollte ein durchsuchen mit den üblichen Dateitools kein Problem sein. im letzteren muß erst ein OCR über das PDf geschickt werden.

lks