emheonivek
Goto Top

Mehrere PDF-Dateien Wörtern durchsuchen

Liebe Community,

wir bekommen von einer externen Firma in wiederkehrenden Abständen viele PDF-Dateien in einem Arbeitsordner zur Verfügung gestellt.
Innerhalb dieses Arbeitsordners sollen alle PDF-Dateien mit einer Software-/Texterkennung automatisiert nach bestimmten Wörtern durchsucht werden.
Die PDF-Dateien mit den entsprechenden Treffern sollen anschließend aufgelistet werden, um auch später für Statistikzwecke weiter verwendet zu werden.

Gibt es für solch eine Aufgabe eine fertige Lösung oder muss hier etwas programmiert werden?

Vielen Dank für eure Tipps!

Content-Key: 347939

Url: https://administrator.de/contentid/347939

Printed on: April 23, 2024 at 16:04 o'clock

Member: ChriBo
ChriBo Sep 01, 2017 at 07:56:38 (UTC)
Goto Top
Hi,
Vielleicht reicht Agent Ransack, ggf. die größere version: FileLocator pro.
Beides hier: https://mythicsoft.com


CH
Member: Lochkartenstanzer
Lochkartenstanzer Sep 01, 2017 at 09:02:27 (UTC)
Goto Top
Zitat von @Emheonivek:

Innerhalb dieses Arbeitsordners sollen alle PDF-Dateien mit einer Software-/Texterkennung automatisiert nach bestimmten Wörtern durchsucht werden.

Moin,

was für PDFs sind das denn? Normal aus "Word"-Dokumenten erzeugt PDFs oder irgendwelche zu PDF konvertierten Scans? Im ersteren Fall sollte ein durchsuchen mit den üblichen Dateitools kein Problem sein. im letzteren muß erst ein OCR über das PDf geschickt werden.

lks