PDF Indexierung Anregungen gesucht
Moin miteinander,
ich suche Ideen und Lösungsansätze für folgendes Problem. Ich scanne Schriftstücke / Belege aller Art als PDF/A ein diese sind voll durchsuchbar, das klappt auch wunderbar allerdings wird die Suche mit zunehmender Dateienanzahl im Acrobat Reader über die erweiterte Suche etwas unübersichtlich.
Ich habe schon den Adobe Acrobat getestet, damit lässt sich ein Index aller Dokumente erstellen, ist aber noch nicht optimal und kostet Geld. DocFetcher habe ich auch schon getestet arbeiter aber ähnlich Adobe Reader.
Ich habe mir auch schon diverse Quell offene DMS angesehen aber bei vielen sind die interessanten Features dann doch Lizenzpflichtig.
Ich würde gerne die Dokumente nach dem scannen, wenn in ein DMS dann automatisiert importieren und per OCR Indexieren, damit die Volltext Suche etwas schneller geht.
Welche Ideen habt ihr dazu?
Gruß
ich suche Ideen und Lösungsansätze für folgendes Problem. Ich scanne Schriftstücke / Belege aller Art als PDF/A ein diese sind voll durchsuchbar, das klappt auch wunderbar allerdings wird die Suche mit zunehmender Dateienanzahl im Acrobat Reader über die erweiterte Suche etwas unübersichtlich.
Ich habe schon den Adobe Acrobat getestet, damit lässt sich ein Index aller Dokumente erstellen, ist aber noch nicht optimal und kostet Geld. DocFetcher habe ich auch schon getestet arbeiter aber ähnlich Adobe Reader.
Ich habe mir auch schon diverse Quell offene DMS angesehen aber bei vielen sind die interessanten Features dann doch Lizenzpflichtig.
Ich würde gerne die Dokumente nach dem scannen, wenn in ein DMS dann automatisiert importieren und per OCR Indexieren, damit die Volltext Suche etwas schneller geht.
Welche Ideen habt ihr dazu?
Gruß
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 269025
Url: https://administrator.de/contentid/269025
Ausgedruckt am: 22.11.2024 um 09:11 Uhr
3 Kommentare
Neuester Kommentar
Moin,
Na, wenn es unbedingt für umme sein muss ...
LG, Thomas
ist aber noch nicht optimal und kostet Geld
echt? Da gibt es Leute, die wollen Kohle für Ihre Arbeit?aber bei vielen sind die interessanten Features dann doch Lizenzpflichtig
Noch mehr? Verrückt ...Na, wenn es unbedingt für umme sein muss ...
LG, Thomas
Hallo,
welches OS denn? Unter Windows gibt es die Möglichkeit per iFilter die Volltext Suche auf PDF Dateien auszuweiten. Das ganze geht über einen Index und sollte auch größere Mengen fix durchsuchen...
Ach so, sind eingescannt. Das sind üblicherweise TIFF mit PDF "Rahmen", dann brauchst du tatsächlich OCR um den Text zu extrahieren, aber das brauchst du IMHO sowieso wenn es PDF/A sein soll.
Gruß
Andi
welches OS denn? Unter Windows gibt es die Möglichkeit per iFilter die Volltext Suche auf PDF Dateien auszuweiten. Das ganze geht über einen Index und sollte auch größere Mengen fix durchsuchen...
Ach so, sind eingescannt. Das sind üblicherweise TIFF mit PDF "Rahmen", dann brauchst du tatsächlich OCR um den Text zu extrahieren, aber das brauchst du IMHO sowieso wenn es PDF/A sein soll.
Gruß
Andi