
126411
03.01.2016
Suche ein Programm um PDF durchsuchbar zu machen ggf. automatisch
Hallo liebe Forum Mitglieder
ich bin auf der suche nach einem Programm was aus einer PDF Datei eine durchsuchbare PDF Datei macht.
Zur Erklärung - ich habe mehrere Ordner wo der Scanner automatisch die gescannten pdf hinterlegt. Leider kann mein Drucker / Scanner kein OCR direkt beim Scan auf das Netzwerk.
als Programm habe ich schon Office N PDF http://www.jbsoftware.de/office-n-pdf/index.htm getest sowie Abbyy PDF transformer + getestet, das klappt super ist aber mit den ganzen Funktionen die ich nicht brauche zu teuer.
Hat jmd von euch eine Idee oder Alternative für mich?
ich bin auf der suche nach einem Programm was aus einer PDF Datei eine durchsuchbare PDF Datei macht.
Zur Erklärung - ich habe mehrere Ordner wo der Scanner automatisch die gescannten pdf hinterlegt. Leider kann mein Drucker / Scanner kein OCR direkt beim Scan auf das Netzwerk.
als Programm habe ich schon Office N PDF http://www.jbsoftware.de/office-n-pdf/index.htm getest sowie Abbyy PDF transformer + getestet, das klappt super ist aber mit den ganzen Funktionen die ich nicht brauche zu teuer.
Hat jmd von euch eine Idee oder Alternative für mich?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 292097
Url: https://administrator.de/forum/suche-ein-programm-um-pdf-durchsuchbar-zu-machen-ggf-automatisch-292097.html
Ausgedruckt am: 09.04.2025 um 00:04 Uhr
9 Kommentare
Neuester Kommentar
Hallo Thomas,
was Deiner Fragestellung vielleicht noch fehlt, ist ob das Dokument nach dem Scan automatisch geöffnet/OCR werden soll.
Für einzelne Dokumente verwende ich persönlich den Xchange Viewer, der kann OCR auch in der Freeware Version und ist deutlich schneller als der Adobe Reader. http://tracker-software.com/product/pdf-xchange-viewer
der Horst
Noch ein Tipp, damit das Scannen einfacher wird. Leider hat die Software bisher kein OCR
http://pdfscanmanager.blogspot.de/
was Deiner Fragestellung vielleicht noch fehlt, ist ob das Dokument nach dem Scan automatisch geöffnet/OCR werden soll.
Für einzelne Dokumente verwende ich persönlich den Xchange Viewer, der kann OCR auch in der Freeware Version und ist deutlich schneller als der Adobe Reader. http://tracker-software.com/product/pdf-xchange-viewer
der Horst
Noch ein Tipp, damit das Scannen einfacher wird. Leider hat die Software bisher kein OCR
http://pdfscanmanager.blogspot.de/
Ich mache das bei uns mit Omnipage Ultimate.
Damit kannst du Ordnerüberwachung und Jobs einrichten. Ich lasse bspw alle gescannten PDFs kurzerhand nach PDF (durchsuchbar), DOC, XLS, RTF und TXT konvertieren. Das geht ratzfatz und jeder Mitarbeiter kann sich das Zielformat raussuchen das er braucht.
Omnipage ist zwar Kaufsoftware aber auch mit sehr kleinem Budget durchaus finanzierbar.
Damit kannst du Ordnerüberwachung und Jobs einrichten. Ich lasse bspw alle gescannten PDFs kurzerhand nach PDF (durchsuchbar), DOC, XLS, RTF und TXT konvertieren. Das geht ratzfatz und jeder Mitarbeiter kann sich das Zielformat raussuchen das er braucht.
Omnipage ist zwar Kaufsoftware aber auch mit sehr kleinem Budget durchaus finanzierbar.
Moin,
z.B. OCRmyPDF
Nachtrag: Ups sehe gerade, daß da schon "über Bande" von Uwe's Artikel darauf verlinkt wurde.
lks
z.B. OCRmyPDF
Nachtrag: Ups sehe gerade, daß da schon "über Bande" von Uwe's Artikel darauf verlinkt wurde.
lks

Zitat von @126411:
Seh ich das richtig - das dieses Tool für Linux ist?
Siehst du richtig. Kleine VM mit überwachtem Ordner und Skript aufgesetzt sollte eigentlich kein Problem darstellen, dafür ist es kostenlos Seh ich das richtig - das dieses Tool für Linux ist?
Zitat von @122990:
. Kost nur eine zwei Zeilen Code mehr nicht.
Zitat von @126411:
Seh ich das richtig - das dieses Tool für Linux ist?
Siehst du richtig. Kleine VM mit überwachtem Ordner und Skript aufgesetzt sollte eigentlich kein Problem darstellen, dafür ist es kostenlos Seh ich das richtig - das dieses Tool für Linux ist?
Es liegt alles im Sourcecode vor udn viele der Komponenten liegen auch als EXE für Windows vor. man köntne also theoretisch das ganze auch bnativ unter Windows in Gang bringen, Notfalls unter zuhilfenahme von cygwin.
lks
Hi Horst.
Ich werde den von Dir genannten freeware-OCR mal über das selbe Dokument jagen, was ich in OpenSource Toolbox für die Texterkennung (OCR) um PDF Dokumente durchsuchbar zu machen mit der open-source-Lösung und mit Acrobat XI getestet habe - bin gespannt und werde es dann in jenem Thread und oder hier bei Zeiten wiedergeben. Die open-source-Lösung war nicht wirklich schön anzusehen, siehe Link.
Ich werde den von Dir genannten freeware-OCR mal über das selbe Dokument jagen, was ich in OpenSource Toolbox für die Texterkennung (OCR) um PDF Dokumente durchsuchbar zu machen mit der open-source-Lösung und mit Acrobat XI getestet habe - bin gespannt und werde es dann in jenem Thread und oder hier bei Zeiten wiedergeben. Die open-source-Lösung war nicht wirklich schön anzusehen, siehe Link.
So, habe es mal getestet. Zum Nachvollziehen beschreibe ich das Vorgehen:
Ich nehme diesen Screenshot und drucke ihn per pdf creator als PDF aus:
Dieses PDF lasse ich dann von Acrobat XI und dann vom kostenlosen pdf-xchange-viewer OCR'n.
Resultat Acrobat:
--
Installation und Einrichtung
Upsman installieren!
Einstellungen am UPS Manager (UPSMAN)
• UPS Manager starten
• Klick auf„AdvancedUs·er" um alle Menüssichtbar zu machen
• UPS-Typ auswählen: „Ml-1500", da unsere nicht unterstützt wird
UPSMAN ~
Device 1 System 1 Ries 1 Mail Server 1 Events 1
Model:
[ Search UPS: 1 1 Ml-1500 • l l senal ·I
Location: AdposMicro-S 1500
--- 7 . Power [VA]: 1500 Hold time [m):
---
Load [VA]: 1500 Recharge time [h): 8
Date of Batteiy Installation [DD.MM.YYYY]: 07.02.2013
Set batteiy health level in '· 10 .
Device:
Port: lcoM1 ·I Baudrate: 12400 ·I
Address: 1 1 Listen Port: 5769
Licencekey: 17MUL4X0234121417 UPS ID: 0
1
Reset to Factoiy Settings
1
1 © 1995-2013 Generex GmbH. Hamburg, Gennany.
'
V 5.&.95
1 Advanced User 1 1 OK 11 Abbrechen
--
Resultat pdf-xchange-viewer
--
lnstallatien und Einrichtung
Uµsman installieren|
Einstellungen am UPS Manager [UPSMAN]
1 UPS Manager starten
1 Klick auf„Advanced User"un'1 alle Menüs sichtbar zu machen
1 UP5›T1y|:i auswählen: „M L-15EIEI", cla unsere nicht unterstützt wird
UP'5MiHil~l E
ÜE"~"i'3E= Iåystem I Files I Mail Senrer I Eirentsl
Madel:
[saafm uPs;] [ML-1s-an 1] [ssf lai 1]
L~==f=f l†i›==f l= sdpssmiaa-s1ssn
F'ciwer ["u'.Pi]: 1511|] Hcilcl time [m]: T ""
Lciacl [`W'i]: 15Ci|] Heeharge time [l'1]: E
Date of Battery Installation [ÜD.lHllvl."i'"'i'"'i'"'i']: i]T"_i]2_2~l]13
Set battery health level in 'li-_ ll] 1
Device:
Pan; [i:ni=.›11 1] saudiats;
Acldress: Listen Part: 5755
I Reset tc« Faciciry Settings I
'iš-" 1555-2Ü13 Genereiiz GmbH. Hamburg. Germany.
'u'5.E.55
I UK 1lf=~±=f==f l~=-MI
--
Fazit: erneut gewinnt der Acrobat deutlich.
Ich nehme diesen Screenshot und drucke ihn per pdf creator als PDF aus:
Dieses PDF lasse ich dann von Acrobat XI und dann vom kostenlosen pdf-xchange-viewer OCR'n.
Resultat Acrobat:
--
Installation und Einrichtung
Upsman installieren!
Einstellungen am UPS Manager (UPSMAN)
• UPS Manager starten
• Klick auf„AdvancedUs·er" um alle Menüssichtbar zu machen
• UPS-Typ auswählen: „Ml-1500", da unsere nicht unterstützt wird
UPSMAN ~
Device 1 System 1 Ries 1 Mail Server 1 Events 1
Model:
[ Search UPS: 1 1 Ml-1500 • l l senal ·I
Location: AdposMicro-S 1500
--- 7 . Power [VA]: 1500 Hold time [m):
---
Load [VA]: 1500 Recharge time [h): 8
Date of Batteiy Installation [DD.MM.YYYY]: 07.02.2013
Set batteiy health level in '· 10 .
Device:
Port: lcoM1 ·I Baudrate: 12400 ·I
Address: 1 1 Listen Port: 5769
Licencekey: 17MUL4X0234121417 UPS ID: 0
1
Reset to Factoiy Settings
1
1 © 1995-2013 Generex GmbH. Hamburg, Gennany.
'
V 5.&.95
1 Advanced User 1 1 OK 11 Abbrechen
--
Resultat pdf-xchange-viewer
--
lnstallatien und Einrichtung
Uµsman installieren|
Einstellungen am UPS Manager [UPSMAN]
1 UPS Manager starten
1 Klick auf„Advanced User"un'1 alle Menüs sichtbar zu machen
1 UP5›T1y|:i auswählen: „M L-15EIEI", cla unsere nicht unterstützt wird
UP'5MiHil~l E
ÜE"~"i'3E= Iåystem I Files I Mail Senrer I Eirentsl
Madel:
[saafm uPs;] [ML-1s-an 1] [ssf lai 1]
L~==f=f l†i›==f l= sdpssmiaa-s1ssn
F'ciwer ["u'.Pi]: 1511|] Hcilcl time [m]: T ""
Lciacl [`W'i]: 15Ci|] Heeharge time [l'1]: E
Date of Battery Installation [ÜD.lHllvl."i'"'i'"'i'"'i']: i]T"_i]2_2~l]13
Set battery health level in 'li-_ ll] 1
Device:
Pan; [i:ni=.›11 1] saudiats;
Acldress: Listen Part: 5755
:i5 |
'iš-" 1555-2Ü13 Genereiiz GmbH. Hamburg. Germany.
'u'5.E.55
I UK 1lf=~±=f==f l~=-MI
--
Fazit: erneut gewinnt der Acrobat deutlich.