OCR Erkennung auf Server
Guten Morgen
Bisher habe ich einen HP LaserJet Pro MFP M426fdw. Da es nicht viele Dokumente zum Scannen gibt funktioniert es mit dem Flachbettscanner ganz gut. Der ADF verwende ich eigentlich nie da die Dokumente so oder so immer schräg kommen.
Gerne würde ich in einen Netzwerkordner scannen, und von dort aus automatisch durchsuchbare PDFs erhalten. Da ich bisher immer mit Abbyy FineReader gearbeitet habe, wäre eine Überlegung auf Abbyy FineReader 15 Corporate zu wechseln damit ich die HotFolder funktion hätte. Diese ist wohl in der Standardversion nicht enthalten. So könnte ich FineReader auf einem Server installieren und gut ist.
Ich frage mich aber ob es nicht (preislich logisch teurere) Scanner modelle gibt die eine Server Software bereit stellen mit der ich dies auch erledigen könnte. So bezahle ich zwar mehr als nur für FineReader, hätte aber ggf einen Scanner bei dem ich auch den ADF Einzug verwenden könnte ohne das alles Schräg gescannt ist
Bei den meisten Scannern steht zwar OCR aber nicht ob diese automatisiert erfolgt wenn ich in einen Netzwerkordner scanne wenn nur ein Server läuft.
Vielen Dank schon im Voraus für eure Tipps.
Gruss
Koda
Bisher habe ich einen HP LaserJet Pro MFP M426fdw. Da es nicht viele Dokumente zum Scannen gibt funktioniert es mit dem Flachbettscanner ganz gut. Der ADF verwende ich eigentlich nie da die Dokumente so oder so immer schräg kommen.
Gerne würde ich in einen Netzwerkordner scannen, und von dort aus automatisch durchsuchbare PDFs erhalten. Da ich bisher immer mit Abbyy FineReader gearbeitet habe, wäre eine Überlegung auf Abbyy FineReader 15 Corporate zu wechseln damit ich die HotFolder funktion hätte. Diese ist wohl in der Standardversion nicht enthalten. So könnte ich FineReader auf einem Server installieren und gut ist.
Ich frage mich aber ob es nicht (preislich logisch teurere) Scanner modelle gibt die eine Server Software bereit stellen mit der ich dies auch erledigen könnte. So bezahle ich zwar mehr als nur für FineReader, hätte aber ggf einen Scanner bei dem ich auch den ADF Einzug verwenden könnte ohne das alles Schräg gescannt ist
Bei den meisten Scannern steht zwar OCR aber nicht ob diese automatisiert erfolgt wenn ich in einen Netzwerkordner scanne wenn nur ein Server läuft.
Vielen Dank schon im Voraus für eure Tipps.
Gruss
Koda
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 561648
Url: https://administrator.de/forum/ocr-erkennung-auf-server-561648.html
Ausgedruckt am: 22.12.2024 um 17:12 Uhr
15 Kommentare
Neuester Kommentar
USB Scanner haben immer eine extra Software, aber keine Hotfolder Funktion.
Netzwerkscanner haben die Software bereits integriert, also auch nicht auf dem Server.
Abby wäre auf jeden Fall die richtige Wahl. Omnipage ist auch sehr gut und hat ebenfalls Hotfolder.
Wegen der höchstmöglichen Erkennungsqualität würde ich auch nichts anderes einsetzen wollen.
Netzwerkscanner haben die Software bereits integriert, also auch nicht auf dem Server.
Abby wäre auf jeden Fall die richtige Wahl. Omnipage ist auch sehr gut und hat ebenfalls Hotfolder.
Wegen der höchstmöglichen Erkennungsqualität würde ich auch nichts anderes einsetzen wollen.
Ich selbst verwende Omnipage als Hotfolder (deutlich günstiger). Mein Netzwerkscanner hat zwar auch ein integriertes Windows Embedded mit einer guten Texterkennung, aber ich habe noch einen Multifunktionsdrucker mit grottiger Texterkennung. Deswegen speichere ich alles in den Omnipage Ordner. Omnipage legt es dann in den DMS Ordner ab.
Hi.
Ich habe bei uns eine Freigabe, in die gescannt wird, und von Adobe Acrobat OCR bewacht wird. Da Acrobat kein Hotfolder kann, habe ich das selbst gebaut. Dazu benötigt man ein Plugin wie Autobatch: https://www.evermap.com/autobatch.asp
Ich fand schon immer die Resultate des Acrobat OCR den anderen Softwares (FineReader/Omnipage) weit überlegen, aber da mögen andere verschiedener Meinung sein.
Ich habe bei uns eine Freigabe, in die gescannt wird, und von Adobe Acrobat OCR bewacht wird. Da Acrobat kein Hotfolder kann, habe ich das selbst gebaut. Dazu benötigt man ein Plugin wie Autobatch: https://www.evermap.com/autobatch.asp
Ich fand schon immer die Resultate des Acrobat OCR den anderen Softwares (FineReader/Omnipage) weit überlegen, aber da mögen andere verschiedener Meinung sein.
Bei mit erkennt der Netzwerkscanner die Trennblätter. Omnipage gibt sie weiter wie sie kommen. Wenn ein 20-Seitiges PDF Dokument kommt, ist es danach immer noch ein 20-seitiges PDF. Mein DMS würde auch Trennblätter erkennen, wenn sie der Scanner nicht schon mundgerecht vorgekaut hätte. Spätestens dieser würde dann zwischen den 20 Seiten ein Trennblatt erkennen.
Hallo @koda,
ich habe sowas mithilfe von Tesseract (https://github.com/tesseract-ocr/tesseract) und etwas Code drumrum selber umgesetzt.
Kannst du programmieren?
LG
tomolpi
ich habe sowas mithilfe von Tesseract (https://github.com/tesseract-ocr/tesseract) und etwas Code drumrum selber umgesetzt.
Kannst du programmieren?
LG
tomolpi
Das kommt jetzt wirklich auf die Menge an. Wie werden denn die Dokumente vom Menschen wieder gefunden, wenn mehrere Dokumente in einem Ordner liegen? Die Scanner machen einen universellen Namen+Zeitstempel. Dann weißt Du immer noch nicht, was das ist. Du musst alle Dateien nacheinander anklicken und Dir eine Vorschau anzeigen lassen. Mit File Juggler kannst Du über Regeln umbenennen lassen, aber Du kannst nur nach Stichworten im Inhalt gehen. Dann landet eine Rechnung auch mal wo anders, weil du die Regel nicht fein genug definieren kannst. Und Du bist ständig am korrigieren und Nachtflügen der Regeln.
Dir fehlt scheinbar ein DMS.
Dir fehlt scheinbar ein DMS.
Moin,
ein paar Anmerkungen:
Multifunktionsgeräte mit HW OCR
Logischerweise gibt es keine HW-OCR! OCR wird immer in Software gemacht. Bei Geräten, die eine entsprechende Option vorhanden ist, ist halt eine entsprechende OCR-Software implementiert. Die OCR-Qualität hängt dann eben von der verwendeten Engine ab. Und die Option kostet i.d.R. Geld, da die OCR zumeist optional angeboten wird! Trotzdem kann das durchaus sinnvoll sein. Die Hot-Folder Funktionen sind bei z.B. bei Abbyy oder Omnipage beschränkt (z.B. 5.000 Seiten/Monat!!!). Wenn man also ein entsprechendes Scanvolumen hat, mag es günstiger sein eine OCR bereits auf den Multifunktionsgerät zu machen (wenn es Denn eine gute OCR-Engine gibt!!!).
Man kann per Autohotkey aber auch ein Abbyy Finereader Sprint für die Massenkonvertierung nutzen. Die Sprint-Versionen sind gern mal bei Multifunktionsgeräten dabei ( z.B. bei OKI-Geräten). Hier habe ich dazu mal ein AHK-Script dazu gepostet: Batch OCR gesucht mit Dateifilterfunktionen
Shit-In -> Shit-Out
OCR lebt von der Scanqualität!!! Wer hier mit einem billigen Scanner/Kopierer oder den falschen Einstellungen scannt, darf sich nicht wundern wenn er keine vernünftige OCR-Erkennungsrate herausbekommt! Es macht eben einen riesen Unterschied, ob man nur 99,2 oder 99,8% aller Zeichen richtig erkennt!
Trennblätter.
Ja, kann man machen. Ich würde aber mit Barcode-Aufklebern arbeiten. Zum Einen kann man damit eine Dublettenprüfung bei gescannten Dokumenten vornehmen (Jeden Barcode darf es nur einmal geben). Auch lassen sich damit ziemlich einfach Dokumente zu Buchungen verknüpfen. Wenn z.B. die Buchhaltung beim buchen die Barcodenummer erfasst/scannt, hat man gleiche eine 1zu1 Verbindung von Dokument zu Buchungssatz.
Zur Barcodeerkennung kann man wunderbar die Open Source-Lösung 'zbar' nutzen!
ELO Office
Geiles Tool und absolut unterschätzt! ELO bietet mit der genialen ELO Automation Schnittstelle (vb Script) eine Programmierschnittstelle um (fast) Alles vollautomatisch erledigen zu können! Dann gibt es dann noch den ELO Scan Connector...
Ich habe für meinen alten AG mit einem ELO Office (~300EUR), den Open Source Tools ImageMagick und zbar und etwas vb Script einen vollautomatischen Belegimportierung für das DMS Easy Archiv gebaut. Damit haben wir im Monat mehrere tausend Seiten Papier automatisch verarbeitet (Fertigungsaufträge/Laufkarten/Prüfstandprotokolle/Abliefernachweise).
Allein die notwendigen SW-Lizenzen um das gleiche mit Easy umsetzten zu können hätten rund 8000€ gekostet! Dazu wären dann noch mehrere Tage DL angefallen.
ein paar Anmerkungen:
Multifunktionsgeräte mit HW OCR
Logischerweise gibt es keine HW-OCR! OCR wird immer in Software gemacht. Bei Geräten, die eine entsprechende Option vorhanden ist, ist halt eine entsprechende OCR-Software implementiert. Die OCR-Qualität hängt dann eben von der verwendeten Engine ab. Und die Option kostet i.d.R. Geld, da die OCR zumeist optional angeboten wird! Trotzdem kann das durchaus sinnvoll sein. Die Hot-Folder Funktionen sind bei z.B. bei Abbyy oder Omnipage beschränkt (z.B. 5.000 Seiten/Monat!!!). Wenn man also ein entsprechendes Scanvolumen hat, mag es günstiger sein eine OCR bereits auf den Multifunktionsgerät zu machen (wenn es Denn eine gute OCR-Engine gibt!!!).
Man kann per Autohotkey aber auch ein Abbyy Finereader Sprint für die Massenkonvertierung nutzen. Die Sprint-Versionen sind gern mal bei Multifunktionsgeräten dabei ( z.B. bei OKI-Geräten). Hier habe ich dazu mal ein AHK-Script dazu gepostet: Batch OCR gesucht mit Dateifilterfunktionen
Shit-In -> Shit-Out
OCR lebt von der Scanqualität!!! Wer hier mit einem billigen Scanner/Kopierer oder den falschen Einstellungen scannt, darf sich nicht wundern wenn er keine vernünftige OCR-Erkennungsrate herausbekommt! Es macht eben einen riesen Unterschied, ob man nur 99,2 oder 99,8% aller Zeichen richtig erkennt!
Trennblätter.
Ja, kann man machen. Ich würde aber mit Barcode-Aufklebern arbeiten. Zum Einen kann man damit eine Dublettenprüfung bei gescannten Dokumenten vornehmen (Jeden Barcode darf es nur einmal geben). Auch lassen sich damit ziemlich einfach Dokumente zu Buchungen verknüpfen. Wenn z.B. die Buchhaltung beim buchen die Barcodenummer erfasst/scannt, hat man gleiche eine 1zu1 Verbindung von Dokument zu Buchungssatz.
Zur Barcodeerkennung kann man wunderbar die Open Source-Lösung 'zbar' nutzen!
ELO Office
Geiles Tool und absolut unterschätzt! ELO bietet mit der genialen ELO Automation Schnittstelle (vb Script) eine Programmierschnittstelle um (fast) Alles vollautomatisch erledigen zu können! Dann gibt es dann noch den ELO Scan Connector...
Ich habe für meinen alten AG mit einem ELO Office (~300EUR), den Open Source Tools ImageMagick und zbar und etwas vb Script einen vollautomatischen Belegimportierung für das DMS Easy Archiv gebaut. Damit haben wir im Monat mehrere tausend Seiten Papier automatisch verarbeitet (Fertigungsaufträge/Laufkarten/Prüfstandprotokolle/Abliefernachweise).
Allein die notwendigen SW-Lizenzen um das gleiche mit Easy umsetzten zu können hätten rund 8000€ gekostet! Dazu wären dann noch mehrere Tage DL angefallen.