Handschriftenerkennung aus Pdf zum Weiterverarbeiten
Hallo zusammen,
ich habe Prüfberichte die handschriftlich ausgefüllt werden und Digital als Pdf in einen Festplatten-Ordner kommen. Leider müssen die Prüfberichte per Hand den Kunden zugeordnet werden. Was natürlich ein extremer Aufwand ist. Daher suche ich eine Software oder ähnliche Lösungen, die eine definierten Bereich (Kundennummer) aus dem Pdf mit OCR scannt, die Handschrift (nur Zahlen 6- Stellig) umwandelt in Text und die Pfd umbenennt in z. Beispiel Prüfbericht_ErstellungsDatum_Kundennummer.pdf
Vielleicht hat jemand einen Tipp für mich?
ich habe Prüfberichte die handschriftlich ausgefüllt werden und Digital als Pdf in einen Festplatten-Ordner kommen. Leider müssen die Prüfberichte per Hand den Kunden zugeordnet werden. Was natürlich ein extremer Aufwand ist. Daher suche ich eine Software oder ähnliche Lösungen, die eine definierten Bereich (Kundennummer) aus dem Pdf mit OCR scannt, die Handschrift (nur Zahlen 6- Stellig) umwandelt in Text und die Pfd umbenennt in z. Beispiel Prüfbericht_ErstellungsDatum_Kundennummer.pdf
Vielleicht hat jemand einen Tipp für mich?
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 482054
Url: https://administrator.de/forum/handschriftenerkennung-aus-pdf-zum-weiterverarbeiten-482054.html
Ausgedruckt am: 25.12.2024 um 01:12 Uhr
4 Kommentare
Neuester Kommentar
Moin,
wenn das Handgeschriebene Zahlen sind, wird jede OCR-Siftware damut Probleme haben.
Aber prinzipiell läßt sich sowas z.B. mit etwas scripting und gocr lösen.
lks
Hi,
https://de.wikipedia.org/wiki/Tesseract_(Software)
soll eine recht gute Erkennung haben, handschriftlich ist immer schwer.
Grüße
https://de.wikipedia.org/wiki/Tesseract_(Software)
soll eine recht gute Erkennung haben, handschriftlich ist immer schwer.
Grüße
Moin,
mit OCR kommst Du bei Handschriften nicht weit!
Intelligent Character Recognition (ICR) ist hierzu das Schlagwort. Meine Empfehlung ist ganz klar ABBYY! Die bieten m.E. einfach die beste Erkennungsengine.
Wichtig für ICR ist, dass Die Handschrift in Feldern angeordnet wird. Also jede Zahl/Buchstabe quasi in einem Feld/Kasten zu finden ist.
Und zumindest etwas mit Scripting solltest Du dich schon auskennen. Weil Out Of the Box wird es keine Lösung geben. ABBYY bietet ein SDK an, mit dem Du dann Alles mit Deinen Dokumenten machen kannst.
Und das wird auch nicht billig!
Gruß
Dirk
mit OCR kommst Du bei Handschriften nicht weit!
Intelligent Character Recognition (ICR) ist hierzu das Schlagwort. Meine Empfehlung ist ganz klar ABBYY! Die bieten m.E. einfach die beste Erkennungsengine.
Wichtig für ICR ist, dass Die Handschrift in Feldern angeordnet wird. Also jede Zahl/Buchstabe quasi in einem Feld/Kasten zu finden ist.
Und zumindest etwas mit Scripting solltest Du dich schon auskennen. Weil Out Of the Box wird es keine Lösung geben. ABBYY bietet ein SDK an, mit dem Du dann Alles mit Deinen Dokumenten machen kannst.
Und das wird auch nicht billig!
Gruß
Dirk